Мечта о полностью "безбумажных" офисах, возможно, не сбудется, но интеграция бумажных документов и информации, хранящейся в цифровой форме, становится все более актуальной. Особенно остро эта проблема стоит перед крупными предприятиями.
Именно этим руководствовалась компания Adobe Systems, выпуская программу Capture 3.0, которая преобразует традиционные документы, так называемые "твердые копии", в файлы формата PDF, что позволяет использовать ПК для поиска документов.
Некоторые компании хранят документы в цифровом виде в растровых форматах, например, в формате TIFF. Но в таких файлах невозможно найти нужную информацию с помощью средств поиска. Другие фирмы, следуя рекомендациям Adobe, преобразуют оцифрованные документы в универсальный формат PDF.
В программе Capture для создания документов используется технология оптического распознавания символов (OCR), что обеспечивает возможность их поиска, сохраняет формат и стиль.
"Capture в Россию поставляется, но спросом не пользуется. Пакет не русифицирован, и планов по его адаптации нет, - сказал Борис Панин, генеральный директор компании "АТРИ-Графика". - Иногда его покупают представительства зарубежных фирм".По мнению Натальи Бриль, маркетингового руководителя проекта FineReader компании ABBYY, функциональные возможности Capture ограниченны. Специалисты считают его не системой распознавания, а скорее конвертором, преобразующим документы из формата JPEG или TIFF в формат PDF.
Несмотря на ограниченные возможности, следует отметить, что Capture 3.0 способна распознавать формат оглавления или таблицы и автоматически устанавливать нужные связи. FineReader таких функций пока не имеет. Правда, по словам г-жи Бриль, не исключена возможность их реализации в следующих версиях FineReader.
Клод Эзран, директор отделения ePaper Solutions компании Adobe, отметил, что ПО для Capture 3.0 было основательно переработано и стало более подходящим для крупных предприятий.
Программа позволяет ускорить обработку документов за счет того, что распределяет работу между несколькими компьютерами. "Один компьютер затрачивает примерно одну минуту на распознавание текста, отпечатанного на шести страницах, -- заметил Шон Конли, старший менеджер Adobe по продуктам. -- Но если подключить две или три рабочие станции, то за минуту можно обработать 12 или 18 страниц".
Кроме того, программа теперь способна распознавать формат оглавления или таблиц и автоматически устанавливать связь между оглавлением и собственно текстом. То же самое программа может делать для таблиц и рисунков в тексте: щелчок мышью на ссылке на таблицу обеспечивает переход к указанной таблице. Руководители Adobe отметили, что раньше такие связи нужно было программировать вручную.
Как отмечает Кристи Холч, глава компании InfoTrends Research, программа Capture не обеспечивает полнофункциональное управление документами, но она преобразует их в форму, совместимую с решениями, предлагаемыми третьими фирмами.
Adobe не претендует на то, чтобы полностью исключить бумажные носители, как это обещали сделать в прошлом некоторые компании. "Мы рассматриваем решения ePaper в качестве строительных блоков для интеграции бумажных документов в системы цифровой обработки, -- подчеркнул Конли. -- Бумажные документы из офисов не исчезнут, сейчас их стало даже больше, чем прежде. Вопрос не в том, чтобы бороться с бумагой, а в том, чтобы работать с такими документами эффективнее и совмещать работу с ними с работой с оцифрованными материалами".
Программа будет выпускаться в двух версиях. Версия для кластерных систем, способная работать на многопроцессорных системах, уже поступила в продажу. Ее цена -- 7 тыс. долл. на один процессор. Ограничений на количество создаваемых страниц формата PDF нет. Версия для персональных ПК будет стоить 699 долл. Она позволит создать на одном компьютере до 20 тыс. PDF-страниц.