7 марта 2019 г.

Виталий Астраханцев

Или в чем разница подходов разработчиков бизнес-приложений для работы с документами, производителей ПО для сканирования и производителей оборудования?

Оглянемся назад

Еще порядка 10 лет назад вся работа по сканированию документов и их занесению в системы электронного документооборота лежала на плечах делопроизводителей — сотрудников канцелярии. Потоковые сканеры только-только вводились в эксплуатацию, а использование штрихкодов для формирования комплектов казалось фантастикой.

Операция занесения в СЭД документов представляла собой ресурсоемкий, медленный процесс, которым изо дня в день приходилось заниматься сотрудникам канцелярии. Производители сканеров поставляли в комплекте к оборудованию ПО, обеспечивающее минимальный необходимый набор опций операции сканирования (цвет, контрастность, яркость). Программы распознавания текстов находились еще в зачаточном состоянии и не были пригодны для промышленного использования. В целом, процесс обработки документов в электронном виде по времени не сильно отличался от ручного, а иногда и уступал ему.

С каждым годом производители оборудования и ПО старались упрощать работу делопроизводителей, предлагая все более современные инструменты. Активно стали использоваться потоковые сканеры и наклеивание штрихкодов на документы. Производители оборудования стали предлагать софт для создания комплектов документов и их обработки после сканирования. Автоматизированный процесс стал прозрачнее и быстрее для его участников.

Что происходит прямо сейчас

С ростом возможностей ПО и оборудования стали расти и запросы пользователей. Сейчас просто «удобным» сканированием документов и привязкой их по штрихкоду к карточке в СЭД сложно удивить пользователей.

Производители СЭД стали двигаться в сторону создания расширений для удобного захвата документов со сканера, в том числе за счет интеграции со специализированным ПО сторонних производителей. Производители сканеров в свою очередь стали расширять возможности собственных утилит и встраивать в них возможности классификации и распознавания документов.

Таким образом, задача сканирования и занесения в СЭД документов стала перекрываться с двух сторон. Мне это напоминает борьбу между КПК и сотовыми телефонами, которая около 10 лет назад дала нам с вами смартфоны. Давайте попробуем разобраться, у кого в этой борьбе больше шансов на «победу».

Что предлагают производители оборудования?

Авторизация по смарт-карте сотрудника

Сохранение безопасности данных на предприятиях — одна из важнейших задач. Утечка информации может грозить серьезными последствиями для деятельности всего предприятия. Использование смарт-карт сотрудников для авторизации на сканере решает задачу контроля утечки данных. Кроме этого, такой подход позволяет направить отсканированные документы в целевую папку конкретного пользователя.

Извлечение реквизитов

Извлечение реквизитов структурированных документов методом разметки шаблонов (выделение в структурированной форме документа областей, в которых должны содержаться необходимые реквизиты) — задача, реализованная достаточно давно. В ряде бизнес-кейсов такой подход весьма эффективен для решения поставленных задач. Однако комплексный подход, при котором вид документов не имеет значения, подразумевает больше, чем такая последовательность. Например, для обработки неструктурированных документов, например, входящих писем или актов выполненных работ, невозможно разметить шаблон — все контрагенты используются свою форму документа. Только полная обработка текста документа, анализ ключевых слов и зависимостей между ними могут обеспечить достойное качество извлечения реквизитов.

Классификация документа

На данный момент существует несколько подходов к классификации документов, но все они требуют обучения моделей классификации на примерах существующих документов. Использовать какой-либо универсальный классификатор видов документов в данном кейсе значит согласиться с низкими показателями правильности определения вида документа. Только обучение на примерах документов каждого конкретного заказчика способно обеспечить высокие показатели правильной классификации. Документы не хранятся в утилитах для сканирования, и значит это ограничивает их возможности производить классификацию, хотя некоторые вендоры заявляют о наличии такой функциональности.

Аутсорсинг печати

Решение позволяет сократить затраты предприятия на поддержку инфраструктуры печати. Многие вендоры оборудования называют поставляемое с данной услугой ПО MDS (Managed Document Service), т.е. система управления документооборотом. По сути, данное ПО не является ECM-системой, а всего лишь обеспечивает перенаправление документов ответственным пользователям внутри сети предприятия, но в связи со схожестью терминологии вводит в заблуждение многих заказчиков. Например, если МФУ производит сканирование после авторизации сотрудника по пропуску, то отсканированные в текущей сессии документы будут отправлены сотруднику, производящему сканирование. В полноценной системе электронного документооборота есть возможности реализовать любые бизнес-процессы компании, связанные с обработкой входящих, исходящих и внутренних документов, что в MPS системах не предусмотрено.

Решения от вендоров СЭД

Автоматическая классификация, извлечение реквизитов документа и занесение в СЭД

Задачей вендора СЭД является полная диджитализация процессов, связанных с обработкой документов на предприятии. Например, простой автоматизации процесса регистрации и обработки входящей корреспонденции уже недостаточно. Бизнесу требуется инструмент, который будет подготавливать проекты резолюций или автоматически определять ответственных исполнителей, чтобы облегчить работу руководителя. Поэтому крупные вендоры, которые заботятся об интересах своих клиентов, стараются сделать процесс обработки документов максимально простым и минимизировать рутинные операции с участием человека.

Некоторым приходится встраивать в процесс распознавания и регистрации документов промежуточный слой стороннего софта. Но есть и те, кто полностью выстраивает процесс внутри единой экосистемы ECM с момента захвата документа со сканера или электронной почты до автоматического заполнения реквизитов документа и отправки его на согласование.

Так как СЭД предполагает работу с большим числом разнообразных документов, то сервисам, отвечающим за классификацию документов и извлечение реквизитов, есть на чем обучиться, чтобы показывать высокий % распознавания. Например, на проекте внедрения интеллектуальной обработки в «Объединенной двигателестроительной корпорации» удалось добиться точности классификации 86-96% по виду документа, делу и журналу регистрации.

Такой комплексный подход является наиболее оправданным, так как позволяет реализовывать процесс именно так, как это необходимо клиенту в бизнес-задаче, без дополнительных интерфейсов и кликов, и без рисков зависимости от производителей промежуточного ПО.

Автоматическое определение ответственного

Любой документ можно классифицировать не только по виду, но и обширному набору других реквизитов: контрагент, сумма, номенклатура и т.д. Анализируя реквизиты в комплексе, можно автоматически определять пользователя, ответственного за обработку документа, даже не имея информации о том, кто произвел сканирование документа. Это позволит сократить время на пересылку электронного документа от одного пользователя к другому и ускорить процесс обработки/согласования/рассмотрения документа.

Безбумажный документооборот

Все решения, которые основаны на распознавании сканов документов, станут неактуальны, как только на законодательном уровне можно будет полностью отказаться от перемещения бумажных документов как внутри организации, так и между организациями.

Уже сейчас активно используются такие сервисы обмена юридически значимым документами, как Synerdocs, Диадок, СБИС. Ограничение на перевод в электронный вид накладывает лишь отсутствие законодательной поддержки и окончательного придания юридической значимости всем видам официальных документов. Уже сейчас запущен эксперимент Министерства труда по безбумажному кадровому документообороту. Хочется надеяться, что и другие виды электронных документов будут юридически признаны в ближайшее время.

Куда мы идем?

Исходя из всего вышеперечисленного, хочется отметить, что путей развития офисного ПО для сканирования и систем электронного документооборота сейчас множество. Но по-настоящему прорывным станет то решение, которое сможет обеспечить пользователям концентрацию на выполнении основных рабочих задач без отвлечений на рутинные операции, связанные с бумажными и электронными документами. Реализация новых, интеллектуальных сервисов, позволит свести к минимуму и полностью отказаться от заполнения карточек документов и, возможно, реализовать Zero UI для пользователей корпоративных систем.

Источник: Виталий Астраханцев, руководитель проектов развития бизнеса компании DIRECTUM