2 марта 2022 г.

Георгий Зуев

В 2018 году началась реализация национальной программы «Цифровая экономика РФ». В ней говорится о том, что взаимодействие граждан с органами власти, а также госорганизаций друг с другом должно стать цифровым. Согласно намеченным показателям, каждые 7 из 10 госуслуг должны быть предоставлены в цифровой форме, а 90% документооборота между чиновниками разных ведомств перейдёт в онлайн. Сроки преобразований назначены достаточно жесткие − 2024 год. Чтобы осуществить их, требуется масштабная цифровизация госструктур. Одним из ее ключевых элементов является оцифровка государственных архивов.

Насколько продвинулось исполнение программы в этом аспекте?

Процесс движется неравномерно. На фоне таких пионеров как ФНС масса организаций продолжает работать в «ручном режиме». Это и Федеральная таможенная служба, которая до сих пор имеет дело преимущественно с бумажными накладными, и Российская академия наук, которая является главным хранителем научного наследия нашей страны и давно «трубит» об угрозе его утраты. По разным оценкам государственные архивы РФ в своей совокупности оцифрованы не более чем на 4–6%.

С чем связаны такие невысокие показатели?

Две самых распространенных причины «отставания» — это инерция и отсутствие бюджета. Госструктуры прекрасно понимают значимость проектов по оцифровке, но часто не могут себе их позволить. К ним относятся и региональные, и муниципальные органы, и проектные институты, а также библиотеки. В аналогичном положении находятся многочисленные БТИ: в 2015 году правительство передало все архивы Федерального БТИ в ведение своих региональных подразделений, обязало оцифровать их и перенести в данные Росреестра, но выделять средства на это не стало.

Другие ведомства вполне способны с финансовой точки зрения решить задачу, но делать этого не спешат, предпочитая, как Скарлетт О`Хара, «подумать об этом завтра». Чем меньше количество услуг, которые госструктура оказывает гражданам, тем ниже в списке приоритетных задач опускается оцифровка. Одно дело, когда ты должен предоставлять более 30 сервисов, как МВД, а другое − в 10 раз меньше. Так, например, в Федеральную службу госстатистики за весь 2021 год поступило 18552 обращения от граждан, а в Пенсионном фонде их количество измеряется миллионами. Если нужно обрабатывать сотни и тысячи запросов в день, без модернизации процессов ведомство просто не выживет. Но покуда чиновники худо-бедно справляются с текущими запросами, они откладывают оцифровку на завтра или продвигаются короткими перебежками − по мере высвобождения ресурсов или появления средств.

Худший вариант — когда к действиям принуждают обстоятельства. Так, например, после пожара в библиотеке ИНИОН, в котором погибло более 500 тысяч уникальных книг, научных и исторических материалов, правительство начало подготовку законопроекта об обязательных электронных копиях новых печатных изданий. Сегодня каждый производитель печатных изданий − будь то газета, журнал или книга − должен представлять в контролирующие органы обязательный электронный экземпляр печатной продукции.

К списку барьеров можно прибавить также степень сложности и сохранности документов. Ветхие книги требуют специальной техники и повышенной квалификации специалистов, рукописные тексты плохо поддаются распознаванию при помощи стандартных решений, любые плохо структурированные документы (например, договора купли-продажи жилья) − также серьезно осложняют жизнь их хранителям и повышают стоимость проектов и сроки их реализации. В 2020 году «Биорг» принимала участие в федеральном проекте по оцифровке архивов ЗАГС: этой организации требовалось перевести в онлайн все акты гражданского состояния с 1926 года! Это около 540 млн сведений, большая часть из которых заполнены от руки. Без выделенного бюджета и помощи партнеров этот проект реализовать было бы невозможно.

Практика показывает: чтобы сдвинуть процесс с мертвой точки и изменить ситуацию радикально, нужны либо деньги, либо внешний стимул − распоряжение или новые требования со стороны правительства. А лучше и то, и другое. Государственный бюджет и инициатива сверху − одни из самых надежных рычагов для начала преобразований.

Что может ускорить преодоление «последней мили» в оцифровке архивов?

Один из самых ожидаемых сегодня законов — это закон об электронных архивах. Пока он существует в статусе законопроекта и не внесен в Государственную думу на рассмотрение. Этот законопроект предполагает новый статус электронных документов и придание им юридической силы. Его исполнение будет невозможным без перевода всех ведомственных архивов в электронный вид.

На расширение государственного бюджета может повлиять и недавнее заявление президента РФ, который на встрече с учеными РАН пообещал подумать о том, как ускорить оцифровку. В январе 2022 года на сайте Кремля был опубликован перечень поручений: один из его пунктов касается оцифровки государственных и муниципальных архивов России, в том числе с использованием искусственного интеллекта. Предоставить варианты решения этой задачи исполнители должны к 31 июля 2022 года.

Как может выглядеть самый благоприятный сценарий, по которому будут развиваться события?

Думаю, что ожидания многих связаны со списком приоритетных сегментов и утвержденным порядком их финансирования в зависимости от значимости накопленных данных и их объемов. Будут ли события развиваться именно таким образом, как быстро можно ожидать конкретных шагов и хватит ли на всех желающих государственных денег − вопрос открытый. Думаю, что реалистам все же стоит подумать о том, как найти финансирование, не ожидая плановых дотаций. У организаций, не включенных в федеральные программы, есть возможность получить средства из других источников, например, через различные субсидии или льготное кредитование, которые могут быть получены на цифровую трансформацию ведомства. Электронное преобразование архивов вписывается в KPI региональной власти. В апреле 2021 г. Правительство утвердило обновлённую методику расчёта ключевых показателей эффективности для руководителей органов исполнительной власти, и одним из них является «Цифровая зрелость». Его выполнение может быть достигнуто, в том числе, за счет проектов по созданию электронных архивов.

Тема цифровой трансформации включена также в перечень инициатив социально-экономического развития РФ до 2030 года. Это означает, что в рамках программы «Цифровая экономика РФ» организации и ведомства могут получить льготный кредит на финансирование проектов, связанных с оцифровкой. И, наконец, задача «повышения доступности и качества данных» входит в число приоритетных, по которым намечена реализация федерального проекта «Искусственный интеллект». Для того чтобы претендовать на финансовую помощь государства, нужно внимательно изучить меры поддержки этого проекта и подать заявку в профильное министерство, где обосновать свои цели и значение планируемых преобразований для социально-экономического развития региона. Для подачи заявки на льготное кредитование необходимо также экспертное заключение, которое составляется по итогам аудита и оценки состояния фондов.

Как задействовать искусственный интеллект?

Первым шагом любого проекта по созданию электронных архивов (после аудита, составления сметы и плана работ) является сканирование, а далее начинается извлечение данных из полученных скан-образов − распознавание контента. И вот на этом этапе в работу включаются нейросети и искусственный интеллект. Извлечение смысловой сущности — это процесс, с которым машина справляется быстрее человека. Но не без человека.

Любой архив — это всегда большой объем неструктурированных данных. Одно делать − оцифровать недавно изданную книгу, а другое − схему какой-нибудь конструкции, электрогенератора или уличного фонаря, которая начерчена с помощью карандаша, ватмана и кульмана. К нестандартным также относится различная кадастровая и проектно-сметная документация. С помощью готовых программных решений такие документы обработать сложно, так как точность распознавания смысловых сущностей будет низкой. Даже самые крутые нейросети распознают до 96% полей в документе. Если же текст рукописный, точность может упасть до 20% (причина − неразборчивый почерк, пятна, сгибы, потертости, множество штампов и т. д.). При этом требования к качеству распознавания со стороны государственных заказчиков обычно бывают очень высокими. Так, например, в проекте для ФСИН допустимый уровень брака в массиве графических образов не должен был превышать — 0,2%, то есть 2 образа из 1000. Справиться с такой задачей можно путем применения нейросетей с последующей верификацией полученных результатов с помощью операторов. Люди нужны также для составления наборов данных (датасетов), на основе которых проводится обучение нейросети. Обработка данных силами искусственного интеллекта может проводиться как на собственных серверных мощностях (через внедрение цифровых помощников − ведомственных систем распознавания), так и с помощью внешних облачных сервисов (когда сервис оцифровки предоставляет внешний исполнитель). В любом случае идеальным решением является совмещение нейронной и биологической сети − машины и человека. Вне зависимости друг от друга их работа будет менее эффективной.


Источник: Георгий Зуев, председатель совета директоров «Биорг»