21 июля 2016 г.
Новая версия PROMT Translation Server, специально разработанная для Федерального института промышленной собственности (ФИПС), включает в себя дополнительные возможности: модуль электронного словаря на основе специализированной словарной базы PROMT и словарей ФИПС, модуль распознавания графических файлов, модифицированную систему аутентификации и целый ряд настроек, позволяющих сделать манипуляции с платформой перевода еще более удобными. Нововведения позволили ФИПС оптимизировать работу патентных экспертов при работе с разноязычной информацией.
Сохранение прав на интеллектуальную собственность как никогда важно в современном мире — это и показатель высокого уровня инновационности экономики, и обеспечение технологической безопасности страны. ФИПС принимает и обрабатывает более 50 тысяч патентных заявок в год, в том числе и международных, которые необходимо проверить на схожесть с уже существующими в других странах, чтобы зарегистрировать инновацию или изобретение. Эксперты ФИПС ведут поиск по более чем 110 млн. документов в мировых базах, и ежедневно каждый специалист должен просматривать большой объем информации на европейских языках, чтобы вынести экспертное заключение. Поэтому система, которая способна выполнить качественный автоматический перевод с нескольких языков, многократно увеличивает эффективность работы всего ведомства и напрямую влияет на скорость рассмотрения заявок.
Основной задачей, стоявшей перед PROMT в этом проекте, было создание многофункциональной масштабируемой платформы перевода для автоматизации процесса перевода текстов и документов графических форматов и запросов в поисковые международные системы. На сегодняшний день платформа обеспечивает мгновенный качественный перевод патентного документа или его фрагмента с английского, немецкого, французского, итальянского и испанского языков на русский язык. В новой версии к переводу текстовых файлов добавлена возможность перевода графических файлов (JPG, PDF), которые часто встречаются в работе экспертов ФИПС. Также программа автоматически переводит с русского языка запрос по ключевым словам от эксперта к поисковой системе PatSearch для возможности поиска релевантной информации в базах патентов на различных языках. В среднем за день на платформу поступает 800 запросов на перевод, что составляет почти 2500 страниц текста или 625 000 слов.
Главной особенностью системы является ее возможность обучаться на новых данных, предоставленных экспертами ФИПС. Терминологические базы данных, которые могут создавать и пополнять эксперты, работающие в системе, позволяют повысить качество перевода патентной информации. Кроме того, эксперты имеют возможность обмениваться базами между собой.
Для обеспечения требуемого качества перевода была внедрена интеллектуальная гибридная технология автоматического перевода, которая делает автоматический перевод более «гладким» и стилистически корректным, но при этом учитывающий специфическую лексику экспертов ведомства. Эта технология является синтезом традиционного перевода на основе грамматического описания естественного языка (RBMT) и автоматического редактирования полученного автоматического перевода с помощью анализа статистических моделей. Модули для статистического постредактирования были построены на базе профессиональных русско-английских переводов, предоставленных ФИПС.
«ФИПС был одной из организаций, которая осознала эффективность развертывания централизованного решения и для нужд конечного пользователя и для встраивания в другие информационные системы организации. Благодаря тому, что ФИПС предоставил большие массивы параллельных данных (оригинальных патентов и их переводов), удалось применить технологию гибридного перевода, доказав ее эффективность для быстрой настройки „под пользователя“ и получения качественного перевода в тех случаях, когда у организации накопилось много документов и их переводов. Такой комплексный подход позволяет, по нашему мнению, извлечь максимальную пользу от применения технологий автоматического перевода», — сообщает Александр Серебряков, руководитель отдела корпоративных решений PROMT.
Платформа перевода используется не только экспертами ФИПС, но и пользователями международного пилотного проекта по программе Patent Prosecution Highway. Эта программа предназначена для того, чтобы зарубежные ведомства в рамках проекта могли работать с российскими полностью англоязычными документами.
«Практика нашего многолетнего сотрудничества с компанией PROMT подтвердила правильность нашего первоначального решения о выборе партнера для решения задач машинного перевода текстов патентных документов. Благодаря высокому качеству перевода PROMT мы даже сейчас, когда широко доступны бесплатные средства машинного перевода, не ставим вопрос об отказе от услуг наших партнеров. Компания всегда оперативно откликалась на наши пожелания, иногда специфические для технологии работы в ФИПС. Это касалось и создания гибридной системы перевода патентных документов, и специальной функциональности по переводу запросов на поиск в англоязычных базах данных, и автоматического подключения словарей с учетом тематики документов. Более 600 экспертов ФИПС активно используют машинный перевод от компании PROMT в своей ежедневной работе», — комментирует результаты очередного этапа работ Денис Виноградов, ВРИО директора ФИПС.
Компания PROMT сотрудничает со структурным подразделением федеральной службы по интеллектуальной собственности уже более 15 лет. За это время отношения, начинавшиеся с покупки десктопных версий продукта PROMT для нужд организации, развились в полномасштабный проект. В качестве базы для платформы перевода ФИПС был взят флагманский продукт компании — PROMT Translation Server, который дорабатывается и дополняется новым функционалом в соответствии с требованиями клиента. В нем можно работать как через пользовательских интерфейс (в том числе через популярные web-браузеры), так и через программный интерфейс, реализованный как кросс-платформенный web-сервис. Отличительной особенностью работы с ФИПС является полная реализация всех возможностей, заложенных в продуктах серии PROMT Translation Server:
- перевод текста;
- перевод документов с сохранением форматирования;
- перевод документов, сохраненных в виде графического образа;
- терминологическая база и поиск по ней;
- настройка качества перевода;
- специальный перевод запросов, учитывающий структуру и правила построения запроса в поисковой системе;
- перевод с использованием пользовательского интерфейса и через API;
- гибкая авторизация (анонимная и персонифицированная).
В планах расширения функциональности — подключение китайского и японского языков к платформе перевода.
Источник: Пресс-служба PROMT