15 декабря 2010 г.
В рамках проекта «Сколково» компания ABBYY намерена развивать разработку систем понимания, анализа и перевода текстов на естественных языках.Эти разработки станут платформой для создания ряда прикладных решений, которые, в частности, позволят существенно увеличить объем переводимых текстов, а также повысить качество перевода, поиска и анализа информации.
Задача инновационного центра «Сколково» – стимулировать разработку новых технологий и их коммерциализацию, поддерживать те инновационные идеи, которые будут воплощаться в реальные, актуальные для рынка коммерческие проекты. Для решения этой задачи создан Фонд развития Центра разработки и коммерциализации новых технологий (Фонд «Сколково»), который отбирает наиболее перспективные проекты и осуществляет их поддержку. Один из таких проектов – разработка систем понимания, перевода и анализа текстов на естественных языках – осуществляется компанией ABBYY.
ABBYY – высокотехнологичная российская компания, которая на протяжении многих лет занимается научными исследованиями как в области OCR (оптического распознавания текстов), так и лингвистики. Компания является активным участником международного научного сообщества и членом ведущих профессиональных ассоциаций, среди которых Localization Industry Standards Association (LISA), European Association for Lexicography (Euralex), Translation Automation User Society (TAUS). С 2008 года компания участвует в проекте TAUS Data Association (TDA), работа которого направлена на создание базы данных параллельных переводов и терминологии на всех языках, классифицируемых по различным отраслям экономики. Технологии ABBYY освещаются на научных и отраслевых конференциях, проводимых The Association for Information Management (ASLIB), LISA, Euralex, а также на конференции Translation Management Europe (TM-Europe). В России ABBYY поддерживает крупнейшую конференцию по компьютерной лингвистике и интеллектуальным технологиям «Диалог».
Благодаря исследованиям ABBYY были выпущены и совершенствуются ряд известных на рынке коммерческих решений, например, электронный словарь ABBYY Lingvo, интеллектуальная система распознавания текстов ABBYY FineReader. Результатами исследовательской работы компании станет возможность осуществлять автоматический перевод текстов для множества языковых пар, смысловой поиск текста для корпоративных информационных систем, а также извлечение фактов из неструктурированных текстов.
Технологии, которые разрабатывает ABBYY в рамках проекта «Сколково», направлены на решение двух ключевых задач. Во-первых, они позволят значительно повысить скорость полного цикла перевода, включая редактирование, и увеличить количество переводимых текстов. При постоянно возрастающих объемах информации, необходимости вовлечения все большего количества участников из разных стран в реализацию современных проектов, критически важной становится скорость получения перевода и обмена информацией. Эта задача требует новых, технологических решений и актуальна как для некоммерческих организаций, так и для компаний из различных отраслей экономики.
Вторая задача – создание инновационной технологии анализа и поиска нужной информации из текстов на разных языках. Колоссальный объем информации, который порождает человечество, и международная интеграция между странами определяют новые требования к системам поиска информации и машинному переводу. Обладая уникальными технологиями искусственного интеллекта, российская компания ABBYY уже занимает лидирующие позиции в области распознавания текстов. Под эгидой проекта «Сколково» будут создаваться семантические технологии нового поколения, которые станут основой для формирования решений в области интеллектуального поиска и машинного перевода.
Ядром создаваемой технологии является модель универсальной, не зависящей от языка иерархии понятий. С ее помощью машина может «понять» уже созданные тексты и сделать их качественный перевод или найти и извлечь нужную информацию в большом массиве документов на разных языках.
Данная технология является лингвистической платформой для множества прикладных задач. На её основе инновационные компании смогут создавать качественно новые решения для систем поиска и классификации документов, извлечения фактов и установления связей между объектами мониторинга, систем защиты от несанкционированного использования информации, распознавания речи, а также для всех видов перевода, многоязычного поиска и многих других задач.
На сегодняшний день в проекте участвуют более 300 специалистов, активно привлекаются молодые кадры, студенты кафедры ABBYY в МФТИ и выпускники лингвистических ВУЗов страны. В ближайших планах – привлечение к участию в проекте ведущих мировых специалистов в области языкознания и лингвистики и придание проекту международного статуса.
Источник: Пресс-служба компании ABBYY