23 августа 2024 г.

Александр Стрельников

Сегодня у российских вендоров генеративного искусственного интеллекта (ГенИИ) наблюдается определенное отставание от мировых лидеров — не хватает человеческих и вычислительных ресурсов. На преодоление разрыва направлен целый комплекс мер поддержки, которые в сочетании с правильным выбором технологических решений позволяют нашим разработчикам оставаться в тренде.

«Идут работы»

Развитие ИИ находится в фокусе внимания государства с момента появления первых полноценных коммерческих продуктов — еще в 2019 году была принята «Национальная стратегия развития искусственного интеллекта на период до 2030 года». В ней определены приоритетные направления развития ИИ, цели и задачи, а также основные меры поддержки и стимулирования.

Программа «Цифровая экономика Российской Федерации» также включает в себя разделы по ИИ, в том числе создание инфраструктуры и развитие кадрового потенциала для развития технологии, которые суммируются в рамках федерального проекта «Искусственный интеллект».

Совсем недавно появились сообщения, что в него могут войти меры поддержки в виде грантов до 50 млн руб. малым технологическим компаниям и стартапам. Планируется, что они будут предоставляться на разработку новых решений в сфере ИИ и их дальнейшую коммерциализацию.

Также, большой грантовый отбор завершился в июле 2024 года в «Сколково» — там рассматривали претендентов на гранты в размере от 20 до 100 млн рублей для проектов пилотного внедрения ИИ-решений в одной из приоритетных отраслей экономики (промышленность, АПК, строительство, ЖКХ, здравоохранение, транспорт и логистика и т.д.).

Кроме того, в правительстве обсуждается вопрос включения в федеральный проект по ИИ льготного кредитования для создания специализированных мощностей для искусственного интеллекта и предоставления грантов разработчикам на доступ к ним.

Такое внимание к ИИ в целом сообщает особую перспективу развития ее наиболее актуальному формату — Генеративному ИИ (ГенИИ) — как технологии способной создавать оригинальное содержание по аналогии с человеческим творчеством.

Размер: важен, но не критичен

Самый заметный тренд в развитии ГенИИ сегодня — наращивание возможностей больших языковых моделей (LLM) по обработке запросов. В последних релизах Gemini AI (Google) и Claude AI (Anthropic) объем контекстного окна увеличен до огромного размера — около 2 млн токенов (токен — единица ввода данных в модель ИИ). Ранее делались анонсы решений и с большим объемом — до 5 млн токенов.

Противоположный подход исповедует Open AI. Здесь не фокусируются на размерах входного окна, а обеспечивают преимущества ChatGPT через реализацию элементов архитектуры RAG и мультимодальной модели. Так формируется «всеядность» инструмента в отношении форматов данных для решения поставленных задач.

Радикальное увеличение входного окна до миллионов токенов порождает проблему потери информации. Можно загрузить в модель огромный массив, но нет уверенности в том, что он будет целостно воспринят LLM. Алгоритмы еще не обладают достаточным совершенством для того, чтобы полностью гарантировать отсутствие потерь.

Что может повлиять на ГенИИ

Заметное влияние на ускорение развития ГенИИ глобально оказывают разработки в области оборудования. В первую очередь речь идет о новых поколениях процессоров, которые резко увеличат скорость обучения нейросетей.

Изменить правила игры и расстановку сил на рынке способно также появление универсальной структуры мультимодальных систем. С ней возникнет возможность универсализации опенсорсных ГенИИ. Но разработка такой структуры ограничена мощностями, нехваткой разработчиков и недостаточной пользовательской базой.

В целом устремления разработчиков (в первую очередь опенсорсных) нацелены на улучшение качества существующих языковых моделей, нежели на разработку новых мультимодальных возможностей.

Тем не менее, есть направления, по которым работа уже ведется. Это инструментарий ГенИИ, «зашитый» в операционные системы. Такие разработки позволят радикально изменить принцип взаимодействия человека и компьютера: из последовательности отдачи-выполнения команд к однократной постановке задачи.

Такие возможности вполне реализуемы и российскими вендорами, тем более что в стране сегодня активно развиваются оригинальные ОС на базе Linux.

Почему отстаем

Сегодня отставание российских вендоров ГенИИ от мировых лидеров ощутимо, но не так критично. Его можно оценивать примерно в год-полтора. Исключение составляют Open AI ChatGPT и Claude AI (Anthropic), организованный выходцами из OpenAI. Они серьезно оторвались от конкурентов во многом благодаря формированию собственного комьюнити, в которое входят разработчики из ряда стран.

Помогает Open AI и сотрудничество с Microsoft. Благодаря этому Open AI имеет доступ к мощностям облачной платформы Azure, которую используют ряд крупнейших мировых брендов. Это позволяет разработчикам быстрее интегрироваться в их существующий ландшафт.

Таких ресурсов — человеческих и вычислительных — у российских вендоров нет. Также у отечественных вендоров нет такого огромного количества пользователей, следовательно, у отечественных GPT-моделей нет сопоставимых возможностей по тестированию и выявлению ошибок на базе живого взаимодействия. «Лайки» и «дизлайки» используются в ChatGPT не случайно — на их основе проходит обучение.

Однако нехватка ресурсов не означает, что развитие российских сервисов ГенИИ остановится. Они будут наращивать качество работы и возможности, которые предоставляемые пользователям (те же входные окна).

Выходом здесь станет использование open-source LLM-моделей, оптимизированных архитектур (RAG) и упор на узкопрофильные отраслевые чат-боты.

В обозримом будущем

Основное внимание наши разработчики ИИ в ближайшее время могут сосредоточить на развитии систем в области визуализации — генерации изображений и видео. Это станет важным этапом в сокращении отставания от западных компаний.

Область преобразование речи в текст — еще один вектор развития. Здесь у отечественных вендоров «врожденное» преимущество — глубокое понимание особенностей русского языка.

Кроме того, будет активное развитие и расширения пользовательского комьюнити. Об этом говорит тот факт, что вендоры входят в партнерские отношения с НИИ и вузами, которые являются «поставщиками» заинтересованных пользователей.

Для этого сегмента рынка единственным результативным путем развития может стать использование опенсорсной модели развития, которая позволит быстро решать локальные задачи отдельных компаний и одновременно развивать технологическую базу, суммируя разработки в открытых для пользователей системах.

При этом, делая попытки «догнать и перегнать» и объединяя ресурсы для достижения глобального результата, нельзя забывать про локальную конкуренцию, которая стимулирует работу и заставляет разработчиков активнее совершенствовать свои системы.

Источник: Александр Стрельников, эксперт в области ИИ компании Axenix