21 июня 2024 г.
Тренд № 3. Развитие мультимодального ИИ
Мультимодальный ИИ — модели ИИ, выполняющие пользовательские операции и обученные на данных из нескольких модальностей (текст, изображения, видео, 3D, речь, звуки, таблицы, графы, код). Мультимодальный ИИ расширяет способы применения больших языковых моделей. Как правило, мультимодальные модели основаны на глубоких нейронных сетях, хотя используются и другие методы машинного обучения, например, скрытые марковские модели или ограниченные машины Больцмана. Унимодальные модели — модели ИИ, которые опираются на один тип данных.
Stanford University: новые мультимодальные системы (GPT-4, Gemini, Claude 3) могут генерировать беглый текст на десятках языков, обрабатывать аудио и даже объяснять мемы.
Мультимодальные модели предлагают универсальный и комплексный подход к решению проблем, значительно превосходящий возможности унимодальных моделей ИИ. Мультимодальные модели находят применение в обслуживании клиентов, мониторинге социальных сетей, здравоохранении, беспилотном транспорте и предиктивной аналитике.
Например, в сфере мониторинга социальных сетей мультимодальный ИИ может анализировать текстовые и графические сообщения и даже видео, чтобы лучше понять и отреагировать на настроение потребителей по отношению к бренду или продукту. Внедрение такого инструмента требует интеграции разрозненных данных, соблюдения технических требований и тщательного планирования.
Эффекты от адаптации
- Улучшение клиентского опыта — 3*
- Операционная эффективность — 2*
- Рост и трансформация бизнеса — 3*
* Максимальная оценка — 4.
Кейсы адаптации тренда в России
- OmniFusion от AIRI — передовая мультимодальная модель ИИ, предназначенная для расширения возможностей традиционных систем обработки языка за счет интеграции дополнительных модальностей данных. Например, изображения, а в перспективе — аудио-, 3D- и видеоконтента.
- Модель GigaChat. Создана Сбером в апреле 2023 года, поддерживает диалог с пользователем, генерирует изображения и разные стили текстов.
- Модель ruDALL-E. Создана Сбером в декабре 2021 года, генерирует оригинальные изображения по заданному описанию.
- Модель Kandinsky 2.1. Создана Сбером при поддержке ученых из AIRI в апреле 2023 года, генерирует изображения на основе текста, смешивает и дорисовывает изображения.
- Модель YandexGPT. Создана Яндексом в мае 2023 года, создает и перерабатывает тексты, предлагает новые идеи и учитывает контекст беседы с пользователем.
- Модель YandexART. Создана Яндексом в апреле 2023 года, генерирует картинки, тексты и видео с помощью нейросети YandexGPT.
Тренд № 4. Применение ИИ в биометрии
Применение искусственного интеллекта в биометрии — биометрия представляет собой технологию, позволяющую значительно усовершенствовать клиентский путь во многих индустриях: финансы, ритейл, транспорт, государственные услуги, обеспечивая при этом высокий уровень безопасности. Современная биометрия базируется на применении технологий искусственного интеллекта, что обеспечивает высокие темпы развития биометрических сервисов.
Transparency Market Research: к концу 2031 года прогнозируется рост объема глобального рынка биометрии на основе технологий ИИ до 50,5 млрд долл.
В России сложились условия для масштабного применения биометрических технологий: было принято соответствующее регулирование, создана национальная цифровая инфраструктура, сформировался запрос у граждан и бизнеса на применение биометрических сервисов в массовых сценариях, например, биоэквайринг, оплата проезда, контроль доступа на объекты и в помещения.
Технологии ИИ обеспечивают возможность применения многофакторных биометрических инструментов, включая анализ физических характеристик человека: внешний облик, особенности голоса и другие, а также поведенческие характеристики. Комплексное применение различных факторов в комбинации с другими небиометрическими инструментами идентификации и аутентификации позволяет обеспечить высокий уровень безопасности.
Большие усилия и ресурсы направляются на развитие методов противодействия атакам на биометрические системы. Современные технологии ИИ также применяются и злоумышленниками. Новым типом угроз стало использование методов класса «Deepfakes», синтезированных с помощью ИИ видео, изображений, звука и других данных, используемых для обмана биометрических систем.
В целом, использование ИИ в биометрии можно отнести к одной из областей, где применение технологий ИИ носит комплексный характер и вызывает мультипликативный эффект. ИИ в биометрии оказывает влияние и вносит вклад в совершенствование качества широкого спектра продуктов и сервисов, предоставляемых гражданам за счет just-in-time предоставления сервисов.
Эффекты от адаптации
- Улучшение клиентского опыта — 4*
- Операционная эффективность — 2*
- Рост и трансформация бизнеса — 2*
- Управление рисками — 3*
* Максимальная оценка — 4.
Кейсы адаптации тренда в России
- МФЦ. Россияне смогут обслуживаться в МФЦ по биометрии уже в 2024 году. Тестирование планируется проводить в Челябинской, Липецкой и Ленинградской областях.
- Метрополитен Москвы. В московском метрополитене биометрические технологии используются совместно с нейросетями, которые преобразуют изображение лица в набор чисел. Системе неважно, какой свет в помещении или есть ли на лице очки. В метрополитене Москвы технологией оплаты проезда по биометрии воспользовались уже более 90 млн раз. К системе подключены более 330 тыс. пользователей. В 2024 году такие технологии в метрополитене планируют внедрять еще в 6 городах России.
- X5 Group и Сбер. X5 Group и Сбер запустили инновационный сервис оплаты с помощью улыбки на 15 тыс. кассах самообслуживания, установленных в 4,1 тыс. магазинах торговых сетей «Пятёрочка» и «Перекрёсток». Время оплаты улыбкой сопоставимо по скорости с обычной транзакцией банковской картой.
Продолжение следует
Источник: Ассоциация ФинТех