18 сентября 2023 г.

Вслед за Lenovo, нацелившейся на разработку персональных компьютеров с оптимизацией под решение задач искусственного интеллекта (ИИ), другой глобальный вендор ПК, американская Dell, также рассматривает ИИ-ориентированные системы в качестве стратегического приоритета для себя уже на ближайшую перспективу. Об этом в ходе недавнего выступления перед инвесторами рассказал Джефф Кларк (Jeff Clarke), главный операционный директор компании.

Роботы в помощь

В известном диалоге Платона «Законы» один из участников беседы, Афинянин, так описывает экономику идеального государства: «Ремёсла там поручены чужеземцам; земледелие предоставлено рабам, собирающим с земли жатву достаточную, чтобы люди жили в довольстве».

На нынешнем этапе развития технологий жатва, собираемая умными машинами — результаты работы генеративного ИИ, — явно недостаточна, чтобы обеспечить праздную жизнь в довольстве даже работникам умственного труда вроде программистов, дизайнеров или копирайтеров. Тем не менее, определённый прогресс на этом направлении есть. По оценкам, которые привёл Джефф Кларк, современные системы машинного обучения готовы обеспечить от 15 до 20% прироста производительности труда офисных сотрудников, — и этот скачок сопоставим с тем, что сопровождал в своё время появление на их рабочих местах персональных компьютеров.

Безусловно, на обучение взаимодействию с ИИ, на включение его в привычные рабочие процессы (как когда-то и на освоение ПК) потребуются и время, и усилия. Однако это, уверены топ-менеджеры Dell, произойдёт неизбежно: более того, одним только чат-ботом дело не ограничится. Речь, скорее всего, будет идти о множестве ИИ-помощников (multiple AI copilots), исполняемых на локальном ПК.

И это действительно выглядит разумным прогнозом, поскольку претендующие на универсальность генеративные модели вроде ChatGPT, который уже почти год у всех на слуху, с одной стороны, избыточны для подавляющего большинства офисных задач — а с другой, сами порождают целый ряд вопросов по части сохранности сообщаемых им сотрудниками чувствительных данных. Все заказчики не прочь воспользоваться преимуществами искусственного интеллекта — но мало кто готов доверять ботам, исполняемым где-то там, в облаке, конфиденциальную информацию о своих бизнес-процедурах, проектах и планах.

ChatGPT и подобные ему «умные» боты (Google Bard, Microsoft Bing AI, Claude 2 и пр.) чрезвычайно прожорливы в плавне оперативной памяти, так что запустить их на локальном ПК нереально. Генеративная модель GPT-3, предшественница GPT-3.5, на которой базировалась первая версия ChatGPT, требует для запуска 700 Гбайт памяти, а современная GPT-4 и её прямые аналоги — в разы больше.

Но для повседневной работы в офисе всей мощи подобной универсальной ИИ-модели и не потребуется. В Dell указывают, что значительно полезнее окажутся куда более специализированные модели для исполнения узких задач: транскрибирования речи в режиме реального времени, перевода с одного языка на другой, создания изображений по текстовым описаниям, автомаитзированного поиска через Интернет справочной информации по заданному контексту и т. п. Такого рода ИИ нуждаются уже лишь в единицах Гбайт памяти, а если запускать их параллельно, речь может идти о двух, максимум трёх десятках Гбайт, — что при нынешних откровенно низких оптовых ценах на микросхемы DRAM и в условиях избыточности их производства не так уж обременительно.

Джефф Кларк напомнил, что всякий раз, когда очередной прорыв в области высоких технологий обещал ощутимый рост производительности труда, для мирового ИТ-рынка это оборачивалось новым бурным всплеском активности. И теперь, отметил топ-менеджер Dell, Microsoft активно прорабатывает интеграцию ИИ-технологий в будущие релизы Windows, — так что и со стороны наиболее распространённой ОС поддержка широкого распространения генеративных моделей явно окажется солидной.

ПК для рывка

На платформе Mac, кстати говоря, первые и весьма основательные шаги в этом направлении уже сделаны. К примеру, запускать ИИ для преобразования текстовых подсказок в изображения на x86-компьютере имеет смысл лишь при наличии дискретной видеокарты с немалым объёмом VRAM — желательно, 8 Гбайт и более. Да, модель технически готова исполняться и без графического адаптера, на центральном процессоре и обычной ОЗУ, но генерация картинок в этом случае окажется невыносимо медленной — поскольку шина обмена данными между ЦП и оперативной памятью у х86-систем крайне узка. Новейшие же макбуки на ARM-процессорах M1 и M2, разработанных Apple Silicon, умеют адресовать всю доступную память для работы с ГП, что позволяет переводить текст в изображения на M1 Max лишь примерно втрое медленнее, чем на х86-ПК с мощной дискретной графикой уровня RTX 3080, — результат, недостижимый для обычного ПК без видеокарты.

Вполне вероятно, что не только новые ОС (не только разработки Microsoft и Apple) станут получать в ближайшем времени встроенные средства для оптимизации запуска локальных ИИ-моделей, но и архитектуры ПК — как на базе x86, так и ARM, и RISC — начнут приобретать расширенную аппаратную поддержку такого рода нагрузок. Для соответствующих секторов ИТ-рынка это открывает настоящий Клондайк: компьютер, оптимизированный для решения ИИ-задач, окажется настолько превосходящим нынешние системы по соотношению цена/производительность, что разница выйдет примерно такой же, как в конце 1990-х — между ПК с обычными видеокартами и с графическими ускорителями в новейших на тот момент играх.

Джефф Кларк прямо заявил, что следующее поколение персональных систем будет поставляться уже с НП (нейропроцессорами — neural processing units, NPU), и что вокруг этих платформ образуется целая индустрия по разработке ИИ-помощников, их дообучению на значимых для конкретного заказчика массивах информации, сопровождению, консалтингу и пр.

Для российского ИТ-рынка это тоже крайне значимый сигнал. Понятно, что китайские разработчики ПК не окажутся в стороне от ИИ-революции, да и отечественные проектировщики процессоров (имея, предположим, возможность размещать заказы на ODM-фабриках в КНР) также не станут плестись в хвосте. Тем более, что для ИИ-задач сверхсовременные процессоры, строго говоря, и не нужны: главная операция, проводимая генеративной моделью, — взвешенное суммирование, сводящееся к перемножению и сложению гигантских объёмов чисел.

Нейропроцессорам для успешного и скорого выполнения таких действий нет нужды быть изготовленными по 3-нм нормам, — вполне достаточно будет 7- или даже 14-нм техпроцесса; главное, чтобы простеньких вычислительных ядер было побольше (десятки, а лучше сотни и тысячи, — как в современных ГП), и чтобы доступная этим ядрам напрямую оперативная память исчислялась десятками Гбайт (тоже как у дискретных видеокарт). Такая технологически несложная система сможет производить взвешенное суммирование куда эффективнее самого передового ЦП, — а в производстве обойдётся дешевле.

Так что если «ИИ-ПК» (AI-PC в терминологии Lenovo) как качественно новая аппаратная платформа действительно сделаются мейнстримом в ближайшие несколько лет, это нивелирует значимость технологического отставания КНР в независимом изготовлении СБИС — и действительно придаст совершенно новый импульс развитию сегмента персональных систем. В том числе и в России.


Источник: Максим Белоус, IT Channel News