30 января 2024 г.
Продолжение. Начало тут
«ИИ-ориентированность» вычислительной системы определяется сегодня в основном наличием в её составе достаточно мощного графического адаптера с обширной видеопамятью, значительно лучше оптимизированного для обсчёта сложных нейросетей, чем связка «ЦП + классическая подсистема ОЗУ». Справляются ли действующие каналы импорта в Россию с обеспечением достаточных (для удовлетворения имеющегося спроса) объёмов таких комплектующих?
Железные основания
Как считает Роман Гоц, генеральный директор DатаРу, нейронную сеть можно обсчитать, обучать и развивать на любом «железе»: «Это не так сложно, как кажется. Существует даже теория обучения сеток с использованием мобильных телефонов, то есть на базе крайне распределенной сети небольших вычислителей. В действительности же колоссальный спрос на GPU Nvidia создаётся руками специалистов по Data-science и Data-архитекторов. Они понимают, что обучение сети за минуту существенно ускоряет внедрение ИИ-инструментов».
В мире же, указывает эксперт, есть и альтернативные практики: «Например, на подобных Nvidia архитектурах — от IPU Graphcore до совсем экзотических вариантов под узкие вычислительные задачи. Но в России, с учётом стандартов и массовости, альтернативы GPU от Nvidia пока не найти. Каналы импорта и производства локальных решений с использованием данных графических ускорителей не справляются со спросом. Чтобы хоть как-то решить проблему, мы рекомендуем заказчикам смотреть в сторону годовых контрактов с российскими поставщиками решений на основе GPU. Так они могут планировать потребность и удовлетворять её в нужные сроки. Ведь помимо глобальных ограничений, с которыми сегодня сталкивается Россия, не стоит забывать про дефицит полупроводников, который актуален для всего мира. А это, в свою очередь, влияет на сроки поставок, — те могут растягиваться до года. Согласитесь, это не лучший вариант, когда компания внедряет ИИ для повышения конкурентоспособности на рынке».
Санкции в целом сильно затруднили поставки вычислительной техники, — об этом напоминает Игорь Солкин, ведущий менеджер по развитию бизнеса iRU: «Дополнительные санкции на графические адаптеры привели к появлению серьёзного дефицита и повышению цен на адаптеры. Тем не менее, определённые объёмы адаптеров всё так же завозятся на территорию РФ».
«Безусловно, есть сложности с поставками графических ускорителей (как пример — флагмана H100), — свидетельствует Максим Терещенко, руководитель департамента управления проектами Delta Computers, — и ожидать, что в ближайшее время они будут доступны тысячами на нашем рынке, не приходится. Однако российские поставщики постепенно находят новые каналы. Что касается использования альтернативных графических ускорителей или компьютерных архитектур для развития ИИ, это ещё только предстоит проверить российским пользователям».
По свидетельству Вадима Лукина, руководителя проектов по разработке «Абак-2000», в России действительно доступны комплектующие для систем искусственного интеллекта, включая графические адаптеры: «Но не стоит забывать о возможных ограничения на импорт, так как некоторые страны могут запретить поставки определённых компонентов. В таком случае можно рассмотреть использование альтернативных компьютерных архитектур, таких как ARM, которые могут обеспечить доступ к необходимым аппаратным средствам».
«С одной стороны, GPU достать можно, — соглашается Сергей Щербаков, руководитель группы Data & Machine Learning ICL Services, — и параллельные каналы импорта справляются, на мой взгляд, неплохо. Но в любом случае монополизм Nvidia на вычисления, связанные с ИИ, никому не нравится. И не только в России, но и в мире. Поэтому любые альтернативные варианты архитектур, ориентированных на ИИ, будут приветствоваться и, опять же, не только в РФ. Поэтому да, возможно, нам надо больше инвестировать в ARM-архитектуру, — но нельзя забывать, что аппаратная архитектура не может быть оторвана от программных средств, иначе она будет мертва. Соответственно, нам придётся идти в тренде с мировой аппаратной разработкой, чтобы и дальше использовать ресурсы мирового open-source community в части разработки ПО для этих альтернативных платформ. Ну, либо готовиться, что кроме суверенной аппаратной разработки, нам надо будет делать не менее суверенную программную разработку, что при нашем дефиците кадров выглядит как совершенно непроходной вариант».
ARM, напоминает Евгений Чуверин, руководитель группы ПО и корпоративных систем департамента маркетинга Merlion, — такая же проприетарная архитектура, как и x86: «Как только на этой платформе сделают что-то эффективное, она тоже может стать подсанкционной».
По мнению же экспертов российского производителя ИТ-оборудования Fplus, аппаратные средства на платформе ARM имеют крайне ограниченное предложение: «Доступность у них в разы хуже доступности серверов с GPU. Не стоит забывать, что для обучения моделей иногда хватает и Midrange-линейки графических ускорителей (если мы не говорим про LLM модель). Также есть суперкомпьютеры, у которых архитектура приложений в принципе не подразумевает использование графических ускорителей. Если же говорить о России, то из-за санкций у нас сейчас есть сложности с импортом мощных графических адаптеров».
Алексей Петров, инженер IT-компании «Арсенал+», отмечает, что — помимо GPU — сейчас уже стали появляться специализированные вычислительные устройства, ориентированные непосредственно на применение в построении нейросетей: «Пока эти устройства достаточно дороги и недостаточно сложны. Должно пройти какое-то время и на рынке должны появиться нейросети, основанные на экономичных, быстрых, и самое главное, на сложных электронных схемах. К этому времени уже должен быть накоплен достаточный багаж алгоритмических решений и математических моделей поведения и решения наиболее важных и распространённых задач. Да, сейчас Nvidia доминирует на рынке благодаря широкому ассортименту вычислительных устройств с массовым параллелизмом вычислений (учитывая, что эти вычисления в основном сводятся к сложению и перемножению операндов) и развитым программным сопровождением своих аппаратных технологий. Но адаптеры Nvidia — это не нейросеть как таковая, а лишь ускоритель для некоторых математических моделей ИИ. Воплотить в кремнии элементы нейросети не так уж сложно, о чём говорит опыт российских разработчиков. Гораздо сложнее разработать реально работающее эффективное ПО. Возможно, потребуются новые подходы к проектированию алгоритмов, языков программирования для ИИ. Дело за математиками, по большому счёту».
Что же касается текущего положения дел, продолжает эксперт, то санкционное давление продолжит возрастать — в том числе и на Китай, да и вообще на любое государство, которое захочет воспользоваться преимуществами ИИ: «Политика сдерживания развития никуда не уйдёт, будет только усиливаться. Сейчас ещё удаётся через параллельные каналы поставлять в страну топовые ускорители Nvidia, но бесконечно этому не дадут продолжаться „недружественные страны“. Необходимо развивать своё направление, создавать свои аппаратные элементы. И, конечно, это никак не связано с архитектурой универсальных процессоров ARM, x86 или каких-то других. Возможно, может пригодиться опыт реализации процессоров со сверхдлинным командным словом (архитектура „Эльбрус“) из-за схожей особенности потоковой обработки данных».
Источник: Максим Белоус, IT Channel News