5 февраля 2025 г.
В ИТ происходят серьезные события, которые выглядят как «черные лебеди», и хотя таковыми не являются — прежде всего, из-за своей предсказуемости — своим «внезапным» появлением они существенно меняют ситуацию как в цифровом сегменте, так и в ряде смежных с ним. Если кратко, то в ИТ вернулась динамика, которая, судя по всему, будет проникать и в другие сегменты экономики. События, способные радикально повлиять на крупные сегменты, начинают происходить довольно часто, только за январь таких можно выделить два, один из которых — появление DeepSeek.
Китайская неожиданность
Китайская нейросеть, известная как DeepSeek, о которой мы писали достаточно подробно, и ее мультимодальное расширение Janus-Pro, интересны как своими скромными требованиями к «железу», так и удивительно малыми расходами на разработку самих моделей. Заметим, что при ближайшем рассмотрении все оказалось не совсем ровно (см. врезку), но все равно новый ИИ из Поднебесной получился весьма впечатляющим: современным — «рассуждающим» — быстрым и достаточно эффективным.
Внезапно рынок увидел новые возможности в новом уровне разработке мощных и функциональных ИИ-инструментов, причем затрачивая относительно малые ресурсы как на создание, так и на дальнейшее применение. Это привело к резкому падению капитализации ряда профильных компаний — прежде всего, Nvidia, но она не единственная: просел почти весь Тор 100 в Nasdaq — на астрономическую сумму в 1 трлн долл. Однако возникает вопрос о «внезапности» такого события.
Причина проста: китайские разработчики озаботились эффективностью процессов создания/эксплуатации моделей. Сделано это под воздействием внешних обстоятельств — из-за санкций на новейшие ИИ-чипы, производить которые самостоятельно Поднебесная не может, а наладить «параллельный импорт» таких компонент в нужном количестве проблематично. Фокусировка на новых требованиях достаточно быстро принесла результаты.
Обучение DeepSeek обошлось в 5,6 млн долл., по заявлению создателей нейросети. Однако для достижения результатов, сравнимых с существенно более дорогими решениями, разработчики использовали ряд не всегда приемлемых ухищрений. Например, в новом китайском продукте найдены следы «переиспользования» фрагментов ранее существовавших и более дорогих ИИ-решений, обнаружены незакрытые проблемы с безопасностью (в частности, удалось получить доступ к конфиденциальным данным), и это только часть вопросов к новинке. Но даже при затратах на закрытие этих проблем применяемые китайскими разработчиками методы позволяют снижать стоимость создания/эксплуатации подобных мощных решений в разы.
Стратегические вопросы от локального события
При оценке перспектив развития ИИ-инструментов крупные корпорации ориентировались на экстенсивное развитие как всего направления, так и его требований к нужным вычислительным ресурсам. Ожидаемо, что по мере развития сегмента инженеры находят, создают и внедряют в процесс разработки новые технологии, позволяющие существенно ускорять — и, как следствие, ускорять/удешевлять — создание новых решений. Несмотря на искусственно усиливаемое разделение ИТ-рынка на «национальные сегменты», взаимопроникновение технологий продолжается.
Очевидно, что появление DeepSeek приведет к существенному обновлению финансово-экономических требований к проектируемым нейросетям, создаваемым в разных регионах мира. Сотни тысяч профильных специалистов начнут работать над поиском новых решений для оптимизации/удешевления и, без сомнения, эти решения найдут. Обновление технологий разработки ИИ быстро позволит создавать более эффективные решения, чем уже примененные китайским стартапом. Оставим за скобками вопрос, насколько это классический стартап, а насколько — элемент экосистемы, управляемой на государственном уровне и являющейся частью масштабной инициативы AI Industry Development Action Plan, запущенной КНР в ответ на американский проект Stargate и тоже направленный на достижение глобального технологического лидерства в области ИИ.
Стратегические планы развертывания вычислительных мощностей, которые были сверстаны под старые прогнозы, настоятельно требуют существенного пересмотра под новые реалии. Ситуация усложнена тем, что обновление реалий происходит прямо сейчас, и пока сложно предположить, как именно будет выглядеть изменение требований ИИ к инфраструктуре и инвестициям даже в краткосрочной перспективе.
Вопрос важный, особенно если вспомнить про масштабы происходящего в сегменте ИИ и его влияние на сопредельные области экономики.
Происходящее на рынке ИИ многие — в том числе, Нассим Талеб — уже сравнили с «крахом доткомов», но все не так мрачно и уж точно не столь масштабно. Ряд аналитиков отметили, что волна хайпа в итоге привлечет внимание к компаниям, развивающим ИИ, в том числе, и внимание инвесторов. Акции Nvidia рекомендовали к покупке «на спаде», так как долгосрочные перспективы у компании все равно позитивные.
Что делать с реакторами и другим оборудованием «под ИИ»?
Напомним, что ряд корпораций, активно работающих в направлении ИИ, — от Microsoft и Google до Alibaba и TikTok — планировали создание ряда новых дата-центров на сотни тысяч новых стоек и генерирующих мощностей для обеспечения энергией новых ЦОДов. Очевидно, что под эти мощности уже сверстаны проекты, которые по понятным причинам требуют уникального оборудования — во многих случаях штучного — которое зачастую уже заказано. Как быть с этими контрактами?
Сложности возникают со смежными сегментами, например, с энергетикой. Всего четыре месяца назад корпорация Microsoft заключила соглашение, по которому под новые мощности будет восстановлена работа атомной электростанции «Три-Майл-Айленд», закрытой в 2019 году по экономическим причинам, сообщает «КоммерсантЪ». АЭС планировали запустить к 2028 году, затратив на это 1,6 млрд долл., а в следующие 2 десятилетия корпорация обязалась закупать энергию на
Упомянутый выше проект Stargate не планирует использовать реакторы, во всяком случае, на первой очереди кластеров из дата-центров, которую собираются развернуть в Техасе. Но собственную электростанцию на газотурбинах, комплекс для работы с ВИЭ и энергохранилище (на аккумуляторах) там предусмотрены, а это тоже сложная энергосистема.
Вместо заключения
Ситуация в ИИ-сегменте, вызванная появлением DeepSeek, принципиально не нова. На «черного лебедя» она никак не тянет в силу своей предсказуемости, более того, прекрасно ложится в тренды VUCA-мира («нестабильность, неопределенность, сложность и неоднозначность»), которые новыми тоже не являются — они были сформулированы еще в 1987 году.
Ключевой вопрос: в условиях осознания «новой турбулентности» — появление китайского продукта лишь указало на нее у, но не создало ее! — как прогнозировать стратегическое развитие вычислительных и энергетических мощностей для ИИ-вычислений? Их станет нужно заметно меньше в результате оптимизации математики или потребность в инфраструктуре останется той же, только ресурсы будут обеспечивать работу более сложных моделей, чем считали раньше?
Как вообще быть с планированием в таких условиях, когда масштабность задач требует выработки сложных стратегий, а оперативные изменения — повышенной гибкости? Тут не обойтись «планом Б», который, конечно нужен, но похоже, его придется регулярно пересматривать вместе с основным планом.
Вопросы, аналогичные рассмотренным, встречаются и в российских реалиях. О них поговорим отдельно, пока лишь заметим, что они тоже вызваны масштабными изменениями в ИТ и в сопредельных сегментах экономики.
Источник: Александр Маляревский, внештатный обозреватель IT Channel News