7 ноября 2024 г.
Интерес к коммерческому (а не только для допросов «умного» бота с пристрастием, чей Тайвань, или для рисования с его же помощью милых котиков в смешных шляпах) применению генеративного искусственного интеллекта в России велик, — вот только аппаратных мощностей для активного его развития по объективным причинам пока маловато. Впрочем, нет сомнений, что скорее рано, чем поздно эта преграда на пути самого широкого внедрения ИИ в бизнес-процессы если не исчезнет полностью, то станет куда более проницаемой, чем сегодня. И вот тогда сдерживать экспансию генеративных моделей будут уже другие факторы — те, с которыми сталкиваются сегодня их коммерческие пользователи в тех регионах, поставки передовых ИИ-ускорителей в которые не ограничивает вездесущий Минторг США.
Один из важнейших ограничительных факторов такого рода — нехватка данных для тренировки ещё более крупных и мощных, чем применяемые сегодня, генеративных моделей. Согласно оценке CB Insights, уже к 2026 г. общий объём доступных для обучения новых моделей открытых естественных данных (оцифрованных людьми либо созданных самим же человеком в цифровом виде — от фото и видео живой природы до художественных произведений и научных работ) окажется в целом исчерпан. Соответственно, придётся обращаться либо к защищённой авторским правом информации — а это дополнительные затраты, перекладываемые в конечном итоге на клиента, — либо к синтетическим, сгенерированным ИИ предыдущих поколений, что грозит учащением случаев галлюцинирования новых моделей.
Следующий по значимости фактор — энергетический. Пока генеративный искусственный интеллект опирается на ставшие привычными за десятилетия развития ИТ-отрасли полупроводниковые микросхемы, он обречён расходовать электричество в поистине гаргантюанских масштабах: согласно подсчётам Международного энергетического агентства (IEA), в 2022 г. суммарное потребление дата-центров в мире достигало 460 ТВт·ч, а к
Помимо электричества, ЦОДы нуждаются в значительных объёмах воды для работы систем охлаждения, и это уже сегодня начинает становиться проблемой. Скажем, Microsoft отчиталась в 2023 г. об использовании свыше 7,8 млн м³ воды, — ушедшей в основном как раз на обеспечение работы её дата-центров (где в облаке Azure исполняются многие популярные генеративные ИИ-модели, включая и GPT). Уже одна модель GPT-3 (набравший осенью 2022 г. бот ChatGPT использовал на первых порах, напомним, как раз её доработанную версию — GPT 3.5) потребовала 700 тыс. л воды только для охлаждения серверов в процессе своей тренировки, а каждые
Не следует забывать также, что электроэнергию необходимо передавать по проводам — как внутри микросхем, так и в пределах отдельных серверов, стоек, машинных залов и т. д. А оптимальный материал для таких проводов — медь: все прочие либо ощутимо дороже, либо обладают бóльшим сопротивлением и потому ведут к дополнительным энергопотерям. В Trafigura оценили глобальную потребность только ИИ-ЦОДов в меди к 2030 г. в 1 млн тонн ежегодно, причём каждый дополнительный мегаватт мощности каждого дата-центра обеспечивается расходованием от 20 до 40 тонн этого цветного металла. А есть ведь и другие его потребители — электромобили, БПЛА, не говоря уже о не имеющей прямого отношения к ИИ электронике. В результате хроническая нехватка меди на мировом рынке, в текущем году не превышающая 35 тыс. тонн, к
Ещё один материал, необходимый для постройки ЦОДов, — бетон. Производство ключевого его компонента, цемента, само по себе энерго- и водоёмко, — а адекватной замены ему нет и не предвидится. В Mordor Intelligence подсчитали, что в мире до
Наконец, не следует забывать и о порождаемых развитием ИИ-индустрии отходах. Поскольку серверные графические ускорители на фоне широчайшего спроса на генеративные модели работают в облаках под крайне высокой нагрузкой
Иными словами, готовиться к повсеместному коммерческому внедрению ИИ следует не только на отраслевом, но и на государственном уровне, — поскольку весь комплекс возникающих на этом пути проблем российскому ИТ-каналу в одиночку точно не решить.
Источник: Максим Белоус, IT Channel News