7 ноября 2024 г.

Интерес к коммерческому (а не только для допросов «умного» бота с пристрастием, чей Тайвань, или для рисования с его же помощью милых котиков в смешных шляпах) применению генеративного искусственного интеллекта в России велик, — вот только аппаратных мощностей для активного его развития по объективным причинам пока маловато. Впрочем, нет сомнений, что скорее рано, чем поздно эта преграда на пути самого широкого внедрения ИИ в бизнес-процессы если не исчезнет полностью, то станет куда более проницаемой, чем сегодня. И вот тогда сдерживать экспансию генеративных моделей будут уже другие факторы — те, с которыми сталкиваются сегодня их коммерческие пользователи в тех регионах, поставки передовых ИИ-ускорителей в которые не ограничивает вездесущий Минторг США.

Один из важнейших ограничительных факторов такого рода — нехватка данных для тренировки ещё более крупных и мощных, чем применяемые сегодня, генеративных моделей. Согласно оценке CB Insights, уже к 2026 г. общий объём доступных для обучения новых моделей открытых естественных данных (оцифрованных людьми либо созданных самим же человеком в цифровом виде — от фото и видео живой природы до художественных произведений и научных работ) окажется в целом исчерпан. Соответственно, придётся обращаться либо к защищённой авторским правом информации — а это дополнительные затраты, перекладываемые в конечном итоге на клиента, — либо к синтетическим, сгенерированным ИИ предыдущих поколений, что грозит учащением случаев галлюцинирования новых моделей.

Следующий по значимости фактор — энергетический. Пока генеративный искусственный интеллект опирается на ставшие привычными за десятилетия развития ИТ-отрасли полупроводниковые микросхемы, он обречён расходовать электричество в поистине гаргантюанских масштабах: согласно подсчётам Международного энергетического агентства (IEA), в 2022 г. суммарное потребление дата-центров в мире достигало 460 ТВт·ч, а к 2026-му оно вырастет — именно благодаря активному развитию ИИ-направления — до 620-1050 ТВт·ч (и чем дальше, те более вероятным представляется достижение именно верхней границы этого интервала). Теоретически, спасти положение может переход на более энергоэффективную аппаратную основу, нейроморфные вычислители различной природы, но само по себе развитие этой новой ветви ИТ-отрасли потребует изрядных инвестиций и дополнительного времени.

Помимо электричества, ЦОДы нуждаются в значительных объёмах воды для работы систем охлаждения, и это уже сегодня начинает становиться проблемой. Скажем, Microsoft отчиталась в 2023 г. об использовании свыше 7,8 млн м³ воды, — ушедшей в основном как раз на обеспечение работы её дата-центров (где в облаке Azure исполняются многие популярные генеративные ИИ-модели, включая и GPT). Уже одна модель GPT-3 (набравший осенью 2022 г. бот ChatGPT использовал на первых порах, напомним, как раз её доработанную версию — GPT 3.5) потребовала 700 тыс. л воды только для охлаждения серверов в процессе своей тренировки, а каждые 10-50 обращений к ней обходятся, по подсчётам инженеров, в дополнительные 500 мл необходимой для жизни влаги. Новейшие же, а тем более перспективные варианты генеративного ИИ ещё более требовательны: в JPMorgan Chase прогнозируют ежедневное потребление воды дата-центрами в 2030 г. на уровне 1,7 млрд литров.

Не следует забывать также, что электроэнергию необходимо передавать по проводам — как внутри микросхем, так и в пределах отдельных серверов, стоек, машинных залов и т. д. А оптимальный материал для таких проводов — медь: все прочие либо ощутимо дороже, либо обладают бóльшим сопротивлением и потому ведут к дополнительным энергопотерям. В Trafigura оценили глобальную потребность только ИИ-ЦОДов в меди к 2030 г. в 1 млн тонн ежегодно, причём каждый дополнительный мегаватт мощности каждого дата-центра обеспечивается расходованием от 20 до 40 тонн этого цветного металла. А есть ведь и другие его потребители — электромобили, БПЛА, не говоря уже о не имеющей прямого отношения к ИИ электронике. В результате хроническая нехватка меди на мировом рынке, в текущем году не превышающая 35 тыс. тонн, к 2030-му грозит выйти за 100 тыс. тонн — что ещё более удорожит и этот металл, и, как следствие, тренировку и использование новых генеративных моделей.

Ещё один материал, необходимый для постройки ЦОДов, — бетон. Производство ключевого его компонента, цемента, само по себе энерго- и водоёмко, — а адекватной замены ему нет и не предвидится. В Mordor Intelligence подсчитали, что в мире до 2030-го ежегодно будет появляться по меньшей мере по 450 дата-центров, в основном как раз ИИ-ориентированных (а для иных задач, собственно, столь динамичный прирост и не нужен), — так что в итоге их число на планете перевалит за 10 тыс., а суммарная площадь — за 26,5 млн м². Уже сегодня мировая стройиндустрия потребляет около 35 млн тонн бетона ежегодно, — и стремительная экспансия генеративного ИИ ощутимо увеличивает эти объёмы. Для России с её обширными природными ресурсами, возможно, энерго- и водоёмкость можно рассматривать как менее значимые факторы по сравнению с прочими, но в отдельных регионах и они могут становиться поистине непреодолимыми препятствиями для возведения новых ЦОДов.

Наконец, не следует забывать и о порождаемых развитием ИИ-индустрии отходах. Поскольку серверные графические ускорители на фоне широчайшего спроса на генеративные модели работают в облаках под крайне высокой нагрузкой (70-80% всего доступного клиентам времени), а каждый такой чип вроде Nvidia H100 рассеивает около 700 Вт тепла, продолжительность фактической службы ИИ-«железа» оказывается значительно ниже привычных для ИТ-оборудования в дата-центрах 3-5 лет. Недавнее исследование, опубликованное в Nature Computational Science, оценивает дополнительный вклад не подлежащей восстановлению электроники (e-waste) в общий объём генерируемого человечеством мусора только за счёт растущего спроса на ИИ-модели в 2,5 млн тонн в год к 2030-му.

Иными словами, готовиться к повсеместному коммерческому внедрению ИИ следует не только на отраслевом, но и на государственном уровне, — поскольку весь комплекс возникающих на этом пути проблем российскому ИТ-каналу в одиночку точно не решить.


Источник: Максим Белоус, IT Channel News