Развитие искусственного интеллекта, индустрия, оцениваемая в триллионы долларов, сталкивается с неожиданным препятствием, о котором мало кто задумывался. Несмотря на то, что геополитические риски, связанные с производством полупроводников на Тайване, давно находятся в центре внимания, угроза поступает с совершенно иной стороны — от дефицита редкого инертного газа.
"Чёрный лебедь" на рынке инертных газов
Когда пролив Ормуз был перекрыт из-за конфликта в Иране, заголовки новостей по всему миру были посвящены нефти. Однако примерно треть мирового коммерческого гелия, поставляемого из Катара, также проходит через этот пролив. На данный момент эти поставки нарушены.
В производстве чипов высокочистый гелий незаменим. Он критически важен для охлаждения кремниевых пластин и теплового менеджмента лазеров в литографических системах ASML — оборудовании, без которого невозможно создание современных чипов для ИИ. Хотя такие гиганты, как TSMC, Samsung и Intel, поддерживают свои запасы, эти резервы конечны. По мере того как пролив остаётся закрытым, становится очевидным, что многомиллиардная индустрия связана с газом, который большинство ассоциирует лишь с воздушными шариками. Эта зависимость оставалась без внимания до критического момента.
Многомиллиардная индустрия, построенная на хрупкости
Цепочка поставок для ИИ характеризуется чрезвычайной концентрацией, физической уязвимостью и множеством зависимостей, о которых большинство людей никогда не слышали.
- Компания TSMC производит более 90 процентов самых передовых полупроводников в мире.
- ASML является единственным производителем литографических систем, необходимых для этих чипов, поставляя около 50 высокотехнологичных установок в год, каждая стоимостью около 350 миллионов долларов США.
Сотни миллиардов долларов были инвестированы в создание этой инфраструктуры. Тем не менее, наиболее значимая уязвимость во всей системе заключается не в машине, минерале или гигаватте энергии, а в чём-то гораздо более обыденном и почти полностью игнорируемом.
После обучения модель предоставлена самой себе
Знания большой языковой модели (LLM) ограничены моментом завершения её обучения. Всё, что следует за этим, является извлечением информации или, в некоторых случаях, "галлюцинациями" и вымыслом.
Большинство компаний используют ИИ для работы с внутренней документацией, чтобы обеспечить его надёжность. Модель извлекает найденную информацию и формирует ответ. При этом она не проверяет актуальность источника, не замечает существования трёх версий одной и той же политики и не учитывает подобные несоответствия.
Надёжность ИИ-системы напрямую зависит от качества и актуальности наиболее "релевантного" документа, который она извлекает. Это не недостаток самой модели, а особенность её архитектуры. В большинстве организаций информационная база представляет собой мозаику из противоречивых PDF-файлов, устаревших вики-страниц и документов, которые в последний раз просматривал сотрудник, давно уволившийся из компании.
От скрытого долга к реальной ответственности
Эта проблема существовала всегда, но была менее заметной. Клиент мог обнаружить неверный ответ в справочной статье, закрыть вкладку и вместо этого позвонить в службу поддержки. Ущерб был ограниченным и распространялся медленно.
Искусственный интеллект изменил эту ситуацию. Когда модель извлекает информацию из фрагментированных или противоречивых источников, она не сигнализирует о несогласованности. Вместо этого она синтезирует конфликтующие данные в единый, уверенный ответ. "Контентный долг" — накопленный массив устаревшей и неструктурированной информации — превратился из неудобства в процессе обслуживания в серьёзную ответственность. Каждый запрос теперь усиливает существующие проблемы качества данных. Преимущество получают те, у кого самая чистая и актуальная документация.
Единственное "узкое место", которое можно устранить
Устранение других "узких мест" в цепочке поставок ИИ требует колоссальных капиталовложений. Строительство заводов по производству чипов занимает годы и миллиарды долларов. Расширение энергетической инфраструктуры требует одобрения регулирующих органов и масштабного проектирования на уровне энергосистем. Обучение следующего поколения моделей требует вычислительных ресурсов, которые доступны лишь немногим организациям.
По прогнозам, к 2030 году центры обработки данных для ИИ будут потреблять 945 тераватт-часов электроэнергии ежегодно, что примерно соответствует всему объёму энергопотребления Японии.
Решение проблемы на уровне контента не требует подобных затрат. Оно подразумевает применение к документации тех же инженерных принципов, что и к остальной части стека: структурированное создание, публикация из единого источника (одна авторитетная версия для всех выходов), контроль версий и систематический пересмотр. Это не новые практики, они хорошо изучены и сравнительно недороги.
Иронию трудно не заметить: организации готовы инвестировать миллионы, чтобы сократить время ответа на миллисекунды, но почти никто не задаётся вопросом, является ли сам ответ достоверным.
Вопрос, который никто не задаёт
Общественные дискуссии об инфраструктуре ИИ сосредоточены на самых видимых и дорогостоящих аспектах. Это реальные ограничения, но на них невозможно повлиять напрямую. Обычные компании не будут строить литографические машины или атомные электростанции.
Однако они способны влиять на то, какую информацию их ИИ будет извлекать при запросе. И прямо сейчас в большинстве организаций ответ такой: "всё, что было загружено в вики три года назад кем-то, кто с тех пор покинул компанию". Создана самая сложная система поиска информации в истории человечества, но ей скармливают документацию, которую никто не читал годами.