Каждый запрос к современным системам искусственного интеллекта запускает сложный процесс обмена данными. Информация покидает оперативную память, проходит предварительную обработку в центральном процессоре, отправляется на графический ускоритель для выполнения интенсивных вычислений и затем возвращается обратно. Этот цикл повторяется для каждого слова, генерируемого ИИ, создавая узкое место в архитектуре.
Революционное решение проблемы узких мест
Основная проблема заключается в необходимости многократной пересылки данных между дорогостоящими и энергоемкими чипами. Именно эту неэффективность стремится устранить компания XCENA, имеющая офисы в Южной Корее и США. Этот стартап, основанный четыре года назад, разработал уникальный чип, который располагает вычислительные мощности значительно ближе к динамической оперативной памяти (DRAM) — быстрым чипам кратковременной памяти, где хранятся активно используемые процессором данные. Такой подход позволяет выполнять рутинные операции с данными прямо рядом с памятью, избегая затратных круговых перемещений между центральными процессорами (CPU), графическими ускорителями (GPU) и самой памятью.
В случае успешного масштабирования, такое решение может значительно снизить стоимость инфраструктуры для ИИ, что объясняет высокий интерес инвесторов. Недавно XCENA успешно закрыла раунд финансирования Серии B, привлекши 135 миллионов долларов при оценке компании в 570 миллионов долларов. Общая сумма привлеченных средств достигла 185 миллионов долларов.
Истоки инновации и видение будущего
Генеральный директор XCENA Джин Ким основал компанию в 2022 году вместе с техническим директором Дохуном Кимом и директором по продукту Гарри Джухюном Кимом. Все они являются ветеранами таких гигантов в производстве памяти, как Samsung и SK Hynix, которые поставляют чипы для ускорителей Nvidia. В интервью изданию TechCrunch Джин Ким отметил: «За десятилетия CPU и GPU становились все умнее, но память оставалась неизменной. XCENA стремится изменить это». Он также подчеркнул, что недавний рост цен на память и акций связанных компаний указывает на более широкий сдвиг в инфраструктуре ИИ в сторону архитектур, ориентированных на память. Стоит отметить, что в этом месяце три доминирующие компании на мировом рынке чипов памяти — Samsung, SK Hynix и Micron — впервые в истории достигли оценки в триллион долларов каждая.
XCENA строит свой бизнес на предположении, что «инференс (применение ИИ-моделей) — это не только проблема вычислений, но и все большая проблема масштабирования памяти».
Технологическое превосходство чипа MX1
Чип MX1 от XCENA подключается к центральному процессору через CXL (Compute Express Link) — по сути, специализированный высокоскоростной интерфейс, связывающий процессор с памятью и другими устройствами. Он обрабатывает данные до того, как им потребуется покинуть модуль памяти. Это означает, что вычисления приходят к данным, а не наоборот. В компании утверждают, что задачи, для выполнения которых ранее требовалось десять серверов, потенциально могут быть решены на одном.
По словам Кима, «в то время как графические ускорители превосходны в матричных умножениях — основной математической операции при обучении моделей ИИ — большая часть сопутствующей оркестровки данных, включая предварительную обработку, управление кэшем «ключ-значение» (системой, которая хранит контекст предыдущих частей диалога, чтобы модель не обрабатывала его заново) и кэширование данных, по-прежнему выполняется на CPU. Наш чип обрабатывает эти задачи непосредственно внутри модуля памяти».
Спрос на решения для памяти значительно возрос со второй половины прошлого года, и в компании считают, что это играет им на руку. Ранние переговоры ведутся с несколькими мировыми поставщиками памяти, однако Ким отказался их назвать. Идеальными клиентами компании являются крупнейшие операторы облачных сервисов (гиперскейлеры), которые тратят десятки миллиардов долларов в год на инфраструктуру ИИ, где даже небольшой прирост эффективности памяти может обернуться сотнями миллионов долларов экономии.
Перспективы внедрения и конкурентная среда
На данный момент MX1 находится на стадии прототипа. Массовое производство чипов планируется начать на заводах Samsung к концу 2026 года, а получение прибыли компания ожидает с 2027 года.
В то время как производители нейропроцессорных блоков (NPU) конкурируют с Nvidia за рабочие нагрузки, связанные с обучением ИИ, XCENA нацелена на нижний, интенсивно использующий память уровень всей этой архитектуры.
Среди ближайших конкурентов XCENA — компании Astera Labs и Marvell, обе торгуются на бирже Nasdaq и работают над технологиями подключения памяти нового поколения. Marvell — крупный, устоявшийся игрок в этой же области, однако, по словам Кима, ключевое отличие заключается в интеллектуальной собственности. Он отметил, что XCENA обладает «тысячами ядер», в то время как подход Marvell, согласно публичным спецификациям, опирается на несколько универсальных ядер.
Эти ядра построены на архитектуре RISC-V — наборе команд с открытым исходным кодом — и оптимизированы специально для обработки данных, причем каждое ядро намеренно сделано небольшим и эффективным. Помимо самих ядер, XCENA разрабатывает собственную внутреннюю иерархию памяти, шину межсоединений и контроллер DRAM — уровень вертикальной интеграции, который большинство чиповых компаний, включая более крупных конкурентов, обычно передают на аутсорсинг.
Раунд финансирования Серии B возглавили сеульские венчурные фонды Altinum и IMM Investment, а также Corstone Asia и уже существующие инвесторы SBI Investment и Mirae Asset Capital. Компания, штат которой насчитывает более 90 сотрудников в офисах в Панъгё (технологический хаб под Сеулом) и Саннивейле (США), также ведет переговоры с международными инвесторами о дополнительном финансировании.