Обновленный поиск Google с использованием искусственного интеллекта вновь оказался в центре внимания из-за курьезных ошибок. Несмотря на технологическую мощь, алгоритмы компании не могут корректно подсчитать количество букв в простых словах и допускают ошибки в написании имен и терминов.
Курьезные ошибки в поисковой выдаче
В ходе проверки функции AI Overviews (обзоры на базе ИИ) выяснилось, что нейросеть приписывает слову Google наличие двух букв «p», а в слове «poop», по версии алгоритма, содержится ровно одна буква «r». Особое внимание привлек случай с термином «журналистика»: система заявила, что в английском слове journalism присутствуют две буквы «d», и предложила вариант написания «journadi-s-m». Ошибки затронули и политиков — правильно определив количество букв в фамилии бывшего президента США, ИИ выдал написание «t-r-p-u-m».
Это не первый случай, когда интеграция генеративного ИИ в поисковую систему вызывает нарекания. В начале тестирования функция выдавала советы, основанные на сатирических материалах, предлагая пользователям есть камни или использовать клей для закрепления сыра на пицце.
Почему нейросети не умеют считать буквы
В официальном заявлении Google для издания TechCrunch представители компании признали проблему. В компании отметили, что подсчет символов внутри слов является известной сложностью для больших языковых моделей (LLM), и разработчики уже работают над исправлением этого конкретного бага.
Специалисты в области ИИ объясняют эти провалы особенностями архитектуры современных моделей:
- Нейросети работают с токенами (единицами обработки текста), а не с отдельными буквами.
- При вводе запроса текст переводится в числовой код; модель понимает значение слова целиком, но не осознает его посимвольный состав.
- Архитектура трансформеров, на которой построены модели Google, изначально не предназначена для «чтения» текста в человеческом понимании.
Проблема восприятия ИИ
По словам исследователей из Университета Альберты, когда алгоритм видит слово, он оперирует его закодированным смыслом, а не отдельными знаками. Попытки создать идеальный механизм токенизации, который удовлетворил бы экспертов и был эффективен для модели, пока не увенчались успехом.
В обзоре ситуации отмечается, что подобные сбои в правописании и элементарной логике полезны для пользователей. Они служат напоминанием о том, что даже самые продвинутые системы ИИ, способные писать программный код или решать сложные уравнения, не являются непогрешимыми. Эксперты подчеркивают необходимость критического отношения к любым результатам генерации ИИ и обязательной проверки фактов.