Anthropic выпускает обновленную модель Claude Opus 4.8 с акцентом на достоверность

Anthropic выпускает обновленную модель Claude Opus 4.8 с акцентом на достоверность

Компания Anthropic объявила о выходе новой версии языковой модели Claude Opus 4.8, релиз которой запланирован на ближайший четверг. Ключевым нововведением разработчики называют повышение уровня «честности» искусственного интеллекта — способности системы признавать ограничения своих знаний и избегать голословных утверждений.

Повышение точности и снижение числа ошибок

По словам представителей Anthropic, распространенной проблемой современных нейросетей является склонность выдавать необоснованные выводы за достоверные факты. Новая модель Opus 4.8 была обучена более критическому подходу к собственным ответам. Согласно результатам предварительного тестирования, система стала чаще указывать на неопределенность в своих суждениях и реже делать утверждения, не подкрепленные данными.

Важным достижением разработчиков стало улучшение качества генерации программного кода. Согласно внутренней аналитике компании, вероятность пропуска ошибок в написанном коде у новой версии снизилась примерно в 4 раза по сравнению с предшественником.

Гибкое управление вычислительными ресурсами

В обновлении реализована функция регулировки интенсивности усилий, затрачиваемых нейросетью на выполнение задачи. Пользователи получили возможность самостоятельно настраивать уровень сложности обработки запроса:

  • Высокая интенсивность обеспечивает более глубокую проработку ответа, но требует большего количества токенов (единиц измерения объема текста, используемых для тарификации).
  • Пониженная интенсивность позволяет быстрее получать результат и экономить установленные лимиты запросов.

Масштабирование задач через динамические рабочие процессы

В тестовом режиме представлена функция «динамических рабочих процессов» (dynamic workflows), предназначенная для решения комплексных и объемных задач. Система позволяет нейросети самостоятельно планировать этапы работы и запускать сотни параллельных вспомогательных агентов в рамках одной сессии. Модель Opus 4.8 увеличивает время непрерывной работы таких агентов, а также проводит предварительную проверку результатов перед тем, как предоставить готовый отчет пользователю.