Компания Anthropic объявила о выходе новой версии языковой модели Claude Opus 4.8, релиз которой запланирован на ближайший четверг. Ключевым нововведением разработчики называют повышение уровня «честности» искусственного интеллекта — способности системы признавать ограничения своих знаний и избегать голословных утверждений.
Повышение точности и снижение числа ошибок
По словам представителей Anthropic, распространенной проблемой современных нейросетей является склонность выдавать необоснованные выводы за достоверные факты. Новая модель Opus 4.8 была обучена более критическому подходу к собственным ответам. Согласно результатам предварительного тестирования, система стала чаще указывать на неопределенность в своих суждениях и реже делать утверждения, не подкрепленные данными.
Важным достижением разработчиков стало улучшение качества генерации программного кода. Согласно внутренней аналитике компании, вероятность пропуска ошибок в написанном коде у новой версии снизилась примерно в 4 раза по сравнению с предшественником.
Гибкое управление вычислительными ресурсами
В обновлении реализована функция регулировки интенсивности усилий, затрачиваемых нейросетью на выполнение задачи. Пользователи получили возможность самостоятельно настраивать уровень сложности обработки запроса:
- Высокая интенсивность обеспечивает более глубокую проработку ответа, но требует большего количества токенов (единиц измерения объема текста, используемых для тарификации).
- Пониженная интенсивность позволяет быстрее получать результат и экономить установленные лимиты запросов.
Масштабирование задач через динамические рабочие процессы
В тестовом режиме представлена функция «динамических рабочих процессов» (dynamic workflows), предназначенная для решения комплексных и объемных задач. Система позволяет нейросети самостоятельно планировать этапы работы и запускать сотни параллельных вспомогательных агентов в рамках одной сессии. Модель Opus 4.8 увеличивает время непрерывной работы таких агентов, а также проводит предварительную проверку результатов перед тем, как предоставить готовый отчет пользователю.