Notebookcheck Logo

xAI выпускает ИИ Grok 3 с высочайшей производительностью и бета-версией моделей рассуждений

xAI выпускает семейство передовых систем искусственного интеллекта Grok 3. (Источник изображения: xAI)
xAI выпускает семейство передовых систем искусственного интеллекта Grok 3. (Источник изображения: xAI)
Последние модели больших языков xAI возглавили хит-парады бенчмарков благодаря своей способности искать информацию в Интернете, решать сложные задачи и обрабатывать ввод с контекстным окном в один миллион лексем. Модели Grok 3 обошли OpenAI GPT-4o и DeepSeek-V3 в большинстве бенчмарков.

Компания Элона Маска xAI выпустила семейство передовых моделей большого языка ИИ Grok 3, которые в целом превосходят другие ИИ по стандартным показателям.

Модели Grok 3 были обучены на суперкомпьютерном кластере компании Colossus, использующем 100 000 графических процессоров Nvidia Hopper Tensor Core. Были выпущены пара стандартных и мини-моделей без рассуждений (Grok 3 beta и Grok 3 mini beta), а также пара моделей с рассуждениями (Grok 3 beta (Think) и Grok 3 mini beta (Think)).

Модели без рассуждений в целом превосходят предыдущие ИИ, занимавшие первые места в чартах, такие как OpenAI GPT-4o и DeepSeek-V3. Одна из причин заключается в том, что они имеют контекстное окно на миллион жетонов, что позволяет ИИ использовать очень большие объемы текста. Это улучшает способность моделей синтезировать правильный ответ из различных источников. Тем не менее, бета-модели Grok 3 по-прежнему отвечают на вопросы, связанные с поиском фактов, с точностью менее 50% (эталон SimpleQA), поэтому завтра у людей все еще будет работа.

Модели-рассуждения продумывают сложные подсказки шаг за шагом, позволяя пользователю видеть ход мыслей ИИ. Это позволяет ИИ решать проблемы так, как это сделал бы эксперт, решая небольшие части задачи и объединяя результаты для получения правильного ответа. Выбрав агент DeepSearch, или опцию поиска, Grok 3 начнет широкий и глубокий поиск в Интернете и будет использовать интерпретаторы кода, прежде чем генерировать отчеты, обобщающие его результаты. Модели Grok 3 (Think) в целом лучше других ИИ решают математические задачи, отвечают на вопросы с множественным выбором на уровне выпускников и выполняют задания по кодированию.

в ближайшие месяцы xAI планирует продолжить настройку Grok 3 для повышения производительности на суперкомпьютерном кластере с 200 000 GPU. Grok 3 уже доступен для всех пользователей на сайтах X и Grok.com. Бесплатные пользователи могут столкнуться с ограничениями в использовании, в то время как платные пользователи получат доступ к расширенным функциям.

В рейтинге Chatbot Arena ELO для Grok 3 AI занимает первое место в мире. (Источник изображения: xAI)
В рейтинге Chatbot Arena ELO для Grok 3 AI занимает первое место в мире. (Источник изображения: xAI)
Grok 3 beta и Grok 3 mini beta в целом превосходят GPT-4o и DeepSeek-V3 от OpenAI в стандартизированных бенчмарках ИИ. (Источник изображения: xAI)
Grok 3 beta и Grok 3 mini beta в целом превосходят GPT-4o и DeepSeek-V3 от OpenAI в стандартизированных бенчмарках ИИ. (Источник изображения: xAI)
Grok 3 beta (Think) и Grok 3 mini beta (Think) в целом превосходят все остальные протестированные модели искусственного интеллекта. (Источник изображения: xAI)
Grok 3 beta (Think) и Grok 3 mini beta (Think) в целом превосходят все остальные протестированные модели искусственного интеллекта. (Источник изображения: xAI)
Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo
'
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2025 год, 02 месяц > xAI выпускает ИИ Grok 3 с высочайшей производительностью и бета-версией моделей рассуждений
David Chien, 2025-02-21 (Update: 2025-02-21)