Notebookcheck Logo

Deepseek представляет Deepseek V3 AI LLM с бесплатным доступом к чатботу

Deepseek открывает бесплатный доступ к чатботу Deepseek V3 AI LLM для всех желающих. (Источник изображения: Deepseek)
Deepseek открывает бесплатный доступ к чатботу Deepseek V3 AI LLM для всех желающих. (Источник изображения: Deepseek)
Китайская компания, занимающаяся разработкой искусственного интеллекта, улучшила свой LLM Deepseek V2, занявший первое место в десятке, выпустив Deepseek V3. Этот LLM значительно дешевле большинства конкурирующих ИИ благодаря тщательной оптимизации процесса обучения.

Компания Deepseek представила свою новейшую ИИ-модель для больших языков (LLM) Deepseek V3, и как модель, так и чатбот доступны бесплатно.

LLM, которыми оснащаются распространенные сегодня чат-боты, обучаются на миллионах документов, чтобы понять связи между словами и темами. Чем больше параметров у этих моделей, тем лучше чатботы отвечают на запросы пользователей. Однако миллиарды используемых параметров требуют больших вычислительных мощностей и энергии, поэтому тщательная настройка процесса обучения является ключевым фактором для сохранения низких затрат и времени обучения.

Для достижения этих целей Deepseek использовала инновационную стратегию балансировки нагрузки в сочетании с 8-битными вычислениями с плавающей запятой (FP8) с более низкой точностью, уникальный метод компании по сокращению использования памяти (Multi-Head Latent Attention или MLA) и другие методы , подробно описанные в их техническом документе.

Тщательная оптимизация процесса обучения Deepseek V3 позволила снизить затраты до $6 миллионов, в отличие от $78 миллионов на обучение GPT-4 от OpenAI или предполагаемых $500+ млн за прогон для обучения GPT-5 от OpenAI. Более низкая стоимость и более быстрое обучение снижают стоимость Deepseek для коммерческих пользователей. Экологически настроенные люди также могут отметить более низкое потребление энергии и сокращение выбросов углекислого газа, необходимых для обучения Deepseek V3.

Deepseek V2 уже вошел в десятку самых мощных моделей ИИ LLM, а предварительные тесты чатботов, проведенные компанией, показали, что он выиграл в 12 из 21 тестах у таких высококлассных LLM, как Anthropic Claude 3.5 Sonnet и OpenAI GPT-4o.

Читатели могут бесплатно воспользоваться чат-ботом Deepseek V3 по адресу https://chat.deepseek.com/ для помощи в написании эссе, предоставления ответов и упрощения работы. Предприятия могут начать создавать приложения, используя V3 Platform API. Тем, кто пытается сохранить секреты, следует знать, что все данные чата хранятся на серверах, расположенных в Китайской Народной Республике. Тем не менее, крупнейшие американские компании, стоящие за лучшими на сегодняшний день ИИ LLM, такие как Facebook, были пойманы на том, что делились даннымитоже.

Deepseek V3 побеждает в 12 из 21 эталонного теста LLM, сравнивая его с такими высококлассными LLM, как OpenAI GPT-4o и Anthropic Claude 3.5 Sonnet. (Источник изображения: Deepseek на Github)
Deepseek V3 побеждает в 12 из 21 эталонного теста LLM, сравнивая его с такими высококлассными LLM, как OpenAI GPT-4o и Anthropic Claude 3.5 Sonnet. (Источник изображения: Deepseek на Github)
Первые бенчмарки Deepseek V3 в Open Large Model AI Leaderboard позволяют предположить, что он входит в десятку самых мощных LLM ИИ в мире. (Источник изображения: Open Large Model AI)
Первые бенчмарки Deepseek V3 в Open Large Model AI Leaderboard позволяют предположить, что он входит в десятку самых мощных LLM ИИ в мире. (Источник изображения: Open Large Model AI)
Тщательная оптимизация процесса обучения значительно сократила затраты и время на создание Deepseek V3 LLM, что привело к значительному снижению стоимости использования. (Источник изображения: Deepseek on X)
Тщательная оптимизация процесса обучения значительно сократила затраты и время на создание Deepseek V3 LLM, что привело к значительному снижению стоимости использования. (Источник изображения: Deepseek on X)
Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo
'
David Chien, 2024-12-29 (Update: 2024-12-29)