Deepseek представляет Deepseek V3 AI LLM с бесплатным доступом к чатботу

Deepseek открывает бесплатный доступ к чатботу Deepseek V3 AI LLM для всех желающих. (Источник изображения: Deepseek)

Китайская компания, занимающаяся разработкой искусственного интеллекта, улучшила свой LLM Deepseek V2, занявший первое место в десятке, выпустив Deepseek V3. Этот LLM значительно дешевле большинства конкурирующих ИИ благодаря тщательной оптимизации процесса обучения.

David Chien (перевод Ninh Duy), Опубликовано 29 December 2024 🇺🇸 🇫🇷 ...

Компания Deepseek представила свою новейшую ИИ-модель для больших языков (LLM) Deepseek V3, и как модель, так и чатбот доступны бесплатно.

LLM, которыми оснащаются распространенные сегодня чат-боты, обучаются на миллионах документов, чтобы понять связи между словами и темами. Чем больше параметров у этих моделей, тем лучше чатботы отвечают на запросы пользователей. Однако миллиарды используемых параметров требуют больших вычислительных мощностей и энергии, поэтому тщательная настройка процесса обучения является ключевым фактором для сохранения низких затрат и времени обучения.

Для достижения этих целей Deepseek использовала инновационную стратегию балансировки нагрузки в сочетании с 8-битными вычислениями с плавающей запятой (FP8) с более низкой точностью, уникальный метод компании по сокращению использования памяти (Multi-Head Latent Attention или MLA) и другие методы , подробно описанные в их техническом документе.

Тщательная оптимизация процесса обучения Deepseek V3 позволила снизить затраты до $6 миллионов, в отличие от $78 миллионов на обучение GPT-4 от OpenAI или предполагаемых $500+ млн за прогон для обучения GPT-5 от OpenAI. Более низкая стоимость и более быстрое обучение снижают стоимость Deepseek для коммерческих пользователей. Экологически настроенные люди также могут отметить более низкое потребление энергии и сокращение выбросов углекислого газа, необходимых для обучения Deepseek V3.

Deepseek V2 уже вошел в десятку самых мощных моделей ИИ LLM, а предварительные тесты чатботов, проведенные компанией, показали, что он выиграл в 12 из 21 тестах у таких высококлассных LLM, как Anthropic Claude 3.5 Sonnet и OpenAI GPT-4o.

Читатели могут бесплатно воспользоваться чат-ботом Deepseek V3 по адресу https://chat.deepseek.com/ для помощи в написании эссе, предоставления ответов и упрощения работы. Предприятия могут начать создавать приложения, используя V3 Platform API. Тем, кто пытается сохранить секреты, следует знать, что все данные чата хранятся на серверах, расположенных в Китайской Народной Республике. Тем не менее, крупнейшие американские компании, стоящие за лучшими на сегодняшний день ИИ LLM, такие как Facebook, были пойманы на том, что делились даннымитоже.

Deepseek V3 побеждает в 12 из 21 эталонного теста LLM, сравнивая его с такими высококлассными LLM, как OpenAI GPT-4o и Anthropic Claude 3.5 Sonnet. (Источник изображения: Deepseek на Github)

Первые бенчмарки Deepseek V3 в Open Large Model AI Leaderboard позволяют предположить, что он входит в десятку самых мощных LLM ИИ в мире. (Источник изображения: Open Large Model AI)

Тщательная оптимизация процесса обучения значительно сократила затраты и время на создание Deepseek V3 LLM, что привело к значительному снижению стоимости использования. (Источник изображения: Deepseek on X)

Источник(и)

Deepseek, Deepseek на GitHub, Deepseek на X, Технический отчет Deepseek V3, Открытая большая модель ИИ, Stanford AI Index Report 2024, WSJ via MSN

Ещё по теме

Компания DeepSeek подпадает под действие ирландского DPA в связи с обработкой персональных данных (Источник изображения: Сгенерировано с помощью DALL-E 3)

DeepSeek стал мишенью для ирландского DPA в связи с его практикой работы с данными 01 February 2025

Компания Figure AI впервые поставила своего человекоподобного робота Figure 02 нераскрытому заказчику, как сообщает компания. (Источник изображения: YouTube / Figure)

Гуманоидный робот Figure AI достиг своего первого покупателя 03 January 2025

Lava Yuva 2 5G: новый бюджетный сма...

Apple M5 Pro, Max и Ultra могут отк...

Автор исходного текста: David Chien - Tech Writer - 538 статей на Notebookcheck c 2023 года

Автор перевода: Нин Нгок Дуй (Ninh Ngoc Duy) - Помощник редакции - 525467 статей на Notebookcheck c 2008 года

Будучи помощником редакции, я отвечаю за пополнение нашей Библиотеки, в которой собраны обзоры с самых разных сторонних порталов. Помимо этого, каждый день я выбираю наиболее интересные материалы Notebookcheck для их последующего перевода на французский, испанский, португальский, нидерландский и другие языки.

contact me via: Facebook

Этот важный материал точно понравится твоим друзьям в социальных сетях!