Deepseek представляет Deepseek V3 AI LLM с бесплатным доступом к чатботу
Компания Deepseek представила свою новейшую ИИ-модель для больших языков (LLM) Deepseek V3, и как модель, так и чатбот доступны бесплатно.
LLM, которыми оснащаются распространенные сегодня чат-боты, обучаются на миллионах документов, чтобы понять связи между словами и темами. Чем больше параметров у этих моделей, тем лучше чатботы отвечают на запросы пользователей. Однако миллиарды используемых параметров требуют больших вычислительных мощностей и энергии, поэтому тщательная настройка процесса обучения является ключевым фактором для сохранения низких затрат и времени обучения.
Для достижения этих целей Deepseek использовала инновационную стратегию балансировки нагрузки в сочетании с 8-битными вычислениями с плавающей запятой (FP8) с более низкой точностью, уникальный метод компании по сокращению использования памяти (Multi-Head Latent Attention или MLA) и другие методы , подробно описанные в их техническом документе.
Тщательная оптимизация процесса обучения Deepseek V3 позволила снизить затраты до $6 миллионов, в отличие от $78 миллионов на обучение GPT-4 от OpenAI или предполагаемых $500+ млн за прогон для обучения GPT-5 от OpenAI. Более низкая стоимость и более быстрое обучение снижают стоимость Deepseek для коммерческих пользователей. Экологически настроенные люди также могут отметить более низкое потребление энергии и сокращение выбросов углекислого газа, необходимых для обучения Deepseek V3.
Deepseek V2 уже вошел в десятку самых мощных моделей ИИ LLM, а предварительные тесты чатботов, проведенные компанией, показали, что он выиграл в 12 из 21 тестах у таких высококлассных LLM, как Anthropic Claude 3.5 Sonnet и OpenAI GPT-4o.
Читатели могут бесплатно воспользоваться чат-ботом Deepseek V3 по адресу https://chat.deepseek.com/ для помощи в написании эссе, предоставления ответов и упрощения работы. Предприятия могут начать создавать приложения, используя V3 Platform API. Тем, кто пытается сохранить секреты, следует знать, что все данные чата хранятся на серверах, расположенных в Китайской Народной Республике. Тем не менее, крупнейшие американские компании, стоящие за лучшими на сегодняшний день ИИ LLM, такие как Facebook, были пойманы на том, что делились даннымитоже.