DeepSeek, китайская компания, специализирующаяся на разработке ИИ, выпустила DeepSeek-V3-0324, обновленную версию своей многоязычной модели ИИ V3 (LLM), которая была первоначально представлена в декабре 2024 года. Модель V3 удивила мир благодаря гораздо более низким требованиям к обучающему оборудованию, меньшему времени обучения и меньшим затратам на API, а также высокой производительности по сравнению с конкурирующими ИИ, такими как модели GPT от OpenAI.
Обновленная модель V3 - это нерассуждающая модель ИИ, то есть она пытается быстро отвечать на вопросы и не требует дополнительного времени на обдумывание сложных проблем, в отличие от модели R1 компании DeepSeek. Благодаря размеру в 685 миллиардов параметров она входит в число крупнейших общедоступных LLM. Последняя модель доступна для использования под лицензией MIT.
DeepSeek-V3-0324 показал от 5,3% до 19,8% более высокие результаты в тестах на искусственный интеллект, чем оригинальная версия V3. Его производительность сопоставима с другими лучшими ИИ, такими как GPT-4.5 и Claude Sonnet 3.7.
Обновленная модель также обладает улучшенными возможностями. Одна из областей улучшения - это усовершенствованная способность создавать привлекательные веб-страницы и фронт-энд для онлайн-игр. Еще одно улучшение - способность лучше искать, писать и переводить на китайском языке.
Читателям, желающим поэкспериментировать с полной версией 685B DeepSeek-V3-0324, потребуется не менее 700 ГБ свободного места для хранения данных и несколько графических процессоров Nvidia A100/H100. Уточненные и с меньшими параметрами версии модели можно запускать на одном GPU, например, Nvidia 3090(продается здесь, на Amazon).
Источник(и)
Выпуск DeepSeek-V3-0324
Значительное увеличение производительности рассуждений
Более сильные навыки разработки внешних компонентов
Более разумные возможности использования инструментов
Для несложных задач рассуждения мы рекомендуем использовать V3 - просто отключите "DeepThink"
Использование API осталось неизменным
Модели теперь выпускаются под лицензией MIT, как и DeepSeek-R1!
Весовые коэффициенты с открытым исходным кодом: huggingface.co/deepseek-ai/DeepSeek-V3-0324