Китайский бесплатный ИИ с открытым исходным кодом DeepSeek - серьезная угроза для ChatGPT от OpenAI и других моделей ИИ
Начиная с ноября 2023 года, китайская компания DeepSeek выпускает модели ИИ с открытым исходным кодом. Благодаря лицензии MIT любой желающий может использовать и адаптировать модель для своих индивидуальных целей. Это делает модели прозрачными и универсальными.
Кроме того, они обеспечивают возможность совместной разработки и экономят деньги на этом пути. Пользователи могут просматривать и понимать код, чтобы понять, как работает модель. Они могут адаптировать модель к своим конкретным потребностям и использовать ее для различных приложений. Таким образом, DeepSeek стремится к открытому исходному коду и тем самым вносит инновации и конкуренцию в сферу ИИ.
Эта компания возникла из Fire-Flyer, которая является филиалом китайского хедж-фонда High-Flyer, занимающегося глубоким обучением. Первоначальной целью компании было лучшее понимание, интерпретация и прогнозирование финансовых данных на фондовом рынке. После выделения DeepSeek в 2023 году компания полностью сосредоточилась на LLM, которые представляют собой модели ИИ, способные генерировать текст.
Похоже, компания достигла большого прорыва благодаря двум новейшим представителям семейства ИИ DeepSeek. Согласно широко используемым бенчмаркам ИИ, DeepSeek-V3, DeepSeek-R1 и DeepSeek-R1-Zero часто превосходят конкурентов из Meta, OpenAI и Google в своих областях. Как онлайн-сервис, они также значительно дешевле, чем, например, ChatGPT.
Такая агрессивная ценовая стратегия может повлиять на все цены на рынке ИИ и сделать передовые инструменты ИИ доступными для более широкой аудитории. Компания может себе это позволить, потому что она хочет тратить на обучение своих моделей ИИ значительно меньше денег, чем другие компании. Точнее говоря, этого можно добиться за счет более эффективных программ обучения и большого количества автоматизации.
С другой стороны, DeepSeek-R1 и DeepSeek-R1-Zero - это рассуждающие модели. Это означает, что сначала они разрабатывают план, как лучше ответить на вопрос, а затем работают небольшими шагами. Это повышает точность результатов, требуя при этом меньше вычислительной мощности. Однако такой подход увеличивает потребность в пространстве для хранения данных.
Будучи ИИ с открытым исходным кодом, DeepSeek может работать непосредственно на компьютере конечного пользователя. Необходимые прикладные данные могут быть доступны бесплатно, поскольку модели можно бесплатно загрузить на сайте Hugging Face. Это еще проще с такими программами, как LM Studio, которые могут автоматически загрузить и установить весь код приложения.
Это означает, что проблем с безопасностью и конфиденциальностью данных быть не должно. Подсказки, данные и ответы не покидают компьютер. Кроме того, модель можно использовать в автономном режиме. Здесь не требуется высокопроизводительное оборудование, но требуется много памяти и хранилища. Например, DeepSeek-R1-Distill-Qwen-32B требует около 20 ГБ места на жестком диске.
Согласно DeepSeek V3, ИИ работает с множеством языков. К ним относятся китайский и английский, а также немецкий, французский и испанский. В коротком чате различные языки дали удовлетворительные ответы.
Остались только вопросы и сомнения по поводу китайской цензуры. DeepSeek-R1 содержит цензуру на некоторые политически чувствительные темы. Пользователи, которые пытаются спросить об определенных исторических событиях, либо не получают ответа, либо получают "пересмотренный" ответ. Например, Вам не обязательно спрашивать ИИ о том, что произошло на площади Тяньаньмэнь 3 и 4 июня 1989 года.
При этом DeepSeek R1, по крайней мере, распознает студенческие протесты и военную операцию. Но и другие модели ИИ также скупятся на ответы на политические вопросы. Gemini от Google прямо отказывается отвечать на вопросы, которые могут быть связаны с политикой. Таким образом, в различных ИИ можно обнаружить (самонавязанную) цензуру.