Обнаружен способ запуска модели ИИ 671B от DeepSeek без дорогостоящих графических процессоров

Источник изображения: Aristal, Pixabay

Инженер компании Hugging Face Мэтью Кэрриган недавно показал на сайте X метод локального запуска продвинутой модели R1 компании DeepSeek с 8-битным квантованием, устраняющий необходимость в дорогостоящих графических процессорах, по заявленной стоимости $6,000. Ключ? Наличие большого количества памяти в противовес огромным запасам вычислительной мощности.

Daniel Miron (перевод Ninh Duy), Опубликовано 05 February 2025 🇺🇸 🇫🇷 ...

AI Софт

Модель DeepSeek-R1, выпущенная 20 января 2025 года, представляет собой модель Mixture-of-Experts (MoE) с 671B параметрами и 37B активными параметрами на токен. Разработанная для продвинутых рассуждений, она поддерживает 128K входов для токенов и генерирует до 32K токенов. Благодаря архитектуре MoE она обеспечивает высочайшую производительность, используя при этом меньше ресурсов, чем традиционные плотные модели.

Независимое тестирование https://docsbot.ai/models/compare/o1-preview/deepseek-r1#benchmarks показало, что языковая модель R1 достигает производительности, сравнимой с O1 от OpenAI, что делает ее конкурентоспособной альтернативой в приложениях ИИ с высокими ставками. Давайте выясним, что нам нужно, чтобы запустить ее локально.

Аппаратное обеспечение

Эта сборка основана на двух процессорах AMD Epyc и 768 ГБ оперативной памяти DDR5 - дорогие графические процессоры не нужны.

Корпус: Enthoo Pro 2 Server
Материнская плата: Gigabyte MZ73-LM0 или MZ73-LM1 (имеет два процессорных гнезда и 24 слота для оперативной памяти)
Процессор: 2x AMD Epyc 9004/9005 (9115 или 9015 подойдут как более бюджетные варианты)
Охлаждение: Arctic Freezer 4U-SP5
Оперативная память: 24x 32GB DDR5 RDIMM (всего 768 ГБ)
Хранилище: 1TB+ NVMe SSD (для быстрой загрузки 700 ГБ модельных весов)
Блок питания: Corsair HX1000i (1000 Вт, достаточно для двух процессоров)

Программное обеспечение и настройка

После сборки установите Linux и llama.cpp должны быть установить для запуска модели. Важнейший твик BIOS - установка групп NUMA на 0 - удваивает эффективность оперативной памяти для повышения производительности. Полный 700-гигабайтный массив DeepSeek-R1 можно скачать с сайта Hugging Face.

Производительность

Эта установка генерирует 6-8 жетонов в секунду - совсем неплохо для полностью локальной модели ИИ высокого класса. Она полностью обходится без GPU, но это намеренно. Выполнение квантования Q8 (для высокого качества) на GPU потребовало бы 700 ГБ+ VRAM и стоило бы более $100K. Несмотря на всю свою мощь, вся система потребляет менее 400 Вт, что делает ее удивительно эффективной.

Для тех, кто хочет получить полный контроль над передовым ИИ, без облаков и ограничений, эта система станет революционным решением. Он доказывает, что высококлассный ИИ можно запускать локально, с открытым исходным кодом, при этом уделяя первостепенное внимание конфиденциальности данных, минимизируя уязвимость к взломам и исключая зависимость от внешних систем.

Источник(и)

Мэтью Кэрриган на сайте X, Docsbot, DeepSeekтизерное изображение: Pixabay

Ещё по теме

Выпущен DeepSeek-V3-0324 с улучшенной производительностью и возможностями. (Источник изображения: DeepSeek)

DeepSeek выпускает улучшенную модель искусственного интеллекта V3 через три месяца после первого запуска 29 March 2025

Китайская армия НОАК использует ИИ DeepSeek для улучшения поддержки операций 24 March 2025

Процессоры Zhaoxin успешно развертывают модели ИИ DeepSeek-R1 на местах. На фото: Процессоры KH-4000/32 и KX-7000/8, предлагаемые компанией Zhaoxin. (Источник изображения: Zhaoxin)

Zhaoxin внедряет модели DeepSeek-R1 во все линейки процессоров, от настольных компьютеров до серверов 25 February 2025

DeepSeek принят на вооружение двумя китайскими производителями электромобилей (Источник изображения: Dado Ruvic/Reuters)

Два китайских производителя электромобилей объявили об интеграции DeepSeek 08 February 2025

Microsoft теперь помечает бесплатны...

OpenAI позволяет проводить поиск в ...

Автор исходного текста: Daniel Miron - Tech Writer - 8 статей на Notebookcheck c 2025 года

Автор перевода: Нин Нгок Дуй (Ninh Ngoc Duy) - Помощник редакции - 521685 статей на Notebookcheck c 2008 года

Будучи помощником редакции, я отвечаю за пополнение нашей Библиотеки, в которой собраны обзоры с самых разных сторонних порталов. Помимо этого, каждый день я выбираю наиболее интересные материалы Notebookcheck для их последующего перевода на французский, испанский, португальский, нидерландский и другие языки.

contact me via: Facebook

Этот важный материал точно понравится твоим друзьям в социальных сетях!