Notebookcheck Logo

Видеогенератор с открытым исходным кодом ИИ Pyramid Flow теперь доступен онлайн

Кадр из короткого видеоролика, созданного с помощью Pyramid Flow (Источник изображения: Pyramid Flow на GitHub)
Кадр из короткого видеоролика, созданного с помощью Pyramid Flow (Источник изображения: Pyramid Flow на GitHub)
Pyramid Flow, родом из Китая, - это модель ИИ с открытым исходным кодом, способная создавать виртуальные видеоролики высокого разрешения (768p). По словам команды, создавшей эту модель, она может сгенерировать пятисекундное видео в разрешении 384p менее чем за минуту. Лицензия MIT распространяется на Pyramid Flow, которая прошла обучение на наборах данных с открытым исходным кодом.

Уже ставшая популярной в обучающих видеороликах на YouTube, Pyramid Flow - это новая модель искусственного интеллекта, которая была обучена на открытых наборах данных, насчитывающих около 10 миллионов видео. Pyramid Flow - это работа команды, объединившей исследователей ИИ из Пекинского университета, Kuaishou Technology и Пекинского университета почт и телекоммуникаций, и сама модель является открытым исходным кодом. В соответствии с условиями лицензии MIT Licenseона может генерировать виртуальный видеоконтент высокого разрешения (768p), и, конечно же, она явно выигрывает, когда приходится иметь дело с 384p. По словам создателей, он может создать пятисекундный ролик менее чем за минуту (используя графический процессор A100 в нераскрытой аппаратной конфигурации).

В некоторых сценариях Pyramid Flow преуспевает. Однако при работе с определенными текстовыми подсказками результаты далеко не всегда удовлетворительны. Как и в случае со многими приложениями генеративного ИИ, работа с таким инструментом сопряжена с определенной долей случайности. Положительным моментом является то, что эта модель использует гораздо меньше вычислительной мощности, чем ее конкуренты, и, поскольку ее код имеет открытый исходный код, она может использоваться в локальных или облачных приложениях теми, кто в этом заинтересован, без необходимости заморачиваться с лицензированием.

Однако исследователи ИИ, создавшие Pyramid Flow, перечислили все наборы данных, использованные при его обучении, но ничего не сказали о проблемах с авторскими правами, которые могут возникнуть. Хотя некоторые создатели контента утверждают, что виртуальные видео, созданные с использованием материалов с открытым исходным кодом, нарушают права правообладателей, Pyramid Flow может быть полезен для тонкой настройки такого рода контента без привлечения третьих лиц.

Те, кто интересуется искусственным интеллектом с точки зрения открытого исходного кода, могут приобрести книгу Open-Source AI: The Future of Data Research by J.D. TjonWolf на Amazon по цене $9,99 (Kindle) или $12,99 (мягкая обложка).

Этот важный материал точно понравится твоим друзьям в социальных сетях!
'
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2024 год, 10 месяц > Видеогенератор с открытым исходным кодом ИИ Pyramid Flow теперь доступен онлайн
Codrut Nistor, 2024-10-15 (Update: 2024-10-15)