Видеогенератор с открытым исходным кодом ИИ Pyramid Flow теперь доступен онлайн
Уже ставшая популярной в обучающих видеороликах на YouTube, Pyramid Flow - это новая модель искусственного интеллекта, которая была обучена на открытых наборах данных, насчитывающих около 10 миллионов видео. Pyramid Flow - это работа команды, объединившей исследователей ИИ из Пекинского университета, Kuaishou Technology и Пекинского университета почт и телекоммуникаций, и сама модель является открытым исходным кодом. В соответствии с условиями лицензии MIT Licenseона может генерировать виртуальный видеоконтент высокого разрешения (768p), и, конечно же, она явно выигрывает, когда приходится иметь дело с 384p. По словам создателей, он может создать пятисекундный ролик менее чем за минуту (используя графический процессор A100 в нераскрытой аппаратной конфигурации).
В некоторых сценариях Pyramid Flow преуспевает. Однако при работе с определенными текстовыми подсказками результаты далеко не всегда удовлетворительны. Как и в случае со многими приложениями генеративного ИИ, работа с таким инструментом сопряжена с определенной долей случайности. Положительным моментом является то, что эта модель использует гораздо меньше вычислительной мощности, чем ее конкуренты, и, поскольку ее код имеет открытый исходный код, она может использоваться в локальных или облачных приложениях теми, кто в этом заинтересован, без необходимости заморачиваться с лицензированием.
Однако исследователи ИИ, создавшие Pyramid Flow, перечислили все наборы данных, использованные при его обучении, но ничего не сказали о проблемах с авторскими правами, которые могут возникнуть. Хотя некоторые создатели контента утверждают, что виртуальные видео, созданные с использованием материалов с открытым исходным кодом, нарушают права правообладателей, Pyramid Flow может быть полезен для тонкой настройки такого рода контента без привлечения третьих лиц.
Те, кто интересуется искусственным интеллектом с точки зрения открытого исходного кода, могут приобрести книгу Open-Source AI: The Future of Data Research by J.D. TjonWolf на Amazon по цене $9,99 (Kindle) или $12,99 (мягкая обложка).
Источник(и)
Пирамидальный поток (на GitHub, через Tech Xplore)