Tencent запускает новый генератор "текст в видео" Hunyuan Video
Китайский технологический конгломерат Tencent запустил на сайте новый инструмент для создания видео из текста под названием Hunyuan Video. Он основан на модели фундамента компании Hunyuan с более чем 13 миллиардами параметров.
Инструмент может генерировать пятисекундные видеоролики с разрешением до 1280x720 (720p). Tencent утверждает, что его усовершенствованная архитектура 3D VAE может поддерживать "превосходную визуальную согласованность" и иметь "плавные, естественные движения"
Генератор использует мультимодальную языковую модель (MLLM), основанную на кодировании текста, и "превосходит предыдущие современные модели" с показателями выравнивания текста до 68,5%. Согласование текста измеряет, насколько модель искусственного интеллекта следует Вашим подсказкам и насколько точно результат соответствует Вашим требованиям. Tencent утверждает, что инструмент также имеет 96,4% визуальных оценок качества.
Инструмент имеет открытый исходный код https://github.com/Tencent/HunyuanVideo и использует в качестве валюты кредиты https://hunyuanvideoai.com/pricing.php. Для создания одного видео Вам потребуется 15 кредитов, и Tencent предлагает различные пакеты кредитов, которые Вы можете приобрести. Пакет из 150 кредитов обойдется Вам в $9,99 (€9,48 или £7,85). Пакет из 750 кредитов продается за $44,99 (€42,70 или £35,34), а за $79,99 (€75,93 или £62,83) Вы получите 1500 кредитов.
Создание видео с помощью искусственного интеллекта быстро становится прибыльным бизнесом для больших технологий, а такие компании, как OpenAI, Google, Metaи Amazon все бросают свою шляпу в кольцо. Китайские технологические гиганты Kuaishou и Alibaba тоже не остаются в стороне.