Grok получил новую модель генерации изображений с возможностями рендеринга текста и лиц
компания xAI на сайте только что добавила генерацию изображений в Grok, что является шагом вперед для платформы. В настоящее время эта функция доступна пользователям X в некоторых странах, а глобальное распространение ожидается примерно через неделю.
Генератор изображений, первоначально называвшийся Aurora, а теперь ставший частью семейства Grok, использует причудливую систему авторегрессионной смеси экспертов, обученную на миллиардах примеров из Интернета. По сути, она может предсказывать следующие биты информации, комбинируя текст и изображения, что позволяет ей создавать гораздо более реалистичные изображения, чем раньше.
Но дело не только в создании изображений с нуля. Эта система также может брать существующие изображения и позволять пользователям подправлять их или использовать в качестве вдохновения для новых творений. xAI утверждает, что модель особенно хорошо справляется с теми областями, в которых другие генераторы испытывают трудности, например, с правильной передачей текста, логотипов и человеческих лиц.
Это обновление вышло сразу после выпуска Grok 1.5V в апреле, благодаря которому платформа впервые попробовала себя в визуальной обработке. И xAI не останавливается на достигнутом - они заняты модернизацией своего суперкомпьютера Colossus в Мемфисе, который уже имеет 100 000 графических процессоров Nvidia H100 и H200 и планирует удвоить это число в ближайшее время.
Этот запуск интересен тем, что OpenAI только что выпустила свою собственную модель генерации видео, Sora, что делает очевидным обострение конкуренции в области генеративного ИИ между крупными игроками.