Whisper-Medusa - новая модель ИИ для распознавания речи с открытым исходным кодом от компании aiOla, утверждающая, что она на 50% быстрее, чем Whisper от OpenAI
aiOla израильская компания, основанная в 2019 году, специализируется на решениях на основе искусственного интеллекта для оцифровки бумажных рабочих процессов. Недавно компания представила Whisper-Medusa, модель ИИ с открытым исходным кодом, которая представляет собой комбинацию OpenAI's Whisper и технологии aiOla. Она утверждает, что работает более чем на 50% быстрее, сохраняя при этом высокую точность. Такая скорость достигается благодаря уникальному методу предсказания токенов, предсказывающему десять токенов за раз вместо одного, как показано в OpenAIwhisper.
Whisper-Medusa был разработан с использованием слабого надзора. Этот процесс включает в себя использование Whisper для расшифровки аудиоданных, которые затем служат метками для обучения модулей предсказания лексем Medusa.
Whisper-Medusa может стать отличным подспорьем для предприятий, которые все еще полагаются на бумажные рабочие процессы в повседневной деятельности. Технология aiOla с помощью своей внутренней системы "aiOla Jargonic" может помочь работникам различных отраслей. Например, в пищевой промышленности aiOla оптимизировала контроль качества, преобразовав ручные контрольные списки в цифровые рабочие процессы. Компания утверждает, что весь процесс "так же прост, как загрузка фотографии или файла с Вашими существующими процессами".
Поддерживая более 100 языков и различные акценты, Whisper-Medusa может быть полезен в таких отраслях, как авиация, производство продуктов питания, логистика и здравоохранение. Преобразуя неструктурированные речевые данные в действенные идеи, предприятия смогут сократить свои расходы и улучшить распределение ресурсов.
Желающие могут найти файлы с открытым исходным кодом на сайтах Hugging Face и GitHub.
Источник(и)
aiOla через PR Newswire