Конвертер электронных книг в аудиокниги с открытым исходным кодом поддерживает более 1000 языков
Разработчик Дрю Томассон (Drew Thomasson) недавно выпустил версию 2.0 популярного проекта ebook2audiobook. В версии 2.0 появился новый графический интерфейс, легкий доступ к точным моделям и простой в использовании инсталлятор для локальной установки на Mac, Windows и Linux. Однако эти возможности - лишь верхушка айсберга того, на что способна ebook2audiobooks.
Используя комбинацию проектов ИИ с открытым исходным кодом, ebook2audiobook создает аудиокниги с полными главами и метаданными и даже способен клонировать голос. Для этого ebook2audiobook берет совместимые электронные книги без DRM и конвертирует их в пригодный для использования формат с помощью Calibre. Затем книга разбивается на главы, чтобы помочь организовать аудио для электронной книги. Наконец, электронная книга преобразуется в аудио с помощью комбинации Coqui XTTSv2 и Fairseq. Coqui предоставляет модель преобразования текста в речь, которая создает высококачественный звук и позволяет пользователям использовать свой голос для повествования. Благодаря модели Fairseq, разработанной Facebook, пользователям доступно более 1 107 языков.
Хотя версия 2.0 включает в себя более простой метод локальной установки на различные операционные системы, проект также размещен на сайтах Hugging Face и Google Colabчто делает его гораздо более доступным. Однако важно отметить, что преобразование электронной книги в аудио - это длительный процесс. Кроме того, пользователи, использующие Hugging Face для конвертирования электронной книги, ограничены бесплатным уровнем вычислительной мощности, что приводит к замедлению времени рендеринга и потенциальным тайм-аутам. Однако для пользователей, желающих запустить проект локально, технические требования вполне разумны: проект рассчитан на работу всего с 4 Гб оперативной памяти. Для получения дополнительной информации или для того, чтобы попробовать проект, пожалуйста, посетите ресурсы ниже.