Open NotebookLM использует подход с открытым исходным кодом для преобразования PDF-файлов в подкасты.
Для тех, кто не знаком с экспериментом Google в области искусственного интеллекта, NotebookLM - это платформа исследовательского ассистента, которая принимает загруженные пользователем документы и использует Gemini 1.5 pro, чтобы предложить подход, основанный на заметочном чтении, для взаимодействия с информацией, содержащейся в документе. NotebookLM генерирует резюме всех документов, загруженных в блокнот пользователя, и позволяет пользователям задавать вопросы о материале. Как только информация обработана, NotebookLM отвечает на вопросы, приводя соответствующие цитаты из загруженных документов. Однако самой впечатляющей функцией является возможность генерировать подкасты на основе загруженных документов. Подкаст, созданный Gemini, берет отобранную ИИ информацию из документов. Он создает аудиофайл с записью дискуссии между двумя докладчиками на темы, найденные в материале, причем продолжительность аудиоклипов может составлять от пяти до тридцати минут. Однако некоторые пользователи могут сомневаться в том, стоит ли загружать материалы в проприетарный LLM, и в этом Open NotebookLM отличается от него.
Обладая простым и понятным пользовательским интерфейсом, Open NotebookLM был создан с использованием различных моделей с открытым исходным кодом и преобразованием текста в речь для превращения PDF-файлов в подкасты. Для обработки PDF Open NotebookLM использует Llama 3.1 с ограничением в 100 тысяч символов. MeloTTS, хотя и не обладает такими же возможностями, как Gemini, обеспечивает хорошую производительность преобразования текста в речь для проекта, а пользователи могут настраивать тон ИИ между "веселым" и "официальным" Кроме того, Open NotebookLM поддерживает чуть более десяти языков, среди которых есть испанский, французский и немецкий. В настоящее время пользователи могут попробовать проект на странице Чуа "Hugging face" или собрать его локально из ресурсов, доступных на репозитории проекта на GitHub.
Источник(и)
Габриэль Чуа на Обнимая лицо и на Github