Notebookcheck Logo

Open NotebookLM использует подход с открытым исходным кодом для преобразования PDF-файлов в подкасты.

Open NotebookLM (Источник изображения: gabrielchua на Hugging face)
Open NotebookLM (Источник изображения: gabrielchua на Hugging face)
Разработчик Габриэль Чуа (Gabriel Chua) выпустил свой ответ на набирающий популярность конвертер PDF в подкасты notebookLM от Google. Open NotebookLM повторяет возможности Google, сочетая различные модели с открытым исходным кодом.

Для тех, кто не знаком с экспериментом Google в области искусственного интеллекта, NotebookLM - это платформа исследовательского ассистента, которая принимает загруженные пользователем документы и использует Gemini 1.5 pro, чтобы предложить подход, основанный на заметочном чтении, для взаимодействия с информацией, содержащейся в документе. NotebookLM генерирует резюме всех документов, загруженных в блокнот пользователя, и позволяет пользователям задавать вопросы о материале. Как только информация обработана, NotebookLM отвечает на вопросы, приводя соответствующие цитаты из загруженных документов. Однако самой впечатляющей функцией является возможность генерировать подкасты на основе загруженных документов. Подкаст, созданный Gemini, берет отобранную ИИ информацию из документов. Он создает аудиофайл с записью дискуссии между двумя докладчиками на темы, найденные в материале, причем продолжительность аудиоклипов может составлять от пяти до тридцати минут. Однако некоторые пользователи могут сомневаться в том, стоит ли загружать материалы в проприетарный LLM, и в этом Open NotebookLM отличается от него.

Обладая простым и понятным пользовательским интерфейсом, Open NotebookLM был создан с использованием различных моделей с открытым исходным кодом и преобразованием текста в речь для превращения PDF-файлов в подкасты. Для обработки PDF Open NotebookLM использует Llama 3.1 с ограничением в 100 тысяч символов. MeloTTS, хотя и не обладает такими же возможностями, как Gemini, обеспечивает хорошую производительность преобразования текста в речь для проекта, а пользователи могут настраивать тон ИИ между "веселым" и "официальным" Кроме того, Open NotebookLM поддерживает чуть более десяти языков, среди которых есть испанский, французский и немецкий. В настоящее время пользователи могут попробовать проект на странице Чуа "Hugging face" или собрать его локально из ресурсов, доступных на репозитории проекта на GitHub.

Источник(и)

Габриэль Чуа на Обнимая лицо и на Github

Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo
'
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2024 год, 10 месяц > Open NotebookLM использует подход с открытым исходным кодом для преобразования PDF-файлов в подкасты.
Stephen Pereyra, 2024-10- 2 (Update: 2024-10- 2)