Meta Luncurkan Model AI NotebookLlama, Bisa Ubah Dokumen Jadi Podcast
15-November-24, 14:30Laporan kumpulan berita terkini dari berbagai media nasional - Induk Facebook, Instagram, dan WhatsApp, Meta, memperkenalkan model kecerdasan buatan (AI) NotebookLlama. Model AI NotebookLlama ini adalah sebuah proyek sumber terbuka (open-source) yang dirancang untuk memproses dokumen teks dan mengubahnya menjadi podcast interaktif.
NotebookLlama sejatinya adalah versi terbuka dari NotebookLM milik Google dengan fungsi yang serupa.
Sebagai proyek open-source, para pengembang dapat mengintegrasikan NotebookLlama dengan aplikasi dan alur kerja yang sesuai dengan kebutuhan mereka.
Hal ini juga memungkinkan komunitas untuk berkontribusi dalam pengembangan dan peningkatan kemampuan NotebookLlama.
Para pengembang dapat mengakses "resep" NotebookLlama melalui link berikut ini. Sementara akses untuk pengguna umum bisa dilihat di sini.
Berbeda dengan pendekatan NotebookLM Google yang lebih fokus pada riset dan akademik, NotebookLlama dapat dikustomisasi untuk aplikasi yang lebih luas, termasuk penggunaan sosial dan interaksi konten dalam ekosistem Meta.
NotebookLlama mampu memahami dan membuat intisari teks dari berbagai sumber. Dengan demikian, model AI ini dapat membantu pengguna mengelola catatan panjang menjadi ringkasan yang lebih singkat.
Pengguna dapat menggunakan file PDF, transkrip webinar, YouTube, artikel website, dan dokumen lainnya sebagai sumber.
Setelah mengunggah dokumen, AI akan memprosesnya, membuat ringkasan, dan mengonversinya menjadi audio interaktif.
Model AI yang Dipakai
NotebookLlama menggunakan beberapa model AI spesifik, termasuk model AI Llama yang dikembangkan oleh Meta, untuk memproses dokumen hingga mengonversinya menjadi audio interaktif.
- Llama 3.2 1B/3B untuk pra-pemrosesan dokumen PDF - model ini digunakan untuk memahami struktur dokumen, memproses format, dan mengekstrak informasi kunci.
- Llama 3.1 70B untuk pembuatan transkrip - model dengan kapasitas besar ini bekerja pada tahap transkripsi untuk menangkap detail teks dengan akurasi tinggi.
- Llama 3.1 8B untuk penulisan ulang - model ini mengolah hasil transkrip menjadi ringkasan atau versi yang lebih terstruktur, membantu meningkatkan keterbacaan.
- Model Parler TTS untuk Text-to-Speech - ini mengonversi teks yang sudah diproses menjadi audio, sehingga pengguna dapat mendengar konten secara langsung.
Sebagai perbandingan, berikut adalah contoh demo podcast yang dibuat dengan NotebookLlama Meta.
Menurut laporan TechCrunch sebagaimana dihimpun KompasTekno pada Rabu (30/10/2024), podcast yang dihasilkan oleh NotebookLlama dinilai tidak terdengar sebagus yang dihasilkan oleh NotebookLM.
Dalam sampel NotebookLlama, suara podcast dinilai terdengar seperti robot dan percakapan tidak mengalir dengan mulus.
Namun, para peneliti Meta yang mengerjakan proyek NotebookLlama ini menyatakan bahwa kualitas audio NotebookLlama dapat ditingkatkan dengan model yang lebih kuat di masa mendatang.