Analisis Peringkasan Teks Otomatis menggunakan Algoritma Text Rank
DOI:
https://doi.org/10.33857/patj.v8i2.918Keywords:
Implementasi, Berita Teknologi, Peringkasan Teks Otomatis, TextRankAbstract
Kemajuan teknologi informasi dan komunikasi dalam beberapa tahun terakhir telah memungkinkan akses yang lebih mudah dan cepat terhadap berbagai informasi, termasuk berita, melalui platform online. Perkembangan ini membuat masyarakat semakin terbiasa mendapatkan informasi secara real-time. Namun, salah satu tantangan yang dihadapi oleh para pembaca adalah banyaknya teks berita yang panjang dan bertele-tele, sehingga menyulitkan mereka untuk segera mendapatkan inti dari berita tersebut. Situasi ini mendorong perlunya solusi yang dapat membantu menyajikan informasi secara lebih ringkas dan efisien tanpa mengurangi substansi beritanya. Salah satu pendekatan yang dapat digunakan untuk mengatasi masalah tersebut adalah dengan menerapkan algoritma TextRank dan metode Word2Vec dalam proses peringkasan teks otomatis. Algoritma TextRank merupakan salah satu teknik pemeringkatan graf yang digunakan untuk memilih kalimat-kalimat penting dari teks, sedangkan Word2Vec digunakan untuk membangun representasi vektor dari kata-kata dalam teks yang dapat menggambarkan hubungan semantik antar kata. Langkah pertama dalam implementasi ini adalah pengambilan data berita menggunakan teknik web scraping, yang memungkinkan pengumpulan berita dari berbagai sumber secara otomatis. Setelah itu, data yang diperoleh akan melalui tahap preprocessing untuk menghapus karakter-karakter yang tidak relevan dan membersihkan teks dari noise. Selanjutnya, teks yang telah diproses akan direpresentasikan dalam bentuk vektor dan dibangun menjadi graf untuk dilakukan pemeringkatan menggunakan algoritma TextRank. Algoritma ini kemudian menghasilkan ringkasan berita yang lebih singkat namun tetap mencakup informasi penting dari berita aslinya. Berdasarkan evaluasi menggunakan metrik ROUGE, hasil penelitian menunjukkan bahwa algoritma TextRank memiliki akurasi recall yang cukup baik, yaitu 81%. Ini menunjukkan bahwa ringkasan yang dihasilkan oleh sistem sangat mendekati kualitas ringkasan manual (gold standard), yang menandakan efektivitas dan potensi algoritma TextRank dalam peringkasan teks otomatis untuk berita onlineDownloads
Additional Files
Published
2025-02-18
Issue
Section
Articles
License
Authors who publish with this journal agree to the following terms:
- The copyright of the accepted for publication articles shall be assigned to patria artha technologocal journal as the publisher of the journal. The intended copyright includes the rights to publish articles in various forms (including reprints).
- Patria artha technologocal journal maintain the publishing rights of the published articles.
- Authors are permitted to republish or disseminate published articles by sharing the link/DOI of the article at patria artha technologocal journal. Authors are allowed to use their articles for any legal purposes deemed necessary without written permission from patria artha technologocal journal with an acknowledgment of initial publication to this journal.

This work is licensed under a Creative Commons Attribution 3.0 License