Frekuensi Dokumen Terbalik (Inverse Document Frequency)
Inverse Document Frequency (IDF) dalam ilmu informasi dan statistik, adalah metode untuk menentukan frekuensi kata dalam kumpulan data teks. Dalam kombinasi dengan Dalam Frekuensi Dokumen, Frekuensi Dokumen Balik membantu untuk membuat konten yang unik dan bahkan dapat mengganti kepadatan kata kunci sebagai skor kualitas yang telah lama digunakan untuk menentukan kualitas teks.
Apa Itu Inverse Document Frequency
Pada pertengahan 1960-an, peneliti AS C. W. Clevedon telah membuat prestasi signifikan dalam karyanya “Tes Cranfield pada perangkat bahasa indeks” untuk bobot penelitian. Salah satu tujuan dari pekerjaan ini adalah untuk mengindeks dokumen yang ada dengan lebih baik.
Akibatnya, matematikawan dan ahli statistik selalu berusaha untuk menemukan formula yang cocok untuk menentukan arti kata dalam kumpulan dokumen. Sementara topik awalnya dan pemilihan kata-kata tertentu dipertimbangkan, pandangan bahwa semua kata dalam dokumen harus digunakan untuk analisis untuk menentukan bobot istilah dalam keseluruhan teks akhirnya menang. Formula IDF pada akhirnya adalah hasil dari penelitian ini.
Frekuensi Dokumen Invers ditentukan oleh perhitungan logaritmik. Ini adalah rasio dari semua teks dan dokumen yang ada dari seluruh dataset dan jumlah teks yang berisi kata kunci yang ditentukan.
Rumus perhitungannya terlihat seperti ini:
![]()
dimana
= menunjukkan jumlah dokumen dan
= berisi jumlah dokumen yang berisi istilah
=. Jika frekuensi dokumen bertambah, fraksi menjadi lebih kecil.
Manfaat Inverse Document Frequency
Frekuensi dokumen terbalik saja dapat membantu menentukan kekhasan istilah kunci berdasarkan kumpulan dokumen yang ada. Namun, istilah bobot dalam dataset tidak menunjukkan apa pun tentang keunikan teks.
Oleh karena itu, rumus TF * IDF digunakan dalam pengoptimalan konten untuk dapat membandingkan hasilnya dengan dokumen sebelumnya. Penting dalam analisis adalah bahwa analisis situs web semacam itu tidak hanya memperhitungkan corpus teks murni, tetapi juga teks apa pun yang disematkan dalam kode sumber, dan juga judul halaman dan tag alt.
Tag: Apa Itu Inverse Document Frequency, Manfaat Inverse Document Frequency
