ABSTRAK
Teknik fuzzy clustering untuk pengelompokan dokumen (document clustering) umumnya belum bersifat semi-supervised. Pada Tugas Akhir ini digunakan metode fuzzy clustering yang bersifat semi-supervised. Algoritma yang digunakan adalah algoritma Active Fuzzy Constrained Clustering (AFCC). AFCC adalah algoritma clustering yang mengkombinasikan fuzzy clustering dengan semi-supervised clustering, namun pada saat ini algorima ini baru digunakan untuk pengelompokan data berupa image. Sehingga pada Tugas Akhir ini, AFCC dimodifikasi agar dapat digunakan untuk pengelompokan dokumen teks. Dokumen teks pada umumnya bersifat semi-structured. Sehingga agar dapat dikelompokan menggunakan AFCC, dokumen teks harus terlebih dahulu dimodelkan menjadi sebuah bentuk yang lebih terstruktur. Pada Tugas Akhir ini, dokumen direpresentasikan sebagai bag-of-words. Kemudian, dokumen dimodelkan sebagai vektor dalam Vector Space Model (VSM). Pada Tugas Akhir ini, hasil analisis AFCC untuk pengelompokan dokumen tersebut diimplementasikan pada perangkat lunak DocAFCC. Perangkat lunak ini menerima masukan berupa dokumen berbahasa Inggris yang memiliki format yang sama dengan dokumen-dokumen dalam Twenty News Group Text Data, dan menghasilkan keluaran berupa dokumen-dokumen masukan yang telah dikelompokan. Pengujian dilakukan terhadap perangkat lunak tersebut menggunakan masukan dokumen dan parameter yang berbeda untuk mengetahui pengaruh dari masing-masing parameter terhadap akurasi hasil clustering. Pada Tugas Akhir ini disimpulkan bahwa AFCC dapat diterapkan untuk pengelompokan dokumen. Akurasi dari cluster yang dihasilkan dipengaruhi oleh parameter-parameter yang digunakan pada saat proses clustering dilakukan. Disimpulkan pula bahwa pendekatan semi-supervised clustering dapat membantu meningkatkan akurasi hasil clustering.
Kata Kunci: document clustering, fuzzy clustering, semi-supervised clustering, algoritma Active Fuzzy Constrained Clustering, Vector Space Model (VSM).
File Selengkapnya.....