Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek/cases berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi set variabel secara empiris sebaliknya menggunakan set variabel yang ditentukan oleh peneliti itu sendiri.
Fokus dari analisis cluster adalah membandingkan objek berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan set variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah suatu set variabel yang merepresentasikan karakteristik yang dipakai objek-objek. Bedanya dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokkan objek sedangkan analisis faktor terfokuspada kelompok variabel.
Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi cluster secara keseluruhan bergantung pada variabel-variabel yang digunakan sebagai dasar untuk menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang relevan dapat mempengaruhi substansi hasil analisis cluster.
Algoritma cluster harus dapat memaksimalkan perbedaan relatif cluster terhadap variasi dalam cluster. Ada tiga metode analisa cluster yang dapat digunakan, yaitu metode grafik, metode hirarki dan metode non hirarki.Dua metode paling umum dalam algoritma cluster adalah metode hirarki dan metode non hirarki. Penentuan metode mana yang akan dipakai tergantung kepada peneliti dan konteks penelitian dengan tidak mengabaikan substansi, teori dan konsep yang berlaku. Ketiganya memilii kelebihan sendiri-sendiri.
Keuntungan metode hirarki adalah cepat dalam proses pengolahan sehingga menghemat waktu, namun kelemahannya adalah metode ini dapat menimbulkan kesalahan. Sama dengan metode grafik, metode hirarki tidak baik diterapkan untuk menganalisis sampel dengan ukuran besar. Metode non hirarki memiliki keuntungan lebih daripada metode hirarki. Hasilnya memiliki sedikit kelemahan pada data outlier, ukuran jarak yang digunakan, dan termasuk variabel tak relevan atau variabel yang tidak tepat. Keuntungannya hanya dengan menggunakan titik bakal nonrandom, penggunaan metode non hirarki untuk titik bakal random secara nyata bukuk daripada metode hirarki.
Sumber: Modul Pelatihan Statistik. Analisa statitik II. Universitas Indonesia. 2014.
No comments:
Post a Comment
hanya 5% komentar yang akan dimuat. Biasanya sih komentar cerdas. Jadi jangan sia-siakan waktu kamu hanya untuk nyepam