Diskusi Forum Statistika Analisis Cluster (Gerombol)

Topik ini mengandung 11 balasan dan terakhir diperbarui oleh  R-Stats 3 minggu yang lalu.

Melihat 12 tulisan - 1 sampai 12 (dari total 12)
  • Penulis
    Dilihat
  • #1164 Balasan

    Nabila sina

    Assalamu’alaikum
    Selamat Malam Pak/Bu, saya mahasiswa matematika UIN Jakarta ingin bertanya mengenai mata kuliah analisis multivariat khususnya analisis cluster.

    Dalam analisis cluster tidak ada pembedaan variabel bebas dan tak bebas, sedangkan asumsi multikolinearitas harus dipenuhi dimana saat menghitung nilai VIF (pada SPSS) harus dibedakan antara variabel bebas dan tak bebas.

    Pertanyaan saya, dari 4 variabel yang saya punya, variabel mana yg saya jadikan variabel tak bebas? Apa ada ketentuannya?

    X1 : jumlah tempat ibadah
    X2 : jumlah pendidikan islam
    X3 : jumlah bank syariah
    X4 : jumlah KUA

    Terima kasih Pak/Bu
    Mohon Bantuannya.

    Wassalamu’alaikum.

    #1174 Balasan

    R-Stats
    Keymaster

    Uji mutikolineritas dapat dilakukan ketika kita mengolah data menggunakan analisis regresi dengan SPSS. Pada proses tersebut kita memerlukan variabel independen sebagai alat bantu untuk menghitung VIF.

    Hasil uji VIF ternyata tidak dipengaruhi oleh variabel dependen. Dengan demikian kita bisa menggunakan variabel dummy yang akan digunakan sebagai variabel dependen dalam proses regresi linier.

    Selain itu kita juga bisa mengunakan variabel independen \((x_j)\) secara bergantian menjadi variabel dependen. Untuk bisa mempelajarinya lebih lanjut, maka silakan baca tanya jawab di topik Asumsi Mutikolinieritas.

    #1192 Balasan

    Sultan

    Maaf numpang nanya disini. Apakah analisis cluster harus bersih dari outlier atau tidak ? Terimakasih

    #1194 Balasan

    R-Stats
    Keymaster

    Tidak harus, jika outlier bukan berasal dari kesalahan pengambilan sampel maka outlier tidak usah dibersihkan.

    #1197 Balasan

    Sultan

    Data yang mana yang di clustering ? Data yg sudah di standarisasi atau yang belum.

    #1203 Balasan

    R-Stats
    Keymaster

    Dalam analisis cluster, jika kita memiliki variabel-variabel dengan skala atau satuan yang berbeda-beda (misalnya inchi, meter, persen, kg, dan lain-lain) maka variabel-variabel tersebut harus distandarisasi. Hal ini sangat penting karena pengelompokan dalam analisis cluster ditentukan berdasarkan jarak antara titik-titik dalam ruang dalam satuan yang sama.

    #1205 Balasan

    Sultan

    Bagaimana cara tau berapa banyak kelompok yang paling bagus untuk metode hirarki ? Dilihat mananya

    #1207 Balasan

    R-Stats
    Keymaster

    Tidak ada aturan khusus untuk banyaknya kelompok yang dihasilkan. Semua tergantung pada pilihan peneliti secara subjektif saja atau tergantung kebutuhan.

    #1215 Balasan

    Sultan

    Misalkan data terdapat multikolinearitas kemudian dilakukan analisis komponen utama. Apakah data yang sudah diperoleh dari PCA yang akan dilakukan clustering ?

    #1216 Balasan

    R-Stats
    Keymaster

    Syarat analisis cluster adalah variabel-variabel yang digunakan sebagai dasar clustering tidak mengandung multikolinieritas.

    Untuk mengatasi multikolinieritas kita bisa melakukan analisis komponen utama (PCA). Hasil dari PCA akan membentuk variabel-variabrl baru yang tidak mengandung multikolinieritas.

    Variabel baru inilah yang digunakan sebagai dasar untuk clustering.

    #4306 Balasan

    Nabila

    Terima kasih untuk jawaban sebelumnya pak/bu.
    Saya ingin bertanya lagi. Ternyata 1 dari 4 variabel yg saya punya terindikasi multikol (vif>10). Lalu saya lakukan analisis komponen utama, dan menghasilkan 1 variabel baru (PC1).
    Yang ingin saya tanyakan variabel mana saja yg digunakan utk clustering? Apakah variabel PC1 saja atau 3 variabel non multikol + variabel PC1 (menggantikan variabel yg multikol)?
    Mohon bantuannya

    #4311 Balasan

    R-Stats
    Keymaster

    Yang digunakan dalam analisis cluster adalah variabel baru hasil analisis komponen utama. Namun dalam analisis cluster, banyaknya variabel yang digunakan sebaiknya lebih dari satu variabel dan hasil analisis komponen di atas hanya menghasilkan satu variabel sehingga kurang baik digunakan untuk analisis cluster.

    Selain menggunakan analisis komponen utama, kita juga bisa menghilangkan multikolinieritas dengan cara mengurangi variabel. Untuk kasus di atas, coba kurangi satu variabel yang terindikasi multikolinearitas, selanjutnya lakukan analisis cluster.

Melihat 12 tulisan - 1 sampai 12 (dari total 12)
Balasan Untuk: Analisis Cluster (Gerombol)
Informasi Anda: