Analisis cluster (gerombol)

  • Pencipta
    Topik
  • #1164
    Nabila sina

    Assalamu’alaikum
    Selamat Malam Pak/Bu, saya mahasiswa matematika UIN Jakarta ingin bertanya mengenai mata kuliah analisis multivariat khususnya analisis cluster.

    Dalam analisis cluster tidak ada pembedaan variabel bebas dan tak bebas, sedangkan asumsi multikolinearitas harus dipenuhi dimana saat menghitung nilai VIF (pada SPSS) harus dibedakan antara variabel bebas dan tak bebas.

    Pertanyaan saya, dari 4 variabel yang saya punya, variabel mana yg saya jadikan variabel tak bebas? Apa ada ketentuannya?

    X1 : jumlah tempat ibadah
    X2 : jumlah pendidikan islam
    X3 : jumlah bank syariah
    X4 : jumlah KUA

    Terima kasih Pak/Bu
    Mohon Bantuannya.

    Wassalamu’alaikum.

Melihat 10 balasan - 1 sampai 10 (dari total 12)
  • Penulis
    Balasan
  • #1174
    R-Stats
    Keymaster

    Uji mutikolineritas dapat dilakukan ketika kita mengolah data menggunakan analisis regresi dengan SPSS. Pada proses tersebut kita memerlukan variabel independen sebagai alat bantu untuk menghitung VIF.

    Hasil uji VIF ternyata tidak dipengaruhi oleh variabel dependen. Dengan demikian kita bisa menggunakan variabel dummy yang akan digunakan sebagai variabel dependen dalam proses regresi linier.

    Selain itu kita juga bisa mengunakan variabel independen \((x_j)\) secara bergantian menjadi variabel dependen. Untuk bisa mempelajarinya lebih lanjut, maka silakan baca tanya jawab di topik Asumsi Mutikolinieritas.

    #1192
    Sultan

    Maaf numpang nanya disini. Apakah analisis cluster harus bersih dari outlier atau tidak ? Terimakasih

    #1194
    R-Stats
    Keymaster

    Tidak harus, jika outlier bukan berasal dari kesalahan pengambilan sampel maka outlier tidak usah dibersihkan.

    #1197
    Sultan

    Data yang mana yang di clustering ? Data yg sudah di standarisasi atau yang belum.

    #1203
    R-Stats
    Keymaster

    Dalam analisis cluster, jika kita memiliki variabel-variabel dengan skala atau satuan yang berbeda-beda (misalnya inchi, meter, persen, kg, dan lain-lain) maka variabel-variabel tersebut harus distandarisasi. Hal ini sangat penting karena pengelompokan dalam analisis cluster ditentukan berdasarkan jarak antara titik-titik dalam ruang dalam satuan yang sama.

    #1205
    Sultan

    Bagaimana cara tau berapa banyak kelompok yang paling bagus untuk metode hirarki ? Dilihat mananya

    #1207
    R-Stats
    Keymaster

    Tidak ada aturan khusus untuk banyaknya kelompok yang dihasilkan. Semua tergantung pada pilihan peneliti secara subjektif saja atau tergantung kebutuhan.

    #1215
    Sultan

    Misalkan data terdapat multikolinearitas kemudian dilakukan analisis komponen utama. Apakah data yang sudah diperoleh dari PCA yang akan dilakukan clustering ?

    #1216
    R-Stats
    Keymaster

    Syarat analisis cluster adalah variabel-variabel yang digunakan sebagai dasar clustering tidak mengandung multikolinieritas.

    Untuk mengatasi multikolinieritas kita bisa melakukan analisis komponen utama (PCA). Hasil dari PCA akan membentuk variabel-variabrl baru yang tidak mengandung multikolinieritas.

    Variabel baru inilah yang digunakan sebagai dasar untuk clustering.

    #4306
    Nabila

    Terima kasih untuk jawaban sebelumnya pak/bu.
    Saya ingin bertanya lagi. Ternyata 1 dari 4 variabel yg saya punya terindikasi multikol (vif>10). Lalu saya lakukan analisis komponen utama, dan menghasilkan 1 variabel baru (PC1).
    Yang ingin saya tanyakan variabel mana saja yg digunakan utk clustering? Apakah variabel PC1 saja atau 3 variabel non multikol + variabel PC1 (menggantikan variabel yg multikol)?
    Mohon bantuannya

Melihat 10 balasan - 1 sampai 10 (dari total 12)
  • Anda harus log masuk untuk menambahkan jawaban.