MSIM4310 — Analisis Dan Visualisasi Data
1. Nilai rata-rata dari data 5, 7, 8, 10, 12 adalah
- A. 8.2
- B. 8.4
- C. 8.6
- D. 8.8
2. Median dari data 3, 6, 8, 9, 12, 15 adalah
- A. 8.0
- B. 9.5
- C. 9.0
- D. 8.5
3. Modus dari data 4, 5, 5, 6, 7, 7, 7, 8 adalah
- A. 5
- B. 7
- C. 6
- D. 8
4. Rentang (range) dari data 15, 20, 25, 30, 35 adalah
- A. 10
- B. 15
- C. 25
- D. 20
5. Variansi dari data 2, 4, 6, 8, 10 adalah
- A. 8.0
- B. 10.0
- C. 6.0
- D. 12.0
6. Simpangan baku dari data 3, 5, 7, 9, 11 adalah
- A. 2.828
- B. 3.464
- C. 2.449
- D. 3.162
7. Jika data memiliki nilai ekstrem, ukuran pemusatan yang paling tepat adalah
- A. Mean
- B. Median
- C. Modus
- D. Rentang
8. Koefisien variasi digunakan untuk membandingkan penyebaran data dengan satuan berbeda. Rumusnya adalah
- A. (simpangan baku/mean) x 100%
- B. (mean/simpangan baku) x 100%
- C. simpangan baku x mean
- D. (rentang/mean) x 100%
9. Dua kelompok data: Kelompok A mean = 50, simpangan baku = 5. Kelompok B mean = 100, simpangan baku = 10. Manakah yang lebih bervariasi relatif?
- A. Kelompok A
- B. Kelompok B
- C. Sama
- D. Tidak bisa ditentukan
10. Nilai kuartil pertama (Q1) dari data 10, 12, 14, 16, 18, 20 adalah
- A. 14
- B. 13
- C. 12
- D. 15
11. Jangkauan interkuartil (IQR) dari data 5, 8, 12, 15, 20, 25, 30 adalah
- A. 20
- B. 15
- C. 17
- D. 13
12. Jika data berdistribusi normal, sekitar 95% data terletak dalam rentang
- A. mean plus minus 1 simpangan baku
- B. mean plus minus 3 simpangan baku
- C. mean plus minus 2 simpangan baku
- D. mean plus minus 4 simpangan baku
13. Skor Z untuk data 50 dari populasi mean 40 dan simpangan baku 8 adalah
- A. 1.00
- B. 1.50
- C. 1.25
- D. 0.80
14. Jika data memiliki mean 100 dan median 95, maka distribusi data cenderung
- A. Simetris
- B. Menceng kanan
- C. Menceng kiri
- D. Normal
15. Histogram yang menunjukkan frekuensi tinggi di ujung kiri dan ekor panjang di kanan disebut
- A. Distribusi menceng kanan
- B. Distribusi menceng kiri
- C. Distribusi normal
- D. Distribusi seragam
16. Dalam boxplot, titik yang berada di luar 1.5 kali IQR disebut
- A. Nilai tengah
- B. Kuartil
- C. Pencilan
- D. Median
17. Dua kelompok data berikut: Kelompok 1: 2,4,6,8,10. Kelompok 2: 5,5,5,5,5. Pernyataan yang benar adalah
- A. Kelompok 1 memiliki variansi lebih besar
- B. Mean kedua kelompok berbeda
- C. Kelompok 2 memiliki variansi lebih besar
- D. Kedua kelompok memiliki variansi sama
18. Dalam membandingkan dua kelompok data, ukuran apa yang paling tepat digunakan jika data mengandung pencilan?
- A. Rata-rata
- B. Modus
- C. Median
- D. Rentang
19. Diketahui kelompok A memiliki mean 50 dan standar deviasi 5, kelompok B memiliki mean 45 dan standar deviasi 10. Berdasarkan koefisien variasi, kelompok mana yang lebih bervariasi?
- A. Kelompok A
- B. Sama saja
- C. Kelompok B
- D. Tidak dapat ditentukan
20. Ketika membandingkan sebaran data dua kelompok, boxplot paling berguna untuk menunjukkan…
- A. Mean dan modus
- B. Median, kuartil, dan pencilan
- C. Hanya rata-rata
- D. Distribusi frekuensi
21. Dua kelompok data memiliki rentang interkuartil yang sama tetapi mean berbeda. Interpretasi yang tepat adalah…
- A. Penyebaran data di sekitar median berbeda
- B. Data tidak mengandung pencilan
- C. Penyebaran data di kuartil tengah sama
- D. Kedua kelompok identik
22. Dalam membandingkan dua kelompok data, jika salah satu kelompok memiliki skewness positif yang kuat, ukuran pemusatan yang paling representatif adalah…
- A. Median
- B. Rata-rata
- C. Modus
- D. Rentang
23. Untuk membandingkan variabilitas dua kelompok data dengan satuan berbeda, ukuran yang tepat adalah…
- A. Koefisien variasi
- B. Variansi
- C. Standar deviasi
- D. Rentang
24. Diketahui kelompok X: 10, 12, 14, 16, 18 dan kelompok Y: 5, 7, 9, 11, 13. Perbedaan mean antara kedua kelompok adalah…
- A. 3
- B. 4
- C. 5
- D. 6
25. Transformasi data bertujuan untuk…
- A. Menambah jumlah data
- B. Membuat data menjadi kategorikal
- C. Menghapus data yang hilang
- D. Mengubah skala atau distribusi data agar lebih sesuai untuk analisis
26. Manakah dari berikut ini yang merupakan contoh transformasi data yang umum?
- A. Transformasi logaritmik
- B. Menambahkan dua kolom
- C. Menghapus baris kosong
- D. Mengganti nama variabel
27. Transformasi Box-Cox termasuk dalam jenis transformasi…
- A. Non-linear
- B. Linear
- C. Kategorikal
- D. Diskrit
28. Jika data memiliki distribusi miring ke kanan (positif), transformasi yang paling cocok adalah…
- A. Transformasi kuadrat
- B. Transformasi logaritmik
- C. Transformasi linear
- D. Transformasi identitas
29. Tujuan utama transformasi data adalah untuk…
- A. Menambah varians data
- B. Membuat data lebih mudah dibaca
- C. Mengurangi ukuran dataset
- D. Memperbaiki normalitas atau linieritas hubungan
30. Dalam transformasi data, transformasi akar kuadrat paling sering digunakan untuk data…
- A. Proporsi atau persentase
- B. Count data yang rendah
- C. Data kontinu normal
- D. Data kategorikal
31. Transformasi data yang tepat untuk data proporsi adalah…
- A. Transformasi log
- B. Transformasi arcsin
- C. Transformasi Box-Cox
- D. Transformasi kuadrat
32. Transformasi data dapat mempengaruhi…
- A. Baik mean maupun varians data
- B. Hanya varians data
- C. Hanya mean data
- D. Tidak mempengaruhi statistik apapun
33. Transformasi data yang bersifat monotonik (misalnya log atau akar) bertujuan untuk…
- A. Mengubah urutan data
- B. Menggabungkan dua variabel
- C. Menghilangkan data pencilan
- D. Mempertahankan urutan relatif data
34. Transformasi data dengan menggunakan z-score termasuk dalam…
- A. Transformasi non-linear
- B. Transformasi logaritmik
- C. Transformasi pangkat
- D. Transformasi linear
35. Dalam transformasi data, jenis transformasi yang menggunakan fungsi logaritma natural (ln) termasuk dalam kategori…
- A. Transformasi linier
- B. Transformasi z-score
- C. Transformasi non-linier
- D. Transformasi rank
36. Transformasi Box-Cox adalah salah satu bentuk transformasi data yang bertujuan untuk…
- A. Menghilangkan outlier secara permanen
- B. Mengubah data kategorik menjadi numerik
- C. Menggandakan jumlah data
- D. Menstabilkan varians dan membuat data mendekati distribusi normal
37. Jika data memiliki kemencengan positif (positively skewed), transformasi yang paling tepat untuk mengurangi kemencengan tersebut adalah…
- A. Transformasi linier
- B. Transformasi kuadrat
- C. Transformasi logaritma
- D. Transformasi pangkat dua
38. Transformasi data dengan menggunakan akar kuadrat (sqrt) sangat cocok digunakan ketika data…
- A. Berupa data kategorik
- B. Berupa data biner
- C. Berupa data kontinu yang simetris
- D. Berupa data count atau hitungan yang rendah
39. Dalam transformasi data, jika kita menggunakan fungsi y' = y^2, maka transformasi ini termasuk dalam bentuk…
- A. Transformasi pangkat dengan lambda > 1
- B. Transformasi logaritma
- C. Transformasi akar
- D. Transformasi invers
40. Keuntungan utama dari transformasi data adalah…
- A. Menambah jumlah data
- B. Mengubah skala data tanpa mengubah hubungan antar variabel
- C. Menghilangkan semua outlier
- D. Membuat data menjadi lebih mudah diinterpretasi secara visual
41. Data hilang yang memiliki pola yang sama sekali tidak terduga dan tidak berhubungan dengan variabel lain disebut sebagai…
- A. Missing by Design
- B. Missing at Random (MAR)
- C. Missing Not at Random (MNAR)
- D. Missing Completely at Random (MCAR)
42. Jika probabilitas data hilang bergantung pada variabel lain yang teramati, tetapi tidak pada nilai variabel itu sendiri, maka jenis data hilang tersebut adalah…
- A. MAR
- B. MCAR
- C. MNAR
- D. Non-random missing
43. Contoh data hilang yang termasuk dalam kategori MNAR adalah…
- A. Responden tidak mengisi pendapatan karena lupa
- B. Responden dengan pendapatan tinggi sengaja tidak mengisi pendapatan
- C. Data hilang secara acak karena kerusakan alat
- D. Data hilang karena responden pindah alamat
44. Dampak utama dari data hilang pada analisis statistik adalah…
- A. Meningkatkan akurasi model
- B. Menyebabkan bias dan penurunan efisiensi estimator
- C. Mempercepat proses komputasi
- D. Menambah varians data
45. Dalam identifikasi pola data hilang, jika data hilang hanya terjadi pada satu variabel dan tidak terkait dengan variabel lain, pola tersebut disebut…
- A. Univariate missing pattern
- B. Monotone missing pattern
- C. Arbitrary missing pattern
- D. Systematic missing pattern
46. Missing Not at Random (MNAR) sering menjadi masalah serius dalam analisis karena…
- A. Data hilang dapat diabaikan tanpa bias
- B. Probabilitas data hilang tergantung pada variabel yang tidak teramati
- C. Data hilang selalu bersifat acak
- D. Data hilang mudah diperbaiki dengan interpolasi
47. Salah satu cara mendeteksi pola data hilang adalah dengan membuat matriks korelasi antara indikator missing (missing indicator) dan variabel lain. Jika korelasi signifikan, hal ini menunjukkan kemungkinan…
- A. MCAR
- B. MNAR
- C. MAR
- D. Data hilang acak sempurna
48. Data hilang yang disebabkan oleh kesalahan input operator termasuk dalam kategori…
- A. MNAR
- B. MAR
- C. MCAR
- D. Ignorable missing
49. Metode imputasi yang mengganti data hilang dengan rata-rata dari variabel tersebut disebut…
- A. Median imputation
- B. Mean imputation
- C. Regression imputation
- D. Hot deck imputation
50. Salah satu kelemahan dari metode listwise deletion (penghapusan kasus dengan data hilang) adalah…
- A. Mengurangi ukuran sampel secara signifikan dan potensial bias jika data tidak MCAR
- B. Menambah jumlah data
- C. Meningkatkan varians data
- D. Memerlukan komputasi yang kompleks
51. Metode multiple imputation menghasilkan…
- A. Beberapa set data imputasi yang kemudian digabungkan hasil analisisnya
- B. Satu set data lengkap tunggal
- C. Hanya estimasi parameter tanpa data imputasi
- D. Data yang dihapus secara otomatis
52. Teknik penanganan data hilang yang dilakukan dengan menghapus seluruh baris yang mengandung data hilang disebut dengan…
- A. listwise deletion
- B. pairwise deletion
- C. mean imputation
- D. regression imputation
53. Metode imputasi data hilang dengan menggantikan nilai yang hilang menggunakan rata-rata dari variabel yang sama disebut…
- A. hot-deck imputation
- B. multiple imputation
- C. mean imputation
- D. k-NN imputation
54. Dalam Multiple Imputation, data hilang diganti sebanyak…
- A. satu kali
- B. beberapa kali
- C. dua kali
- D. hanya sekali jika data kecil
55. Teknik penanganan data hilang yang memanfaatkan hubungan antar variabel untuk memprediksi nilai yang hilang adalah…
- A. regression imputation
- B. mean imputation
- C. listwise deletion
- D. deletion berbasis variabel
56. Data hilang yang memiliki pola tidak acak dan berhubungan langsung dengan nilai variabel itu sendiri disebut…
- A. MCAR (Missing Completely at Random)
- B. MAR (Missing at Random)
- C. NMAR (Non-Missing at Random)
- D. MNAR (Missing Not at Random)
57. Dalam analisis regresi cara eksplorasi, scatter plot digunakan untuk…
- A. melihat distribusi residual
- B. melihat hubungan antara dua variabel
- C. menguji signifikansi model
- D. menghitung koefisien korelasi
58. Nilai korelasi Pearson sebesar -0,8 menunjukkan…
- A. hubungan negatif kuat
- B. hubungan positif lemah
- C. hubungan positif kuat
- D. hubungan negatif lemah
59. Jika koefisien determinasi (R^2) suatu model regresi adalah 0,64, maka…
- A. korelasi antara X dan Y adalah 0,36
- B. 36 persen variasi Y dijelaskan oleh X
- C. hubungan X dan Y lemah
- D. 64 persen variasi Y dijelaskan oleh X
60. Dalam scatter plot, jika titik-titik membentuk pola linear dengan kemiringan positif, maka korelasi antara kedua variabel adalah…
- A. tidak ada korelasi
- B. korelasi positif
- C. korelasi negatif
- D. korelasi sempurna
61. Langkah pertama dalam analisis regresi cara eksplorasi adalah…
- A. menguji signifikansi model
- B. menghitung regresi linear
- C. membuat scatter plot
- D. menganalisis residual
62. Data berikut: X = (1,2,3,4,5) dan Y = (2,4,6,8,10). Korelasi Pearson antara X dan Y adalah…
- A. 0
- B. 0,5
- C. 1
- D. -1
63. Outlier dalam scatter plot dapat mempengaruhi analisis regresi dengan cara…
- A. meningkatkan R^2 secara otomatis
- B. menurunkan R^2 secara otomatis
- C. tidak berpengaruh sama sekali
- D. mempengaruhi estimasi koefisien regresi
64. Setelah scatter plot, langkah eksplorasi regresi selanjutnya bisa berupa…
- A. uji t
- B. matriks korelasi
- C. uji F
- D. analisis varians
65. Dalam analisis regresi cara konfirmasi, uji t digunakan untuk…
- A. menguji signifikansi model secara keseluruhan
- B. menguji normalitas residual
- C. menguji signifikansi koefisien regresi individual
- D. menguji homoskedastisitas
66. Jika nilai p-value pada uji F kurang dari alpha (misal 0,05), maka…
- A. model regresi signifikan secara keseluruhan
- B. model regresi tidak signifikan
- C. koefisien regresi tidak signifikan
- D. residual tidak normal
67. Asumsi normalitas residual dalam regresi konfirmasi dapat diuji menggunakan…
- A. uji Kolmogorov-Smirnov
- B. uji F
- C. uji t
- D. uji korelasi
68. Jika interval kepercayaan 95 persen untuk koefisien regresi mencakup angka nol, maka…
- A. koefisien tersebut signifikan
- B. korelasi antara variabel kuat
- C. model regresi terbukti benar
- D. koefisien tersebut tidak signifikan
69. Dalam analisis regresi cara konfirmasi, apa tujuan utama dari pengujian hipotesis terhadap koefisien regresi?
- A. Mengetahui besarnya pengaruh variabel independen terhadap variabel dependen
- B. Menentukan apakah model regresi cocok dengan data
- C. Mengidentifikasi data pencilan
- D. Mengelompokkan data ke dalam cluster
70. Pada regresi konfirmasi, nilai p-value yang lebih kecil dari alpha (misal 0,05) mengindikasikan bahwa:
- A. Variabel independen tidak berpengaruh signifikan
- B. Model regresi tidak layak digunakan
- C. Variabel independen berpengaruh signifikan
- D. Data bersifat heteroskedastisitas
71. Dalam analisis regresi konfirmasi, koefisien determinasi (R^2) digunakan untuk:
- A. Mengukur kekuatan hubungan linear antara dua variabel
- B. Menguji normalitas residual
- C. Menentukan korelasi antara variabel independen dan dependen
- D. Mengukur proporsi variansi variabel dependen yang dijelaskan oleh model
72. Langkah pertama dalam analisis regresi konfirmasi adalah:
- A. Membuat scatter plot
- B. Menghitung koefisien regresi
- C. Menguji asumsi klasik
- D. Menyusun model regresi berdasarkan teori
73. Apa yang dimaksud dengan data teks?
- A. Data yang disimpan dalam format angka
- B. Data yang terdiri dari kata-kata atau kalimat dalam bahasa alami
- C. Data yang hanya berupa gambar
- D. Data yang terstruktur dalam tabel
74. Salah satu karakteristik utama data teks adalah:
- A. Memiliki struktur yang tetap
- B. Tidak terstruktur atau semi-terstruktur
- C. Hanya berisi bilangan bulat
- D. Mudah dihitung secara langsung
75. Teknik yang digunakan untuk mengubah data teks menjadi representasi numerik adalah:
- A. Regresi linear
- B. Clustering
- C. Tokenisasi dan vektorisasi
- D. Normalisasi
76. Apa perbedaan utama antara data teks dan data numerik?
- A. Data teks lebih mudah divisualisasikan
- B. Data numerik tidak memerlukan preprocessing
- C. Data teks memerlukan langkah preprocessing khusus seperti stemming dan stopword removal
- D. Data numerik selalu lebih besar ukurannya
77. Contoh aplikasi dari analisis data teks adalah:
- A. Sentimen analisis pada ulasan produk
- B. Prediksi harga saham dengan time series
- C. Menghitung rata-rata nilai ujian
- D. Membuat grafik batang penjualan
78. Dalam konteks data teks, apa yang dimaksud dengan stopwords?
- A. Kata-kata yang memiliki makna penting
- B. Kata-kata yang dihapus karena sulit diucapkan
- C. Kata-kata yang sering muncul dan tidak memberikan banyak informasi
- D. Kata-kata yang digunakan sebagai kata kunci
79. Proses mengubah teks menjadi huruf kecil semua dan menghapus tanda baca merupakan bagian dari:
- A. Stemming
- B. Tokenisasi
- C. Vektorisasi
- D. Normalisasi teks
80. Salah satu bentuk visualisasi data teks yang umum adalah:
- A. Diagram lingkaran
- B. Word cloud
- C. Histogram
- D. Scatter plot
81. Apa kegunaan dari teknik TF-IDF dalam visualisasi data teks?
- A. Memberikan bobot pada kata berdasarkan frekuensi dalam dokumen dan inversi frekuensi dalam korpus
- B. Menampilkan hubungan antar kata dalam jaringan
- C. Mengukur frekuensi absolut setiap kata
- D. Membuat grafik batang dari topik
82. Visualisasi data teks seperti diagram batang horizontal sering digunakan untuk:
- A. Menunjukkan frekuensi kata tertentu dalam teks
- B. Menampilkan distribusi usia responden
- C. Menggambarkan hubungan antara dua variabel numerik
- D. Menyajikan data deret waktu
83. Dalam membuat word cloud, parameter yang mempengaruhi ukuran kata adalah:
- A. Panjang kata
- B. Jenis huruf
- C. Urutan abjad
- D. Frekuensi kemunculan kata
84. Alat visualisasi data teks seperti jaringan kata (network graph) berguna untuk:
- A. Menampilkan urutan kata dalam kalimat
- B. Menggambarkan hubungan antara kata-kata yang sering muncul bersamaan
- C. Menghitung jumlah total kata
- D. Menyediakan ringkasan numerik data teks
85. Apa yang dimaksud dengan 'word cloud' dalam visualisasi data teks?
- A. Diagram batang yang menunjukkan frekuensi kata
- B. Grafik garis yang menghubungkan kata-kata dalam teks
- C. Tampilan visual kata-kata di mana ukuran kata mencerminkan frekuensinya
- D. Tabel yang berisi daftar kata unik
86. Alat visualisasi mana yang paling cocok untuk menampilkan hubungan antar kata dalam sebuah dokumen teks?
- A. Network graph
- B. Pie chart
- C. Histogram
- D. Scatter plot
87. Pada visualisasi data interaktif, apa fungsi utama dari 'tooltip'?
- A. Menyembunyikan data tertentu
- B. Mengubah warna grafik
- C. Memperbesar area visualisasi
- D. Menampilkan informasi tambahan saat pengguna mengarahkan kursor
88. Apa yang dimaksud dengan 'brush' dalam konteks visualisasi interaktif?
- A. Alat untuk menggambar pada grafik
- B. Teknik untuk memilih subset data dengan cara menyorot area
- C. Fitur untuk menghapus data palsu
- D. Metode untuk menambahkan anotasi otomatis
89. Manakah pernyataan yang benar tentang 'linked views' dalam visualisasi interaktif?
- A. Perubahan pada satu view akan memperbarui view lain secara sinkron
- B. Perubahan pada satu view tidak mempengaruhi view lain
- C. Setiap view menampilkan data yang independen
- D. Linked views hanya digunakan pada dashboard statis
90. Apa kelebihan utama visualisasi data interaktif dibandingkan visualisasi statis?
- A. Hemat waktu pembuatan
- B. Lebih murah biayanya
- C. Memungkinkan eksplorasi data oleh pengguna
- D. Tidak memerlukan data bersih
91. Dalam dashboard interaktif, komponen 'filter' berfungsi untuk…?
- A. Menyimpan data ke basis data
- B. Menambahkan efek animasi
- C. Mengubah tipe grafik
- D. Menyaring data yang ditampilkan berdasarkan kriteria
92. Apa yang dimaksud dengan 'drill-down' dalam interaksi dashboard?
- A. Menampilkan ringkasan data
- B. Menghapus data lama
- C. Memperluas tampilan ke detail yang lebih spesifik
- D. Menggabungkan beberapa grafik
93. Teknik visualisasi interaktif mana yang paling efektif untuk menampilkan perubahan data seiring waktu?
- A. Animated bubble chart
- B. Pie chart statis
- C. Bar chart tetap
- D. Word cloud
94. Pada dashboard, apa fungsi dari 'slider' interaktif?
- A. Menampilkan pop-up iklan
- B. Membuka tautan eksternal
- C. Mengontrol nilai parameter secara kontinu
- D. Mengatur suara
95. Apa perbedaan utama antara 'dashboard operasional' dan 'dashboard strategis'?
- A. Dashboard operasional lebih interaktif
- B. Dashboard operasional fokus pada metrik harian, strategis fokus pada KPI jangka panjang
- C. Dashboard strategis hanya untuk manajer
- D. Tidak ada perbedaan
96. Dalam visualisasi interaktif, teknik 'zooming' digunakan untuk…?
- A. Mengubah warna latar
- B. Memperkecil tampilan keseluruhan
- C. Menghapus data outlier
- D. Memperbesar area tertentu untuk melihat detail
97. Apa yang dimaksud dengan 'dashboard real-time'?
- A. Dashboard yang hanya bisa diakses pada jam kerja
- B. Dashboard yang diperbarui secara otomatis dengan data terbaru
- C. Dashboard yang membutuhkan koneksi internet cepat
- D. Dashboard yang menampilkan data historis
98. Alat visualisasi mana yang paling sesuai untuk membuat dashboard interaktif dengan banyak sumber data?
- A. Microsoft Excel
- B. Paint
- C. Notepad
- D. Tableau
99. Pada visualisasi interaktif, 'hover effect' berguna untuk…?
- A. Menampilkan informasi detail saat mouse berada di atas elemen
- B. Mengubah suara latar
- C. Menjalankan animasi otomatis
- D. Membagikan grafik ke media sosial
100. Apa tantangan utama dalam membangun dashboard interaktif?
- A. Menentukan warna yang menarik
- B. Memastikan performa responsif saat data besar
- C. Memilih jenis grafik yang umum
- D. Menambahkan terlalu banyak animasi
Latihan Tambahan dengan AI
Salin prompt di bawah ini, lalu tempelkan ke ChatGPT, Gemini, Claude, atau AI lainnya untuk mendapatkan 50 soal latihan baru dengan materi yang sama. Soal yang dihasilkan AI akan berbeda dari soal di halaman ini.