MSIM4315 — Data Warehouse
1. Data warehouse didefinisikan sebagai kumpulan data yang bersifat berorientasi subjek, terintegrasi, tidak mudah berubah, dan memiliki dimensi waktu. Definisi tersebut dikemukakan oleh…
- A. Ralph Kimball
- B. William H. Inmon
- C. Edgar Codd
- D. James Martin
2. Karakteristik data warehouse yang menyatakan bahwa data diorganisasikan berdasarkan topik utama bisnis seperti pelanggan, produk, atau penjualan disebut…
- A. Subject-oriented
- B. Time-variant
- C. Non-volatile
- D. Integrated
3. Perbedaan utama antara database operasional (OLTP) dan data warehouse (OLAP) terletak pada…
- A. Jenis bahasa pemrograman yang digunakan
- B. Jumlah pengguna yang dapat mengakses sistem
- C. Merek perangkat keras yang digunakan
- D. Tujuan penggunaan data untuk transaksi harian atau analisis strategis
4. Karakteristik data warehouse yang menyatakan bahwa data tidak dapat diubah atau dihapus setelah dimuat ke dalam sistem disebut…
- A. Subject-oriented
- B. Time-variant
- C. Non-volatile
- D. Integrated
5. Data warehouse menyimpan data dari berbagai sumber dengan format dan konvensi yang berbeda-beda, lalu menyatukannya menjadi satu format yang konsisten. Karakteristik ini disebut…
- A. Non-volatile
- B. Integrated
- C. Subject-oriented
- D. Time-variant
6. Komponen dalam arsitektur data warehouse yang berfungsi sebagai area penyimpanan sementara sebelum data dimuat ke data warehouse disebut…
- A. Staging area
- B. Data mart
- C. Metadata repository
- D. OLAP server
7. Data mart merupakan bagian dari data warehouse yang memiliki cakupan lebih terbatas. Manakah pernyataan yang paling tepat menggambarkan data mart?
- A. Data mart menyimpan seluruh data dari semua departemen dalam perusahaan
- B. Data mart merupakan pengganti data warehouse pada organisasi kecil
- C. Data mart digunakan untuk menyimpan data transaksi operasional harian
- D. Data mart adalah subset data warehouse yang berfokus pada satu area bisnis tertentu
8. Metadata dalam data warehouse berfungsi sebagai…
- A. Tempat penyimpanan data transaksi harian
- B. Alat untuk memvisualisasikan laporan bisnis
- C. Data yang mendeskripsikan struktur, asal-usul, dan makna data lain dalam sistem
- D. Komponen yang mengeksekusi query analitik secara langsung
9. Jenis metadata yang menggambarkan bagaimana data dipetakan dari sumber ke data warehouse, termasuk aturan transformasi dan pembersihan data, disebut metadata…
- A. Teknis
- B. Proses
- C. Bisnis
- D. Operasional
10. Dalam perencanaan data warehouse, dokumen yang memuat ruang lingkup proyek, tujuan bisnis, sumber daya, dan jadwal pengembangan secara keseluruhan disebut…
- A. Project charter
- B. Data dictionary
- C. ETL specification
- D. Business requirements document
11. Tahapan dalam manajemen proyek data warehouse yang bertujuan untuk mengidentifikasi risiko-risiko yang dapat menghambat keberhasilan proyek disebut…
- A. Perencanaan sumber daya
- B. Pengendalian kualitas
- C. Penjadwalan proyek
- D. Manajemen risiko
12. Teknik pengumpulan kebutuhan data warehouse dengan cara melakukan tanya jawab langsung kepada pengguna akhir atau pemangku kepentingan disebut…
- A. Observasi lapangan
- B. Analisis dokumen
- C. Wawancara
- D. Kuesioner tertulis
13. Analisis dimensional merupakan teknik yang digunakan dalam data warehouse untuk…
- A. Mengoptimalkan kecepatan transaksi operasional harian
- B. Mengidentifikasi fakta bisnis dan dimensi analisis yang relevan
- C. Mengelola akses pengguna dan keamanan data
- D. Merancang skema normalisasi database
14. Dalam model dimensional, tabel yang menyimpan data numerik terukur seperti jumlah penjualan atau pendapatan disebut tabel…
- A. Fakta
- B. Dimensi
- C. Agregat
- D. Staging
15. Paket informasi dalam konteks analisis kebutuhan data warehouse merupakan dokumen yang digunakan untuk…
- A. Mendokumentasikan prosedur ETL secara teknis
- B. Menyimpan metadata teknis tentang struktur tabel
- C. Mendefinisikan kamus data dan atribut sumber
- D. Menggambarkan kebutuhan analitik bisnis dalam format terstruktur berisi fakta dan dimensi
16. Arsitektur data warehouse yang menempatkan data warehouse enterprise sebagai sumber utama kemudian mendistribusikan data ke data mart disebut arsitektur…
- A. Data mart independen
- B. Virtual data warehouse
- C. Top-down
- D. Bottom-up
17. Pendekatan arsitektur data warehouse yang dikembangkan oleh Ralph Kimball, yaitu membangun data mart terlebih dahulu kemudian mengintegrasikannya menjadi data warehouse, disebut…
- A. Top-down architecture
- B. Bottom-up architecture
- C. Hub-and-spoke architecture
- D. Federated architecture
18. Infrastruktur data warehouse mencakup perangkat keras dan perangkat lunak yang mendukung operasionalnya. Komponen infrastruktur yang bertanggung jawab atas penyimpanan data dalam kapasitas besar disebut…
- A. Storage subsystem
- B. Query engine
- C. ETL engine
- D. Metadata repository
19. Skema bintang (star schema) pada pemodelan data warehouse terdiri dari…
- A. Satu tabel dimensi yang dikelilingi oleh beberapa tabel fakta
- B. Beberapa tabel fakta yang saling terhubung satu sama lain
- C. Beberapa tabel dimensi yang dinormalisasi secara penuh
- D. Satu tabel fakta di tengah yang dikelilingi oleh beberapa tabel dimensi
20. Perbedaan utama antara skema bintang (star schema) dan skema kepingan salju (snowflake schema) adalah…
- A. Star schema memiliki lebih banyak tabel fakta daripada snowflake schema
- B. Snowflake schema tidak memiliki tabel dimensi sama sekali
- C. Tabel dimensi pada snowflake schema dinormalisasi menjadi beberapa tabel, sedangkan pada star schema tidak dinormalisasi
- D. Star schema hanya digunakan untuk data mart, sedangkan snowflake schema untuk data warehouse
21. Dalam pemodelan data warehouse, galaxy schema atau fact constellation schema adalah skema yang memiliki ciri…
- A. Satu tabel fakta dan satu tabel dimensi saja
- B. Beberapa tabel fakta yang berbagi tabel dimensi yang sama
- C. Tabel dimensi yang sepenuhnya terpisah antara satu fakta dan lainnya
- D. Hanya satu tabel fakta dengan dimensi yang dinormalisasi penuh
22. Teknik pemodelan data warehouse yang dikembangkan oleh Ralph Kimball dan dikenal sebagai pendekatan berbasis proses bisnis adalah…
- A. Dimensional modeling
- B. Entity-relationship modeling
- C. Object-oriented modeling
- D. Hierarchical modeling
23. Proses ETL dalam pengembangan data warehouse terdiri dari tiga tahap utama. Urutan yang benar dari proses ETL adalah…
- A. Transform, Extract, Load
- B. Load, Extract, Transform
- C. Extract, Load, Transform
- D. Extract, Transform, Load
24. Pada proses ETL, tahap transformasi bertujuan untuk…
- A. Mengambil data mentah dari sistem sumber
- B. Memuat data yang telah bersih ke tabel tujuan
- C. Membersihkan, mengonversi, dan menyeragamkan data dari berbagai sumber
- D. Mengarsipkan data lama di sistem sumber
25. Dalam proses ETL, masalah kualitas data yang terjadi akibat adanya data yang sama tetapi dicatat lebih dari satu kali disebut…
- A. Data yang tidak lengkap
- B. Data duplikat
- C. Data tidak konsisten
- D. Data kedaluwarsa
26. Integrasi data dalam data warehouse mengacu pada proses…
- A. Menggabungkan data dari berbagai sumber heterogen menjadi satu representasi yang konsisten
- B. Memisahkan data berdasarkan departemen untuk analisis independen
- C. Mengarsipkan data lama ke media penyimpanan sekunder
- D. Mendistribusikan data ke pengguna akhir melalui laporan
27. Sebuah perusahaan memiliki data pelanggan dari sistem CRM dan sistem ERP dengan format yang berbeda. Proses ETL yang bertanggung jawab menyeragamkan format data dari kedua sistem tersebut adalah tahap…
- A. Extraction
- B. Loading
- C. Staging
- D. Transformation
28. OLAP adalah singkatan dari…
- A. Online Lateral Analytical Processing
- B. Online Logical Application Processing
- C. Online Analytical Processing
- D. Offline Analytical Processing
29. Operasi OLAP yang digunakan untuk melihat data pada tingkat detail yang lebih rinci dengan menurunkan hierarki dimensi disebut…
- A. Roll-up
- B. Drill-down
- C. Slice
- D. Dice
30. Operasi OLAP yang berlawanan dengan drill-down, yaitu meringkas data ke tingkat yang lebih umum atau agregat, disebut…
- A. Roll-up
- B. Slice
- C. Drill-down
- D. Pivot
31. Operasi OLAP yang memilih satu nilai dari satu dimensi sehingga menghasilkan sub-kubus dengan dimensi yang berkurang satu disebut…
- A. Roll-up
- B. Dice
- C. Pivot
- D. Slice
32. Jenis OLAP yang menyimpan data dalam struktur multidimensi yang benar-benar berbentuk kubus (array multidimensi) disebut…
- A. ROLAP (Relational OLAP)
- B. HOLAP (Hybrid OLAP)
- C. MOLAP (Multidimensional OLAP)
- D. DOLAP (Desktop OLAP)
33. Jenis OLAP yang menggunakan database relasional sebagai penyimpanan data dan mensimulasikan fungsionalitas multidimensi melalui SQL disebut…
- A. MOLAP
- B. ROLAP
- C. HOLAP
- D. DOLAP
34. Operasi OLAP yang merotasi sudut pandang kubus data sehingga dimensi yang sebelumnya menjadi baris bertukar posisi menjadi kolom atau sebaliknya disebut…
- A. Pivot
- B. Slice
- C. Dice
- D. Roll-up
35. Seorang analis ingin melihat data penjualan untuk kuartal pertama di seluruh wilayah dan seluruh produk. Operasi OLAP yang digunakan adalah…
- A. Roll-up
- B. Drill-down
- C. Pivot
- D. Slice
36. Kualitas data dalam data warehouse mencakup beberapa dimensi. Dimensi kualitas data yang menyatakan bahwa data harus mencerminkan kondisi dunia nyata secara tepat disebut…
- A. Kelengkapan
- B. Ketepatan waktu
- C. Akurasi
- D. Konsistensi
37. Dimensi kualitas data yang mengukur sejauh mana seluruh data yang seharusnya ada memang tersimpan dalam sistem tanpa ada yang hilang disebut…
- A. Akurasi
- B. Kelengkapan
- C. Konsistensi
- D. Ketepatan waktu
38. Proses pemeliharaan data warehouse yang bertujuan untuk memperbarui data dengan menambahkan data baru tanpa menghapus data lama disebut…
- A. Incremental loading
- B. Full refresh
- C. Data purging
- D. Data archiving
39. Proses pemeliharaan data warehouse yang memuat ulang seluruh data dari sumber ke data warehouse dari awal disebut…
- A. Incremental loading
- B. Data archiving
- C. Data cleansing
- D. Full refresh
40. Slowly Changing Dimension (SCD) dalam data warehouse adalah konsep yang menangani perubahan nilai atribut pada tabel dimensi. Tipe SCD yang menyimpan riwayat perubahan dengan cara menambahkan baris baru untuk setiap perubahan disebut…
- A. SCD Tipe 0
- B. SCD Tipe 1
- C. SCD Tipe 2
- D. SCD Tipe 3
41. SCD Tipe 1 menangani perubahan atribut dimensi dengan cara…
- A. Menambahkan baris baru untuk setiap perubahan
- B. Menimpa nilai lama dengan nilai baru tanpa menyimpan riwayat
- C. Menambahkan kolom baru untuk nilai sebelumnya
- D. Memindahkan nilai lama ke tabel arsip terpisah
42. Tren terkini dalam pengembangan data warehouse yang memanfaatkan infrastruktur komputasi berbasis internet dengan model pembayaran sesuai penggunaan disebut…
- A. Cloud data warehouse
- B. On-premise data warehouse
- C. Mainframe data warehouse
- D. Distributed relational database
43. Konsep data lake berbeda dari data warehouse dalam hal…
- A. Data lake hanya menyimpan data terstruktur dan sudah diolah
- B. Data lake tidak dapat digunakan untuk analisis bisnis apapun
- C. Data lake memerlukan skema yang ketat sebelum data dimuat
- D. Data lake menyimpan data mentah dalam berbagai format tanpa transformasi sebelumnya
44. Dalam konteks pemeliharaan data warehouse, proses memindahkan data yang sudah sangat lama dan jarang diakses ke media penyimpanan yang lebih murah disebut…
- A. Data cleansing
- B. Data replication
- C. Data archiving
- D. Data partitioning
45. Sebuah perusahaan ritel menemukan bahwa laporan penjualan bulanan membutuhkan waktu sangat lama karena query harus memindai miliaran baris data. Solusi pemeliharaan data warehouse yang paling tepat adalah…
- A. Melakukan full refresh setiap hari
- B. Membuat tabel agregat atau materialized view untuk meringkas data
- C. Menghapus data yang lebih dari satu tahun
- D. Memindahkan semua data ke staging area
46. Operasi OLAP yang memilih sub-kubus berdasarkan rentang nilai pada dua dimensi atau lebih disebut…
- A. Dice
- B. Slice
- C. Roll-up
- D. Drill-down
47. Dalam arsitektur data warehouse, komponen yang bertanggung jawab menyajikan laporan, dashboard, dan visualisasi data kepada pengguna akhir disebut…
- A. ETL engine
- B. Staging area
- C. Metadata repository
- D. Front-end access tools
48. Jika sebuah perusahaan menganalisis data penjualan dari level tahunan kemudian ingin memecahnya menjadi level kuartal, lalu ke bulanan, proses ini menggunakan operasi OLAP…
- A. Roll-up berulang kali
- B. Slice berurutan
- C. Drill-down berulang kali
- D. Pivot bergantian
49. Tren data warehouse modern yang menggabungkan kemampuan data warehouse terstruktur dan data lake dalam satu platform terintegrasi dikenal dengan istilah…
- A. Data vault
- B. Data lakehouse
- C. Data fabric
- D. Data mesh
50. Manakah pernyataan yang paling tepat membedakan antara data warehouse dan database operasional dalam hal granularitas data?
- A. Data warehouse menyimpan data agregat dan historis, sedangkan database operasional menyimpan data transaksi detail terkini
- B. Database operasional menyimpan data historis, sedangkan data warehouse menyimpan hanya data terkini
- C. Data warehouse dan database operasional menyimpan jenis data yang sama hanya dengan teknologi berbeda
- D. Database operasional selalu memiliki jumlah data yang lebih besar daripada data warehouse
Latihan Tambahan dengan AI
Salin prompt di bawah ini, lalu tempelkan ke ChatGPT, Gemini, Claude, atau AI lainnya untuk mendapatkan 50 soal latihan baru dengan materi yang sama. Soal yang dihasilkan AI akan berbeda dari soal di halaman ini.