Materi Informatika SMA/MA X - Analisis Data
1.
Pengertian
Analisis data adalah proses
inspeksi, pembersihan dan pemodelan data dengan tujuan untuk menemukan
informasi yang berguna, menginformasikan kesimpulan dan mendukung pengambilan
keputusan. (Wikipedia)
2.
Pentingnya Data
Data merupakan fakta yang dapat
berupa teks, angka, gambar, suara (voice), dan video. Data merupakan dasar
untuk diolah menjadi informasi. Data juga diproses menjadi pengetahuan,
dan data sering digunakan untuk
mengambil kebijakan dalam menyusun rencana kegiatan dan mengambil sebuah
keputusan. Keterkaitan antara data, informasi, pengetahun, dan kebijakan dapat
dimodelkan sebagai DIKW (Data Information
Knowlegde, and Wisdom).
Untuk mengetahui lebih jelas
perbedaan data, informasi, pengetahuan, dan kebijakan perhatikan contoh berikut
ini.
Tabel diatas berupa data penjualan kantin sekolah yang tidak banya
memberikan informasi karena hanya berupa sekumpulan fakta.
Tabel diatas berupa informasi dimana kita dapat melihat akumulasi
penjualan kantin sekolah yang ditunjukkan dalam bentuk rekapitulasi penjualan.
Tabel diatas berupa informasi tabel pengetahuan dimana kita dapat
menganalisa menu yang sering terjual pada setiap harinya.
3.
Pengumpulan Data
Pengumpalan
data adalah proses mengumpulkan informasi/fakta tentang variabel tertentu
sehingga dapat digunakan untuk menyajikan infromasi yang logis dan kredibel.
Berdasarkan sumbernya, dalam pengumpulan data terdapat dua jenis yaitu data
primer dan data sekunder.
1)
Data Primer
merupakan data yang didapatkan langsung dari sumbernya dengan melakukan pengamatan
(observasi), survei, wawancara, kusioner (daftar pertanyaan), dan pengukuran
fisik.
Data yang
terkumpul secara kontinu dan membentuk suatu ukuran data yang besar dikenal
dengan istilah big data. Terdapat
beberapa karakteristik yang menggambarkan big data yang sering disebut 4V (four Vs) antara lain:
a.
Volume yaitu
jumlah data yang sangat besar dan dihasilkan dari berbagai perangkat.
b.
Velocity yaitu
kecepatan data yang sangat cepat yang diperoleh per detik.
c.
Variety yaitu
keanekaragaman tipe data yang diperoleh berupa teks, gambar, suara, dan
lainnya.
2)
Data
Sekunder merupakan data yang sudah dukumpulkan dan diolah oleh orang lain.
Biasanya data seperti ini dapat diperoleh dari berbagai sumber di internet.
4. Transformasi
Data
Transformasi data adalah mengubah
skala ukuran data asli menjadi bentuk lain yang lebih sederhana. Salah satu
cara transformasi data adalah dengan mengubah rentang nilai atau tipe data yang
berbeda. Secara umum terdapat tipe data diantranya sebagai berikut.
a.
Tipe data
numerik merupakan tipe data yang didapatkan dari hasil pengukuran kuantitatif,
dibagi menjadi dua (2) yaitu:
-
Diskrit
adalah tipe data yang sifatnya relatif terbatas, misalnya: jumlah pengunjung,
jumlah siswa, berapa banyak penjualan jus, dan lain-lain
-
Kontinu
adalah tipe data yang sifatnya tidak terbatas atau berkesinambungan, misalanya:
tinggi badan, luas lahan, jarak tempuh, dan lainnya.
b.
Kategorik
merupakan tipe data yang bersifat kuantitatif dan tidak memiliki makna secara
matematis, misalanya: jenis kelamin, agama, dan lain-lain
c.
Ordinal
merupakan gabungan dari tipe data numerik dan kategorik. Nilai pada tipe data
ini sudah ditentukan seperti pada tipe data numerik tetapi setip nilai memiliki
makna secara matematis. Misalnya: grade
A, B, C, D, E contoh lain seperti rating
pada suatu produk.