RANGKUMAN BAB 2 ANALISIS DATA LANJUTAN

 

BAB 2  ANALISIS DATA LANJUTAN (AISHA FAYYAZA 8B 05)

A. Pengolahan Data Awal

1. Pengertian

Pengolahan data awal adalah proses mempersiapkan data mentah agar siap dianalisis. Dalam dunia nyata, data yang dikumpulkan jarang sekali langsung rapi. Biasanya, data penuh dengan kekurangan: ada data yang hilang, salah input, format tidak konsisten, bahkan duplikasi. Misalnya, dalam sebuah survei siswa, ada yang menulis “15 thn”, ada yang menulis “15 tahun”, ada juga yang hanya menulis angka “15”. Semua itu sebenarnya berarti sama, tetapi sistem komputer akan menganggapnya berbeda jika tidak diproses lebih dahulu.

Oleh karena itu, pengolahan data awal berperan sebagai pondasi dalam analisis data. Jika fondasi rapuh, maka hasil analisis bisa salah arah. Banyak kasus di mana sebuah keputusan keliru hanya karena data yang digunakan belum diolah dengan baik. Dalam informatika, tahapan ini dianggap sangat penting dan biasanya memakan waktu paling lama dibandingkan tahap analisis inti.


2. Sumber Data

Data dapat berasal dari berbagai sumber, antara lain:

  • Data primer: data yang diperoleh langsung melalui wawancara, survei, eksperimen, atau observasi.
  • Data sekunder: data yang sudah tersedia, misalnya laporan resmi, data dari instansi pemerintah, database sekolah, atau data publik internet.

Contoh:

  • Guru mengumpulkan nilai ujian siswa (data primer).
  • Guru juga mengunduh data kehadiran dari aplikasi presensi (data sekunder).

Kedua data ini nantinya harus digabungkan dan diproses agar bisa memberikan gambaran yang utuh tentang kinerja siswa.


3. Tahap-Tahap Pengolahan Data Awal

a. Pengumpulan Data

Tahap pertama adalah mengumpulkan data sesuai dengan tujuan analisis. Hal yang perlu diperhatikan:

  1. Tujuan pengumpulan: mengapa data itu dikumpulkan? Apakah untuk penelitian, evaluasi, atau perencanaan?
  2. Jenis data: apakah berupa angka (kuantitatif), teks (kualitatif), gambar, audio, atau kombinasi?
  3. Metode pengumpulan: survei online, kuesioner tertulis, sensor otomatis, pencatatan manual, atau dari basis data digital.

Contoh: ketika sekolah ingin mengetahui efektivitas metode pembelajaran daring, mereka bisa mengumpulkan data kehadiran online, nilai ujian, serta hasil angket kepuasan siswa.


b. Pembersihan Data (Data Cleaning)

Ini adalah tahap yang paling penting. Data mentah sering mengandung kesalahan, seperti:

  • Data hilang (missing value) → misalnya ada siswa yang tidak mengisi usia.
  • Data ganda (duplicate) → satu siswa tercatat dua kali.
  • Data tidak konsisten → format tanggal berbeda (01/02/2025 vs 1 Februari 2025).
  • Data tidak relevan → kolom yang tidak berkaitan dengan tujuan analisis.

Metode pembersihan meliputi:

  • Menghapus entri duplikat.
  • Mengisi nilai kosong dengan metode rata-rata, median, atau estimasi.
  • Menyeragamkan format (tanggal, angka, huruf besar/kecil).
  • Menghapus data ekstrem yang tidak logis (contoh: usia siswa 200 tahun).

Jika pembersihan tidak dilakukan, hasil analisis akan bias. Misalnya, jika ada satu data usia siswa 200 tahun, maka rata-rata usia kelas akan melonjak tidak realistis.


c. Transformasi Data

Data yang terkumpul sering kali dalam bentuk yang berbeda-beda. Transformasi dilakukan untuk:

  1. Menyamakan satuan: km diubah ke m, rupiah ke dolar, atau menit ke detik.
  2. Membuat format seragam: misalnya menulis semua huruf menjadi kapital.
  3. Normalisasi: menyetarakan skala agar data bisa dibandingkan.
    • Contoh: nilai ujian dari 0–100 dinormalisasi ke 0–1 untuk keperluan perhitungan statistik.
  4. Koding data (coding): mengubah data kualitatif menjadi angka.
    • Contoh: “Laki-laki” = 1, “Perempuan” = 2.

Transformasi membuat data lebih mudah diproses komputer dan menghindari kesalahan saat perhitungan.


d. Kategorisasi Data

Kadang, data perlu dikelompokkan agar lebih terstruktur.

  • Contoh: Data usia siswa bisa dikategorikan menjadi 10–12 tahun, 13–15 tahun, 16–18 tahun.
  • Data nilai bisa dikelompokkan menjadi kategori A, B, C, D.
  • Data wilayah bisa dikategorikan berdasarkan provinsi atau kabupaten.

Kategorisasi memudahkan analisis komparatif antar kelompok.


e. Penyaringan Data (Data Filtering)

Tidak semua data diperlukan untuk analisis. Penyaringan membantu memilih data yang relevan.

  • Contoh: jika penelitian hanya fokus pada siswa kelas 9, maka data kelas 7 dan 8 dapat disaring keluar.
  • Contoh lain: dari data ribuan transaksi, hanya transaksi di bulan Januari yang dipilih untuk dianalisis.

4. Pentingnya Pengolahan Data Awal

  1. Menjamin kualitas analisis
    Analisis hanya akan sebaik kualitas data yang digunakan. Data kotor = analisis salah.
  2. Mengurangi bias
    Kesalahan kecil bisa berdampak besar. Misalnya, duplikasi data penjualan bisa membuat perusahaan salah menghitung laba.
  3. Menghemat waktu di tahap analisis
    Data yang sudah rapi lebih cepat diproses dengan alat bantu.
  4. Menjadi dasar pengambilan keputusan yang benar
    Keputusan yang diambil berdasarkan data bersih lebih bisa dipertanggungjawabkan.

5. Contoh Kasus Pengolahan Data Awal

a. Bidang Pendidikan

Sebuah sekolah ingin mengetahui rata-rata nilai ujian siswa kelas 9. Setelah mengumpulkan data, ditemukan bahwa:

  • Ada 3 siswa yang datanya tercatat dua kali.
  • Ada 5 siswa yang nilainya kosong.
  • Ada 1 siswa dengan nilai 1000 (salah input).

Langkah pengolahan data awal:

  1. Menghapus data ganda.
  2. Mengisi nilai kosong dengan rata-rata kelas.
  3. Mengoreksi nilai 1000 menjadi 100.

Hasil akhirnya adalah data nilai yang bersih dan siap dianalisis.


b. Bidang Kesehatan

Rumah sakit mengumpulkan data pasien COVID-19. Namun ditemukan masalah:

  • Tanggal lahir ditulis dalam format berbeda.
  • Ada pasien yang terdaftar dua kali.
  • Ada kolom yang tidak terisi (misalnya alamat).

Setelah dibersihkan, data bisa digunakan untuk analisis tren penyebaran penyakit dengan lebih akurat.


c. Bidang Bisnis

Sebuah toko online menganalisis data penjualan. Sebelum dianalisis, dilakukan pengolahan:

  • Menghapus transaksi ganda.
  • Menyatukan format harga (misalnya semua harga dalam rupiah).
  • Mengelompokkan produk ke dalam kategori: elektronik, pakaian, makanan.

Dengan data bersih, toko bisa mengetahui produk mana yang paling laris dan kapan waktu penjualan tertinggi.


6. Kesimpulan Pengolahan Data Awal

Pengolahan data awal bukan sekadar “persiapan,” melainkan tahap vital yang menentukan kualitas analisis berikutnya. Proses ini melibatkan pengumpulan, pembersihan, transformasi, kategorisasi, dan penyaringan. Tanpa tahap ini, analisis data lanjutan berisiko menghasilkan kesimpulan yang salah, menyesatkan, bahkan merugikan.


B. Analisis Data

1. Pengertian

Analisis data adalah proses menginterpretasikan data yang sudah diolah untuk mendapatkan informasi, pola, atau kesimpulan yang bisa digunakan dalam pengambilan keputusan. Analisis bukan hanya soal menghitung angka, tetapi juga memahami makna di balik data tersebut.

Dalam informatika, analisis data dilakukan dengan bantuan perangkat lunak yang mampu menampilkan data dalam bentuk tabel, grafik, diagram, hingga prediksi berbasis model statistik atau algoritma kecerdasan buatan.

2. Jenis-Jenis Analisis Data

a. Analisis Deskriptif

  • Bertujuan menggambarkan data apa adanya tanpa membuat kesimpulan lebih jauh.
  • Contoh: rata-rata nilai ujian siswa adalah 78; jumlah siswa laki-laki 60, perempuan 40.
  • Alat yang digunakan: tabel, diagram batang, diagram lingkaran, histogram.

b. Analisis Komparatif

  • Membandingkan dua atau lebih kelompok data.
  • Contoh: membandingkan nilai matematika siswa kelas A dan kelas B.
  • Hasil analisis menunjukkan kelompok mana yang lebih tinggi atau rendah, serta perbedaan signifikan antar kelompok.

c. Analisis Diagnostik

  • Digunakan untuk mencari penyebab dari suatu fenomena.
  • Contoh: penjualan produk menurun, lalu analisis data dilakukan untuk menemukan penyebabnya, misalnya karena harga naik atau promosi kurang.

d. Analisis Prediktif

  • Menggunakan data historis untuk memperkirakan kejadian di masa depan.
  • Contoh: memprediksi tren penjualan tahun depan berdasarkan data lima tahun sebelumnya.
  • Biasanya menggunakan model statistik, regresi, atau machine learning.

e. Analisis Preskriptif

  • Memberikan rekomendasi tindakan berdasarkan data.
  • Contoh: dari data penjualan, sistem memberikan saran strategi pemasaran terbaik agar pendapatan meningkat.

3. Alat Bantu Analisis Data

  • Spreadsheet: Excel, Google Sheets.
  • Perangkat Statistik: SPSS, Minitab.
  • Bahasa Pemrograman: Python (pandas, numpy, matplotlib, seaborn), R.
  • Visualisasi Data: Tableau, Power BI.

4. Manfaat Analisis Data

  • Membantu pengambilan keputusan yang lebih tepat dan berbasis fakta.
  • Menemukan pola atau tren yang tersembunyi.
  • Mengurangi risiko dalam bisnis, pemerintahan, maupun penelitian.
  • Meningkatkan efisiensi dan efektivitas suatu strategi.

5. Contoh Analisis Data dalam Kehidupan

  • Pendidikan: menganalisis nilai siswa untuk mengetahui mata pelajaran yang perlu ditingkatkan.
  • Kesehatan: menganalisis data pasien untuk mendeteksi penyakit lebih cepat.
  • Bisnis: menganalisis perilaku konsumen untuk menentukan strategi pemasaran.
  • Pemerintahan: menganalisis data kependudukan untuk membuat kebijakan yang lebih tepat sasaran.

Kesimpulan Umum

Analisis data lanjutan dalam informatika terdiri dari dua tahap besar:

  1. Pengolahan data awal – fokus pada pembersihan, penyusunan, dan persiapan data agar berkualitas.
  2. Analisis data – fokus pada penafsiran dan pemanfaatan data untuk pengambilan keputusan.

Data yang bersih, lengkap, dan terstruktur akan menghasilkan analisis yang akurat. Sebaliknya, data yang salah akan menyesatkan kesimpulan. Oleh karena itu, pengolahan awal tidak boleh diabaikan. Dengan analisis data yang tepat, baik di bidang pendidikan, kesehatan, bisnis, maupun pemerintahan, keputusan yang diambil akan lebih rasional, efektif, dan bermanfaat.

Komentar

Posting Komentar

Postingan populer dari blog ini

Rangkuman BAB 5 Aisha FAyyaza 8B 05

Pertanyaan 20 Soal BAB 1-5

Rangkuman BAB 3