Pengantar Ilmu Data


Ilmu Data adalah kombinasi dari beberapa disiplin ilmu yang menggunakan statistik, analisis data, dan pembelajaran mesin untuk menganalisis data dan untuk mengekstrak pengetahuan dan wawasan darinya.


Apa itu Ilmu Data?

Ilmu Data adalah tentang pengumpulan data, analisis, dan pengambilan keputusan.

Ilmu Data adalah tentang menemukan pola dalam data, melalui analisis, dan membuat prediksi masa depan.

Dengan menggunakan Ilmu Data, perusahaan dapat membuat:

  • Keputusan yang lebih baik (haruskah kita memilih A atau B)
  • Analisis prediktif (apa yang akan terjadi selanjutnya?)
  • Penemuan pola (menemukan pola, atau mungkin informasi tersembunyi dalam data)

Dimana Ilmu Data Dibutuhkan?

Ilmu Data digunakan di banyak industri di dunia saat ini, misalnya perbankan, konsultasi, perawatan kesehatan, dan manufaktur.

Contoh di mana Ilmu Data dibutuhkan:

  • Untuk perencanaan rute: Untuk menemukan rute terbaik untuk mengirim
  • Untuk meramalkan penundaan penerbangan/kapal/kereta dll. (melalui analisis prediktif)
  • Untuk membuat penawaran promosi
  • Untuk menemukan waktu yang paling tepat untuk mengirimkan barang
  • Untuk meramalkan pendapatan tahun depan untuk sebuah perusahaan
  • Untuk menganalisis manfaat kesehatan dari pelatihan
  • Untuk memprediksi siapa yang akan memenangkan pemilihan

Ilmu Data dapat diterapkan di hampir setiap bagian bisnis di mana data tersedia. Contohnya adalah:

  • Barang konsumsi
  • Pasar saham
  • Industri
  • Politik
  • Perusahaan logistik
  • Perdagangan elektronik

Bagaimana Seorang Ilmuwan Data Bekerja?

Seorang Data Scientist membutuhkan keahlian dalam beberapa latar belakang:

  • Pembelajaran mesin
  • Statistik
  • Pemrograman (Python atau R)
  • Matematika
  • Database

Seorang Data Scientist harus menemukan pola di dalam data. Sebelum dia dapat menemukan pola, dia harus mengatur data dalam format standar.

Berikut cara kerja Data Scientist:

  1. Ajukan pertanyaan yang tepat - Untuk memahami masalah bisnis.
  2. Jelajahi dan kumpulkan data - Dari database, log web, umpan balik pelanggan, dll.
  3. Ekstrak data - Ubah data ke format standar.
  4. Bersihkan data - Hapus nilai yang salah dari data.
  5. Temukan dan ganti nilai yang hilang - Periksa nilai yang hilang dan ganti dengan nilai yang sesuai (misalnya nilai rata-rata).
  6. Normalisasi data - Skala nilai dalam rentang praktis (misalnya 140 cm lebih kecil dari 1,8 m. Namun, angka 140 lebih besar dari 1,8. - jadi penskalaan itu penting).
  7. Analisis data, temukan pola, dan buat prediksi masa depan .
  8. Mewakili hasilnya - Sajikan hasil dengan wawasan yang berguna dengan cara yang dapat dipahami "perusahaan".

Mulai dari mana?

Dalam tutorial ini, kita akan mulai dengan menyajikan apa itu data dan bagaimana data dapat dianalisis.

Anda akan belajar bagaimana menggunakan statistik dan fungsi matematika untuk membuat prediksi.