Data AI

Hingga 80% dari proyek Kecerdasan Buatan adalah tentang Mengumpulkan Data :

  • Data apa yang dibutuhkan ?
  • Data apa yang tersedia ?
  • Bagaimana cara Memilih data?
  • Bagaimana cara mengumpulkan data?
  • Bagaimana cara membersihkan data?
  • Bagaimana Mempersiapkan datanya?
  • Bagaimana cara menggunakan datanya?

Apa itu Data?

Data bisa berupa banyak hal. Dengan Kecerdasan Buatan itu harus menjadi kumpulan fakta:

JenisContoh
angkaHarga. Tanggal.
pengukuranUkuran. Tinggi. Berat.
Kata-kataNama dan Tempat.
PengamatanMenghitung mobil.
deskripsiDingin.

Intelijen Membutuhkan Data

Kecerdasan manusia membutuhkan data:

Seorang pialang real estat membutuhkan data tentang rumah yang dijual untuk memperkirakan harga.

Kecerdasan buatan membutuhkan data:

Sebuah program komputer juga membutuhkan data untuk memperkirakan harga.


Menyimpan Data

Data yang paling umum untuk dikumpulkan adalah Angka dan Pengukuran.

Seringkali data disimpan dalam array yang mewakili hubungan antar nilai.

Tabel ini berisi harga rumah versus ukuran:

Harga7889991011141415
Ukuran5060708090100 110120130140150

Kuantitatif vs. Kualitatif

Data kuantitatif bersifat numerik:

  • 55 mobil
  • 15 meter
  • 35 anak

Data kualitatif bersifat deskriptif:

  • Dingin
  • Itu panjang
  • Itu menyenangkan

Sensus atau Pengambilan Sampel

Sensus adalah saat kami mengumpulkan data untuk setiap anggota kelompok.

Sampel adalah ketika kami mengumpulkan data untuk beberapa anggota kelompok.

Jika kita ingin tahu berapa banyak orang Amerika yang merokok, kita bisa menanyakan setiap orang di AS (sensus), atau kita bisa menanyakan 10.000 orang (sampel).

Sensus adalah Akurat , tetapi sulit dilakukan. Sampel adalah Inaccurate , tetapi lebih mudah dilakukan.


Ketentuan pengambilan sampel

Sebuah Populasi adalah sekelompok individu (objek) kami ingin mengumpulkan informasi dari.

Sensus adalah informasi tentang setiap individu dalam suatu populasi.

Sampel adalah informasi tentang sebagian dari populasi (Agar mewakili semua).


Sampel Acak

Agar sampel dapat mewakili populasi, sampel harus dikumpulkan secara acak.

Sampel Acak , adalah sampel yang setiap anggota populasinya mempunyai kesempatan yang sama untuk muncul dalam sampel.


Bias Pengambilan Sampel

Bias Sampling (Kesalahan) terjadi ketika sampel dikumpulkan sedemikian rupa sehingga beberapa individu kurang (atau lebih) mungkin untuk dimasukkan dalam sampel.