Pembelajaran Mesin - Scatter Plot
Plot Pencar
Plot sebar adalah diagram di mana setiap nilai dalam kumpulan data diwakili oleh sebuah titik.
Modul Matplotlib memiliki metode untuk menggambar plot sebar, dibutuhkan dua larik dengan panjang yang sama, satu untuk nilai sumbu x, dan satu untuk nilai sumbu y:
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Array x
mewakili usia masing-masing mobil.
Array y
mewakili kecepatan setiap mobil.
Contoh
Gunakan scatter()
metode untuk menggambar diagram scatter plot:
import matplotlib.pyplot as plt
x =
[5,7,8,7,2,17,2,9,4,11,12,9,6]
y =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
plt.scatter(x, y)
plt.show()
Hasil:
Plot Pencar Dijelaskan
Sumbu x mewakili usia, dan sumbu y mewakili kecepatan.
Apa yang dapat kita baca dari diagram adalah bahwa dua mobil tercepat berusia 2 tahun, dan mobil paling lambat berusia 12 tahun.
Catatan: Tampaknya semakin baru mobil, semakin cepat melaju, tapi itu bisa jadi kebetulan, lagipula kami hanya mendaftarkan 13 mobil.
Distribusi Data Acak
Dalam Pembelajaran Mesin, kumpulan data dapat berisi ribuan, atau bahkan jutaan, nilai.
Anda mungkin tidak memiliki data dunia nyata saat menguji algoritme, Anda mungkin harus menggunakan nilai yang dibuat secara acak.
Seperti yang telah kita pelajari di bab sebelumnya, modul NumPy dapat membantu kita dalam hal itu!
Mari kita buat dua array yang keduanya diisi dengan 1000 angka acak dari distribusi data normal.
Array pertama akan memiliki mean set ke 5.0 dengan standar deviasi 1.0.
Array kedua akan memiliki mean set ke 10,0 dengan standar deviasi 2.0:
Contoh
Plot pencar dengan 1000 titik:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0,
1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()
Hasil:
Plot Pencar Dijelaskan
Kita dapat melihat bahwa titik-titik terkonsentrasi di sekitar nilai 5 pada sumbu x, dan 10 pada sumbu y.
Kita juga dapat melihat bahwa penyebarannya lebih lebar di sumbu y daripada di sumbu x.