Pembelajaran Mesin - Distribusi Data Normal
Distribusi Data Normal
Pada bab sebelumnya kita telah mempelajari cara membuat array yang benar-benar acak, dengan ukuran tertentu, dan di antara dua nilai yang diberikan.
Dalam bab ini kita akan belajar cara membuat array di mana nilai-nilai terkonsentrasi di sekitar nilai yang diberikan.
Dalam teori probabilitas distribusi data semacam ini dikenal sebagai distribusi data normal , atau distribusi data Gaussian , setelah ahli matematika Carl Friedrich Gauss yang menemukan rumus distribusi data ini.
Contoh
Distribusi data normal yang khas:
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
Hasil:
Catatan: Grafik distribusi normal juga dikenal sebagai kurva lonceng karena karakteristik bentuk loncengnya.
Histogram Dijelaskan
Kami menggunakan larik dari numpy.random.normal()
metode, dengan nilai 100000, untuk menggambar histogram dengan 100 batang.
Kami menetapkan bahwa nilai rata-rata adalah 5.0, dan standar deviasi adalah 1.0.
Artinya nilai harus terkonsentrasi di sekitar 5.0, dan jarang lebih jauh dari 1.0 dari mean.
Dan seperti yang Anda lihat dari histogram, sebagian besar nilainya antara 4.0 dan 6.0, dengan puncak sekitar 5.0.