Pembelajaran Mesin - Standar Deviasi
Apa itu Standar Deviasi?
Standar deviasi adalah angka yang menggambarkan seberapa menyebar nilai-nilai itu.
Standar deviasi yang rendah berarti bahwa sebagian besar angka mendekati nilai rata-rata (rata-rata).
Standar deviasi yang tinggi berarti bahwa nilai-nilai tersebar pada rentang yang lebih luas.
Contoh: Kali ini kami telah mendaftarkan kecepatan 7 mobil:
speed = [86,87,88,86,87,85,86]
Standar deviasinya adalah:
0.9
Artinya sebagian besar nilai berada dalam kisaran 0,9 dari nilai rata-rata, yaitu 86,4.
Mari kita lakukan hal yang sama dengan pilihan angka dengan rentang yang lebih luas:
speed = [32,111,138,28,59,77,97]
Standar deviasinya adalah:
37.85
Artinya sebagian besar nilainya berada pada kisaran 37,85 dari nilai rata-rata yaitu 77,4.
Seperti yang Anda lihat, deviasi standar yang lebih tinggi menunjukkan bahwa nilai-nilai tersebar di rentang yang lebih luas.
Modul NumPy memiliki metode untuk menghitung simpangan baku:
Contoh
Gunakan metode NumPy std()
untuk mencari simpangan baku:
import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)
Contoh
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Perbedaan
Varians adalah angka lain yang menunjukkan seberapa menyebar nilai-nilai tersebut.
Faktanya, jika Anda mengambil akar kuadrat dari varians, Anda mendapatkan standar deviasi!
Atau sebaliknya, jika Anda mengalikan standar deviasi dengan dirinya sendiri, Anda mendapatkan variansnya!
Untuk menghitung varians yang harus Anda lakukan sebagai berikut:
1. Temukan rata-ratanya:
(32+111+138+28+59+77+97) / 7 = 77.4
2. Untuk setiap nilai: temukan perbedaan dari mean:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138
- 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77
- 77.4 = - 0.4
97 - 77.4 = 19.6
3. Untuk setiap perbedaan: temukan nilai kuadratnya:
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4. Varians adalah jumlah rata-rata dari perbedaan kuadrat ini:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16)
/ 7 = 1432.2
Untungnya, NumPy memiliki metode untuk menghitung varians:
Contoh
Gunakan metode NumPy var()
untuk menemukan varians:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)
Standar Deviasi
Seperti yang telah kita pelajari, rumus untuk mencari simpangan baku adalah akar kuadrat dari varians:
√.1432.25 = 37.85
Atau, seperti pada contoh sebelumnya, gunakan NumPy untuk menghitung simpangan baku:
Contoh
Gunakan metode NumPy std()
untuk mencari simpangan baku:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Simbol
Standar Deviasi sering dilambangkan dengan simbol Sigma :
Varians sering diwakili oleh simbol Sigma Square : 2
Ringkasan Bab
Standar Deviasi dan Varians adalah istilah yang sering digunakan dalam Machine Learning, jadi penting untuk memahami cara mendapatkannya, dan konsep di baliknya.