Ilmu Data - Varians Statistik


Perbedaan

Varians adalah angka lain yang menunjukkan seberapa menyebar nilai-nilai tersebut.

Faktanya, jika Anda mengambil akar kuadrat dari varians, Anda mendapatkan standar deviasi. Atau sebaliknya, jika Anda mengalikan standar deviasi dengan dirinya sendiri, Anda mendapatkan variansnya!

Kami pertama-tama akan menggunakan kumpulan data dengan 10 pengamatan untuk memberikan contoh bagaimana kami dapat menghitung varians:

Durasi Rata_Pulse Maks_Pulsa Pembakaran Kalori Jam_Kerja Jam_Tidur
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Varians sering diwakili oleh simbol Sigma Square: ^2


Langkah 1 untuk Menghitung Varians: Temukan Mean

Kami ingin mencari varians Average_Pulse.

1. Temukan rata-ratanya:

(80+85+90+95+100+105+110+115+120+125) / 10 = 102.5

Rata-ratanya adalah 102,5


Langkah 2: Untuk Setiap Nilai - Temukan Perbedaan Dari Mean

2. Temukan perbedaan dari rata-rata untuk setiap nilai:

80 - 102.5 = -22.5
85 - 102.5 = -17.5
90 - 102.5 = -12.5
95 - 102.5 = -7.5
100 - 102.5 = -2.5
105 - 102.5 = 2.5
110 - 102.5 = 7.5
115 - 102.5 = 12.5
120 - 102.5 = 17.5
125 - 102.5 = 22.5

Langkah 3: Untuk Setiap Perbedaan - Temukan Nilai Kuadrat

3. Temukan nilai kuadrat untuk setiap perbedaan:

(-22.5)^2 = 506.25
(-17.5)^2 = 306.25
(-12.5)^2 = 156.25
(-7.5)^2 = 56.25
(-2.5)^2 = 6.25
2.5^2 = 6.25
7.5^2 = 56.25
12.5^2 = 156.25
17.5^2 = 306.25
22.5^2 = 506.25

Catatan: Kita harus mengkuadratkan nilainya untuk mendapatkan total spread.



Langkah 4: Varians adalah Jumlah Rata-rata Nilai Kuadrat Ini

4. Jumlahkan nilai kuadrat dan temukan rata-ratanya:

(506.25 + 306.25 + 156.25 + 56.25 + 6.25 + 6.25 + 56.25 + 156.25 + 306.25 + 506.25) / 10 = 206.25

Variansnya adalah 206,25.


Gunakan Python untuk Menemukan Varians dari health_data

Kita dapat menggunakan var()fungsi dari Numpy untuk menemukan varians (ingat bahwa kita sekarang menggunakan kumpulan data pertama dengan 10 pengamatan):

Contoh

import numpy as np

var = np.var(health_data)
print(var)

Hasil:

Perbedaan

Gunakan Python untuk Menemukan Varians Kumpulan Data Lengkap

Di sini kami menghitung varians untuk setiap kolom untuk kumpulan data lengkap:

Contoh

import numpy as np

var_full = np.var(full_health_data)
print(var_full)

Hasil:

Perbedaan