Ilmu Data - Tabel Regresi: Nilai-P
"Statistik Bagian Koefisien" dalam Tabel Regresi
Sekarang, kami ingin menguji apakah koefisien dari fungsi regresi linier memiliki pengaruh yang signifikan terhadap variabel terikat (Pembakaran_ Kalori).
Ini berarti bahwa kami ingin membuktikan bahwa ada hubungan antara Average_Pulse dan Calorie_Burnage, menggunakan uji statistik.
Ada empat komponen yang menjelaskan statistik koefisien:
- std err adalah singkatan dari Standard Error
- t adalah "nilai-t" dari koefisien
- P>|t| disebut "nilai-P"
- [0,025 0,975] mewakili interval kepercayaan dari koefisien
Kami akan fokus pada pemahaman "P-value" dalam modul ini.
Nilai-P
Nilai-P adalah angka statistik untuk menyimpulkan jika ada hubungan antara Average_Pulse dan Calorie_Burnage.
Kami menguji apakah nilai sebenarnya dari koefisien sama dengan nol (tidak ada hubungan). Uji statistik untuk ini disebut pengujian Hipotesis.
- Nilai P yang rendah (<0,05) berarti koefisien kemungkinan tidak sama dengan nol.
- Nilai P yang tinggi (> 0,05) berarti kita tidak dapat menyimpulkan bahwa variabel penjelas mempengaruhi variabel terikat (di sini: jika Average_Pulse mempengaruhi Kalori_Pembakaran).
- Nilai P yang tinggi juga disebut nilai P yang tidak signifikan.
Pengujian Hipotesis
Pengujian hipotesis adalah prosedur statistik untuk menguji apakah hasil Anda valid.
Dalam contoh kami, kami menguji apakah koefisien sebenarnya dari Average_Pulse dan intersep sama dengan nol.
Uji hipotesis memiliki dua pernyataan. Hipotesis nol dan hipotesis alternatif.
- Hipotesis nol dapat secara singkat ditulis sebagai H0
- Hipotesis alternatif dapat secara singkat ditulis sebagai HA
Secara matematis ditulis:
H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept =
0
HA: Intercept ≠ 0
Tanda berarti "tidak sama dengan"
Pengujian Hipotesis dan Nilai-P
Hipotesis nol bisa ditolak atau tidak.
Jika kita menolak hipotesis nol, kita menyimpulkan bahwa ada hubungan antara Average_Pulse dan Calorie_Burnage. Nilai P digunakan untuk kesimpulan ini.
Ambang batas umum dari nilai-P adalah 0,05.
Catatan: Nilai P 0,05 berarti bahwa 5% dari waktu, kami akan secara salah menolak hipotesis nol. Ini berarti bahwa kita menerima bahwa 5% dari waktu, kita mungkin salah menyimpulkan suatu hubungan.
Jika P-value lebih kecil dari 0,05, kita dapat menolak hipotesis nol dan menyimpulkan bahwa ada hubungan antar variabel.
Namun, nilai P Average_Pulse adalah 0,824. Jadi, kita tidak dapat menyimpulkan hubungan antara Average_Pulse dan Calorie_Burnage.
Artinya ada peluang 82,4% bahwa koefisien sebenarnya dari Average_Pulse adalah nol.
Intersep digunakan untuk menyesuaikan kemampuan fungsi regresi untuk memprediksi lebih tepat. Oleh karena itu jarang untuk menafsirkan nilai-P dari intersep.