Ilmu Data - Tabel Regresi: Nilai-P


"Statistik Bagian Koefisien" dalam Tabel Regresi

Tabel Regresi - Statistik Koefisien

Sekarang, kami ingin menguji apakah koefisien dari fungsi regresi linier memiliki pengaruh yang signifikan terhadap variabel terikat (Pembakaran_ Kalori).

Ini berarti bahwa kami ingin membuktikan bahwa ada hubungan antara Average_Pulse dan Calorie_Burnage, menggunakan uji statistik.

Ada empat komponen yang menjelaskan statistik koefisien:

  • std err adalah singkatan dari Standard Error
  • t adalah "nilai-t" dari koefisien
  • P>|t| disebut "nilai-P"
  •  [0,025 0,975] mewakili interval kepercayaan dari koefisien

Kami akan fokus pada pemahaman "P-value" dalam modul ini.


Nilai-P

Nilai-P adalah angka statistik untuk menyimpulkan jika ada hubungan antara Average_Pulse dan Calorie_Burnage.

Kami menguji apakah nilai sebenarnya dari koefisien sama dengan nol (tidak ada hubungan). Uji statistik untuk ini disebut pengujian Hipotesis.

  • Nilai P yang rendah (<0,05) berarti koefisien kemungkinan tidak sama dengan nol.
  • Nilai P yang tinggi (> 0,05) berarti kita tidak dapat menyimpulkan bahwa variabel penjelas mempengaruhi variabel terikat (di sini: jika Average_Pulse mempengaruhi Kalori_Pembakaran).
  • Nilai P yang tinggi juga disebut nilai P yang tidak signifikan.

Pengujian Hipotesis

Pengujian hipotesis adalah prosedur statistik untuk menguji apakah hasil Anda valid.

Dalam contoh kami, kami menguji apakah koefisien sebenarnya dari Average_Pulse dan intersep sama dengan nol.

Uji hipotesis memiliki dua pernyataan. Hipotesis nol dan hipotesis alternatif.

  • Hipotesis nol dapat secara singkat ditulis sebagai H0
  • Hipotesis alternatif dapat secara singkat ditulis sebagai HA

Secara matematis ditulis:

H0: Average_Pulse = 0
HA: Average_Pulse ≠ 0
H0: Intercept = 0
HA: Intercept ≠ 0

Tanda berarti "tidak sama dengan"


Pengujian Hipotesis dan Nilai-P

Hipotesis nol bisa ditolak atau tidak.

Jika kita menolak hipotesis nol, kita menyimpulkan bahwa ada hubungan antara Average_Pulse dan Calorie_Burnage. Nilai P digunakan untuk kesimpulan ini.

Ambang batas umum dari nilai-P adalah 0,05.

Catatan: Nilai P 0,05 berarti bahwa 5% dari waktu, kami akan secara salah menolak hipotesis nol. Ini berarti bahwa kita menerima bahwa 5% dari waktu, kita mungkin salah menyimpulkan suatu hubungan.

Jika P-value lebih kecil dari 0,05, kita dapat menolak hipotesis nol dan menyimpulkan bahwa ada hubungan antar variabel.

Namun, nilai P Average_Pulse adalah 0,824. Jadi, kita tidak dapat menyimpulkan hubungan antara Average_Pulse dan Calorie_Burnage.

Artinya ada peluang 82,4% bahwa koefisien sebenarnya dari Average_Pulse adalah nol.

Intersep digunakan untuk menyesuaikan kemampuan fungsi regresi untuk memprediksi lebih tepat. Oleh karena itu jarang untuk menafsirkan nilai-P dari intersep.