Ilmu Data - Tabel Regresi: R-Squared


R - Kuadrat

R-Squared dan Adjusted R-Squared menggambarkan seberapa baik model regresi linier cocok dengan titik data:

Tabel Regresi - Statistik Koefisien

Nilai R-Squared selalu antara 0 sampai 1 (0% sampai 100%).

  • Nilai R-Squared yang tinggi berarti banyak titik data yang dekat dengan garis fungsi regresi linier.
  • Nilai R-Squared yang rendah berarti garis fungsi regresi linier tidak sesuai dengan data dengan baik.

Contoh Visual dari Nilai R - Kuadrat Rendah (0,00)

Model regresi kami menunjukkan nilai R-Squared nol, yang berarti bahwa garis fungsi regresi linier tidak sesuai dengan data dengan baik.

Ini dapat divisualisasikan ketika kita memplot fungsi regresi linier melalui titik data Average_Pulse dan Calorie_Burnage.

R Rendah - Nilai Kuadrat (0,00)

Contoh Visual dari Nilai R - Kuadrat Tinggi (0,79)

Namun, jika kita memplot Duration dan Calorie_Burnage , R-Squared meningkat. Di sini, kita melihat bahwa titik-titik data dekat dengan garis fungsi regresi linier:

R Rendah - Nilai Kuadrat (0,00)

Berikut adalah kode dalam Python:

Contoh

import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats

full_health_data = pd.read_csv("data.csv", header=0, sep=",")

x = full_health_data["Duration"]
y = full_health_data ["Calorie_Burnage"]

slope, intercept, r, p, std_err = stats.linregress(x, y)

def myfunc(x):
 return slope * x + intercept

mymodel = list(map(myfunc, x))

print(mymodel)

plt.scatter(x, y)
plt.plot(x, mymodel)
plt.ylim(ymin=0, ymax=2000)
plt.xlim(xmin=0, xmax=200)
plt.xlabel("Duration")
plt.ylabel ("Calorie_Burnage")

plt.show()

Ringkasan - Memprediksi Pembakaran Kalori dengan Rata-Rata_Pulse

Bagaimana kita bisa meringkas fungsi regresi linier dengan Average_Pulse sebagai variabel penjelas?

  • Koefisien sebesar 0,3296 yang berarti Average_Pulse berpengaruh sangat kecil terhadap Kalori_Pembakaran.
  • Nilai P tinggi (0,824), yang berarti kita tidak dapat menyimpulkan hubungan antara Average_Pulse dan Calorie_Burnage.
  • Nilai R-Squared sebesar 0, yang berarti garis fungsi regresi linier tidak sesuai dengan data dengan baik.