Ilmu Data - Tabel Regresi: R-Squared
R - Kuadrat
R-Squared dan Adjusted R-Squared menggambarkan seberapa baik model regresi linier cocok dengan titik data:
Nilai R-Squared selalu antara 0 sampai 1 (0% sampai 100%).
- Nilai R-Squared yang tinggi berarti banyak titik data yang dekat dengan garis fungsi regresi linier.
- Nilai R-Squared yang rendah berarti garis fungsi regresi linier tidak sesuai dengan data dengan baik.
Contoh Visual dari Nilai R - Kuadrat Rendah (0,00)
Model regresi kami menunjukkan nilai R-Squared nol, yang berarti bahwa garis fungsi regresi linier tidak sesuai dengan data dengan baik.
Ini dapat divisualisasikan ketika kita memplot fungsi regresi linier melalui titik data Average_Pulse dan Calorie_Burnage.
Contoh Visual dari Nilai R - Kuadrat Tinggi (0,79)
Namun, jika kita memplot Duration dan Calorie_Burnage , R-Squared meningkat. Di sini, kita melihat bahwa titik-titik data dekat dengan garis fungsi regresi linier:
Berikut adalah kode dalam Python:
Contoh
import pandas as pd
import matplotlib.pyplot as plt
from scipy
import stats
full_health_data = pd.read_csv("data.csv", header=0, sep=",")
x = full_health_data["Duration"]
y =
full_health_data ["Calorie_Burnage"]
slope, intercept, r, p, std_err =
stats.linregress(x, y)
def myfunc(x):
return slope * x + intercept
mymodel = list(map(myfunc, x))
print(mymodel)
plt.scatter(x,
y)
plt.plot(x, mymodel)
plt.ylim(ymin=0, ymax=2000)
plt.xlim(xmin=0,
xmax=200)
plt.xlabel("Duration")
plt.ylabel ("Calorie_Burnage")
plt.show()
Ringkasan - Memprediksi Pembakaran Kalori dengan Rata-Rata_Pulse
Bagaimana kita bisa meringkas fungsi regresi linier dengan Average_Pulse sebagai variabel penjelas?
- Koefisien sebesar 0,3296 yang berarti Average_Pulse berpengaruh sangat kecil terhadap Kalori_Pembakaran.
- Nilai P tinggi (0,824), yang berarti kita tidak dapat menyimpulkan hubungan antara Average_Pulse dan Calorie_Burnage.
- Nilai R-Squared sebesar 0, yang berarti garis fungsi regresi linier tidak sesuai dengan data dengan baik.