Panda - Merencanakan
Merencanakan
Pandas menggunakan plot()
metode untuk membuat diagram.
Kita dapat menggunakan Pyplot, sebuah submodul dari library Matplotlib untuk memvisualisasikan diagram di layar.
Baca lebih lanjut tentang Matplotlib di Tutorial Matplotlib kami .
Contoh
Impor pyplot dari Matplotlib dan visualisasikan DataFrame kami:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
Contoh di halaman ini menggunakan file CSV yang disebut: 'data.csv'.
Unduh data.csv atau Buka data.csv
Plot Pencar
Tentukan bahwa Anda menginginkan plot pencar dengan
kind
argumen:
kind = 'scatter'
Sebuah plot pencar membutuhkan sumbu x dan sumbu y.
Pada contoh di bawah ini kita akan menggunakan "Durasi" untuk sumbu x dan "Kalori" untuk sumbu y.
Sertakan argumen x dan y seperti ini:
x = 'Duration', y = 'Calories'
Contoh
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
Hasil
Ingat:
Pada contoh sebelumnya, kita mengetahui bahwa korelasi antara "Durasi" dan "Kalori" adalah 0.922721
, dan kami menyimpulkan fakta bahwa durasi yang lebih tinggi berarti lebih banyak kalori yang terbakar.
Dengan melihat scatterplot, saya akan setuju.
Mari kita buat scatterplot lain, di mana ada hubungan yang buruk antara kolom, seperti "Duration" dan "Maxpulse", dengan korelasi 0.009403
:
Contoh
Sebuah scatterplot di mana tidak ada hubungan antara kolom:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
Hasil
Dapatkan Sertifikasi!
$10 DAFTAR
Histogram
Gunakan
kind
argumen untuk menentukan bahwa Anda menginginkan histogram:
kind = 'hist'
Sebuah histogram hanya membutuhkan satu kolom.
Histogram menunjukkan frekuensi setiap interval, misalnya berapa banyak latihan yang berlangsung antara 50 dan 60 menit?
Pada contoh di bawah ini kita akan menggunakan kolom "Duration" untuk membuat histogram:
Contoh
df["Duration"].plot(kind = 'hist')
Hasil
Catatan: Histogram memberi tahu kita bahwa ada lebih dari 100 latihan yang berlangsung antara 50 dan 60 menit.