Panda - Merencanakan



Merencanakan

Pandas menggunakan plot()metode untuk membuat diagram.

Kita dapat menggunakan Pyplot, sebuah submodul dari library Matplotlib untuk memvisualisasikan diagram di layar.

Baca lebih lanjut tentang Matplotlib di Tutorial Matplotlib kami .

Contoh

Impor pyplot dari Matplotlib dan visualisasikan DataFrame kami:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

Contoh di halaman ini menggunakan file CSV yang disebut: 'data.csv'.

Unduh data.csv atau Buka data.csv


Plot Pencar

Tentukan bahwa Anda menginginkan plot pencar dengan kindargumen:

kind = 'scatter'

Sebuah plot pencar membutuhkan sumbu x dan sumbu y.

Pada contoh di bawah ini kita akan menggunakan "Durasi" untuk sumbu x dan "Kalori" untuk sumbu y.

Sertakan argumen x dan y seperti ini:

x = 'Duration', y = 'Calories'

Contoh

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Hasil

Ingat: Pada contoh sebelumnya, kita mengetahui bahwa korelasi antara "Durasi" dan "Kalori" adalah 0.922721, dan kami menyimpulkan fakta bahwa durasi yang lebih tinggi berarti lebih banyak kalori yang terbakar.

Dengan melihat scatterplot, saya akan setuju.

Mari kita buat scatterplot lain, di mana ada hubungan yang buruk antara kolom, seperti "Duration" dan "Maxpulse", dengan korelasi 0.009403:

Contoh

Sebuah scatterplot di mana tidak ada hubungan antara kolom:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Hasil


w3schools CERTIFIED . 2021

Dapatkan Sertifikasi!

Selesaikan modul Pandas, kerjakan latihannya, ikuti ujiannya, dan Anda akan mendapatkan sertifikasi w3schools!

$10 DAFTAR

Histogram

Gunakan kindargumen untuk menentukan bahwa Anda menginginkan histogram:

kind = 'hist'

Sebuah histogram hanya membutuhkan satu kolom.

Histogram menunjukkan frekuensi setiap interval, misalnya berapa banyak latihan yang berlangsung antara 50 dan 60 menit?

Pada contoh di bawah ini kita akan menggunakan kolom "Duration" untuk membuat histogram:

Contoh

df["Duration"].plot(kind = 'hist')

Hasil

Catatan: Histogram memberi tahu kita bahwa ada lebih dari 100 latihan yang berlangsung antara 50 dan 60 menit.


Uji Diri Anda Dengan Latihan

Olahraga:

Masukkan sintaks yang benar untuk memvisualisasikan data dalam DataFrame sebagai diagram (plotting).

df.()