Ilmu Data - Python DataFrame


Buat DataFrame dengan Panda

Bingkai data adalah representasi terstruktur dari data.

Mari kita definisikan bingkai data dengan 3 kolom dan 5 baris dengan angka fiksi:

Contoh

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)

Contoh Dijelaskan

  • Impor perpustakaan Pandas sebagai pd
  • Definisikan data dengan kolom dan baris dalam variabel bernama d
  • Buat bingkai data menggunakan fungsi pd.DataFrame()
  • Bingkai data berisi 3 kolom dan 5 baris
  • Cetak output bingkai data dengan fungsi print()

Kami menulis pd. di depan DataFrame() untuk memberi tahu Python bahwa kita ingin mengaktifkan fungsi DataFrame() dari perpustakaan Pandas.

Waspadai huruf kapital D dan F di DataFrame!


Menafsirkan Keluaran

Ini adalah outputnya:

Keluaran kerangka data

Kita melihat bahwa "col1", "col2" dan "col3" adalah nama kolom.

Jangan bingung tentang angka vertikal mulai dari 0-4. Mereka memberi tahu kami informasi tentang posisi baris.

Dalam Python, penomoran baris dimulai dengan nol.

Sekarang, kita dapat menggunakan Python untuk menghitung kolom dan baris.

Kita dapat menggunakan df.shape[1] untuk mencari jumlah kolom:

Contoh

Hitung jumlah kolom:

count_column = df.shape[1]
print(count_column)

Kita dapat menggunakan df.shape[0] untuk mencari jumlah baris:

Contoh

Hitung jumlah baris:

count_row = df.shape[0]
print(count_row)

Mengapa Kita Tidak Bisa Menghitung Baris dan Kolom Sendiri?

Jika kita bekerja dengan kumpulan data yang lebih besar dengan banyak kolom dan baris, akan membingungkan untuk menghitungnya sendiri. Anda berisiko salah menghitungnya. Jika kami menggunakan fungsi bawaan dalam Python dengan benar, kami memastikan bahwa hitungannya benar.