Distribusi Zipf


Distribusi zipf digunakan untuk mengambil sampel data berdasarkan hukum zipf.

Hukum Zipf: Dalam kumpulan, suku ke-n adalah 1/n kali suku paling umum. Misalnya kata umum ke-5 dalam bahasa Inggris telah muncul hampir 1/5 kali dari kata yang paling sering digunakan.

Ini memiliki dua parameter:

a- parameter distribusi.

size- Bentuk array yang dikembalikan.

Contoh

Gambarkan sampel untuk distribusi zipf dengan parameter distribusi 2 dengan ukuran 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

Visualisasi Distribusi Zipf

Contoh 1000 poin tetapi plot hanya satu dengan nilai < 10 untuk grafik yang lebih bermakna.

Contoh

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

Hasil