Tabel distribusi frekuensi adalah tabel yang digunakan untuk menyajikan data dengan cara mengelompokkan nilai-nilai data ke dalam kategori atau kelas, serta menunjukkan berapa banyak data (frekuensi) yang termasuk dalam setiap kategori atau kelas tersebut. Tabel ini memudahkan dalam memahami pola dan penyebaran data.
CONTOH : Jarak (mil) yang ditempuh oleh suatu tipe kendaraan per gallon bahan bakar adalah:
Buat tabel distribusi frekuensi dan histogramnya
> x=c(15.7,16.2,18.2,16.3,17.9,18.1,16.8,17.6,18.1,16.7,16.7,16.0,17.4,17.0,18.6,17.1,14.1,17.5,17.0,17.6,15.6,16.0,17.7,16.1,18.6,15.2,17.1,19.5,17.0,16.9,16.9,16.7,17.3,16.3,17.3,17.0,15.6,15.6,17.9,16.0,17.7,18.2,14.7,17.1,15.2,17.0,17.8,16.1,18.2,16.5,17.7,18.8,14.6,16.5,16.6,15.6,14.9,17.5,16.1,18.5,15.8,16.9,17.3,17.1,15.9,17.1,17.1,16.4,15.6,16.3)
> max(x)
[1] 19.5
> min(x)
[1] 14.1
> R=max(x)-min(x)
> R
[1] 5.4
> K=1+3.3*log(70)
> K
[1] 15.02003
> K1=ceiling(K)
> K1
[1] 16
> K1=round(x)
> K1
[1] 16 16 18 16 18 18 17 18 18 17 17 16 17 17 19 17 14 18 17 18 16 16 18 16 19 15 17
[28] 20 17 17 17 17 17 16 17 17 16 16 18 16 18 18 15 17 15 17 18 16 18 16 18 19 15 16
[55] 17 16 15 18 16 18 16 17 17 17 16 17 17 16 16 16
> P=R/K
> P
[1] 0.3595198
> P1=round(P)
> P1
[1] 0
> frekuensi=function(x,y,z){
+ a=0
+ for(i in 1:length(x)){
+ if(x[i]>=y&&x[i]<=z){
+ a=a+1
+ }
+ }
+ print(a)
+ }
> frekuensi(x,14.1,14.4)
[1] 1
> frekuensi(x,14.5,14.8)
[1] 2
> frekuensi(x,14.9,15.2)
[1] 3
> frekuensi(x,15.3,15.6)
[1] 5
> frekuensi(x,15.7,16.0)
[1] 6
> frekuensi(x,16.1,16.4)
[1] 8
> frekuensi(x,16.5,16.8)
[1] 7
> frekuensi(x,16.9,17.2)
[1] 14
> frekuensi(x,17.3,17.6)
[1] 8
> frekuensi(x,17.7,18.0)
[1] 6
> frekuensi(x,18.1,18.4)
[1] 5
> frekuensi(x,18.5,18.8)
[1] 4
> frekuensi(x,18.9,19.2)
[1] 0
> frekuensi(x,19.3,19.6)
[1] 1
> interval=c("14.1-14.4","14.5-14.8","14.9-15.2","15.3-15.6","15.7-16.0","16.1-16.4","16.5-16.8","16.9-17.2","17.3-17.6","17.7-18.0","18.1-18.4","18.5-18.8","18.9-19.2","19.3-19.6")
> xi=c(mean(14.1:14.4),mean(14.5:14.8),mean(14.9:15.2),mean(15.3:15.6),mean(15.7:16.0),mean(16.1:16.4),mean(16.5:16.8),mean(16.9:17.2),mean(17.3:17.6),mean(17.7:18.0),mean(18.1:18.4),mean(18.5:18.8),mean(18.9:19.2),mean(19.3:19.6))
> fi=c(1,2,3,5,6,8,7,14,8,6,5,4,0,1)
> fixi=fi*xi
> xi
[1] 14.1 14.5 14.9 15.3 15.7 16.1 16.5 16.9 17.3 17.7 18.1 18.5 18.9 19.3
> tabel=data.frame(interval,xi,fi,fixi)
> tabel
interval xi fi fixi
1 14.1-14.4 14.1 1 14.1
2 14.5-14.8 14.5 2 29.0
3 14.9-15.2 14.9 3 44.7
4 15.3-15.6 15.3 5 76.5
5 15.7-16.0 15.7 6 94.2
6 16.1-16.4 16.1 8 128.8
7 16.5-16.8 16.5 7 115.5
8 16.9-17.2 16.9 14 236.6
9 17.3-17.6 17.3 8 138.4
10 17.7-18.0 17.7 6 106.2
11 18.1-18.4 18.1 5 90.5
12 18.5-18.8 18.5 4 74.0
13 18.9-19.2 18.9 0 0.0
14 19.3-19.6 19.3 1 19.3
Saya bulatkan ke atas, sehingga panjang kelasnya (P) = 0.4
HISTOGRAM :
Hitung ukuran pemusatan, penyebaran, dan letak, kemudian buat box plotnya!
BOXPLOT :
Kesimpulan apa yang bisa dinyatakan dari data tersebut?
- Dari table distribusi frekuensi di point (a), diketahui jarak (mil) yang ditempuh tiap kendaraan per gallon bahan bakar dengan jumlahan (frekuensi) terbanyak berada di jarak antara 16,9-17,2 mil yaitu 14 kendaraan. Dan jumlahan terendah di jarak antara 18,9-19,2 mil, yaitu 0 kendaraan.
- Hampir seluruh data yang termuat di table tersebut memiliki jarak (mil) yang ditempuh tiap kendaraan per gallon bahan bakar yang berbeda.
- Boxplot di point (b), jarak (mil) yang ditempuh tiap kendaraan per gallon bahan bakar menunjukkan bagian bawah yang lebih panjang, dan juga histogram di point (a) menunjukkan kemiringan data kekiri (negative skewness), sehingga modus > mean.
- Dari perhitungan di point (b), diketahui besarnya Mean : 16,82, Median : 16,92, dan Varian : 1,163315.






Tidak ada komentar:
Posting Komentar