Kategorik Verilerde Grafik
Veri setlerinin sergilemek için, özellikle tablolar ve grafikler akla gelebilecek her türlü alanda kullanılmaktadır. Anlık bilgilerin aktığı, herkesin sonuçları ve detaylara ayrılmış bilgileri hızlıca almak istediği bir toplumda yaşamaktayız ve bu durumda grafikler bizlerin vazgeçilmezi olmakta.
Bu kısımda sizlere kategorik verilerle nasıl grafik oluşturulacağından bahsedeceğim.
Pasta Grafiği
Pasta grafik veri setinde her bir gruba düşen yüzdeliklere göre verilemizi parçalara (dilimlere) ayırır. Tüm dilimlerin toplamı %100’dür.Siparişlerin Pasta Grafiği
Anketler üzerinde inceleme yaparken pasta grafiğini kullanmak da önemlidir. Örneğin; bu çalışmada |Dışarıdan en çok yemek sipariş edilen gün| anketinden yola çıkacağız.
Pasta grafiğinde en önemli nokta eğer örneklem büyüklüğünü bilmiyorsak sonuçlar hakkında kesin bir bilgi veremeyiz. Çünkü aşağıdaki örneği incelediğimizde Perşembe günleri %5 lik bir kısımın dışarıdan yemek sipariş ettiğini görmekteyiz. Ama eğer örneklem büyüklüğünü bilmiyorsak bu %5 lik kısım 5 kişi 500 kişi veya 5000 kişide olabilir.
Pasta grafikler sıklıkla toplam örneklem büyüklüğünü içermediği için, sizin sürekli örneklem büyüklüğünü incelemeniz gerekecektir, özellikle sonuçlar sizin için çok önemliyse.
Bar Grafiği
Bar grafiği belki de medyada kullanılmaya en çok alışılmış grafik türü. Aynı pasta grafiği gibi bar grafiğinde verilerimizi de gözlemleri kategorik gruplara ayırarak inceleme yapmamıza olanak sağlar. Pasta grafiğinden farklı olarak bu gözlemleri farklı boylarda çubuklar kullanarak sergiler. Pasta grafik her gruba düşen yüzdeliği gösterirken, bar grafik her gruba düşen gözlemlerin sayısal değerlerini kullanır. ( frekans da denilebilir)Örnek; Ulaşım harcamalarının Bar Grafik ile Karşılaştırılması ;
![]() |
USA Piyango Ödemeleri Bar Grafiği |
Nümerik Verilerde Grafik
Histogram Grafiği
Histogram grafiği nümerik verilerin gruplandırılması için kullandığımız özel bir grafik çeşididir. Örneğin; bir yaş grubu mesela 10-20,21-30,31-40. Histogram grafiğindeki barlar çubuk grafiğinden farklı olarak bu yaş grupları arasında bağlantı kurarlar. Histogram grafiğinde veri setimizdeki her bir birey bir çubuğa denk gelmektedir.Betimsel istatistikler olarak, veri setinin merkezini veya değişimi sadece histogram grafiğinden yararlanarak hesaplayamayız, çünkü; kesin olarak verilerimizin değerlerini bilmiyoruz. Bulgularımıza ayrıntı eklemek için, her zaman betimsel istatistikselerimizi hesaplamamız gerekmektedir.
Az önceki Oscar alan oyuncuların yaşlarının histogram grafiğinde yaşların sağa çarpık olarak dağıldığını görebiliriz. Ve ardından aşağıdaki Betimsel İstatistikler çıktısından medyanı 33 ve ortalamayı 35.69 olarak görmekteyiz.
Box Plot Grafiği
Boxplot nümerik verilerin 5-sayısal değeri(en küçük gözlem, birinci çeyrek, ortanca,3. çeyrek, en büyük gözlem) görselleştirmek için kullandığımız tek yönlü grafiktir. Bu 5 betimsel istatistik değeri aslında veri setimizinde her %25 düşen kısımları içermektedir.
Boxplot Grafiği Çizilirken İzlenilen Adımlar
1.Yukarıda söylediğimiz gibi 5 betimsel istatistik değeri bulunur.
1.Yukarıda söylediğimiz gibi 5 betimsel istatistik değeri bulunur.
2.Bulduğumuz 5 değeri içeren düşey sayı doğrusu kurulur.
3.Bulduğumuz 5 betimsel istatistiksel değerinin sayı doğrusu üzerindeki yerleri yukarısına denk gelen yerlere işaretlenir.
4.25. yüzdelik ve 75. yüzdelik arasına bir kutu çizilir.
5.Medyanın olduğu kısıma bir doğru çizilir.
6.Aykırı değerler saptanır
7.Eğer aykırı değer yoksa , veri setimizin minimum değerinden maximum değerine uzanan bir doğru çizilir.
8.Eğer aykırı değerler varsa , konumu ‘’ * ‘’ işareti ile belirtilir. (Aykırı değerlerin olduğu kısıma doğru çizilmez)
Adımlarımızı izleyerek oluşturduğumuz boxplot grafiğini incelediğimiz zaman . Oscar ödülü alan oyuncuların çoğunluk 25 ile 40 yaşları arasında olduğunu görürüz (Q1 veQ3 arası). Medyanımız 30 ile 35 yaş arasında olduğunu ve sağ tarafta bir kaç aykırı değerimiz olduğunu gözlemleyebiliriz.
ØBoxplot grafiğini sadece yatay
değil, dikey şekilde de çizebiliriz.
Hiç yorum yok:
Yorum Gönder