11 Ocak 2016 Pazartesi

Grafikler

Kategorik Verilerde Grafik

     Veri setlerinin sergilemek için, özellikle tablolar ve grafikler akla gelebilecek her türlü alanda kullanılmaktadır. Anlık bilgilerin aktığı, herkesin sonuçları ve detaylara ayrılmış bilgileri hızlıca almak istediği bir toplumda yaşamaktayız ve bu durumda grafikler bizlerin vazgeçilmezi olmakta.
    
     Bu kısımda sizlere kategorik verilerle nasıl grafik oluşturulacağından bahsedeceğim.

Pasta Grafiği

   Pasta grafik veri setinde her bir gruba düşen yüzdeliklere göre verilemizi parçalara (dilimlere) ayırır. Tüm dilimlerin toplamı %100’dür.


Siparişlerin Pasta Grafiği

     Anketler üzerinde inceleme yaparken pasta grafiğini kullanmak da önemlidir. Örneğin; bu çalışmada |Dışarıdan en çok yemek sipariş edilen gün| anketinden yola çıkacağız.
    
     Pasta grafiğinde en önemli nokta eğer örneklem büyüklüğünü bilmiyorsak sonuçlar hakkında kesin bir bilgi veremeyiz. Çünkü aşağıdaki örneği incelediğimizde Perşembe günleri %5 lik bir kısımın dışarıdan yemek sipariş ettiğini görmekteyiz. Ama eğer örneklem büyüklüğünü bilmiyorsak bu %5 lik kısım 5 kişi 500 kişi veya 5000 kişide olabilir.



    Pasta grafikler sıklıkla toplam örneklem büyüklüğünü içermediği için, sizin sürekli örneklem büyüklüğünü incelemeniz gerekecektir, özellikle sonuçlar sizin için çok önemliyse.


Bar Grafiği  

   Bar grafiği belki de medyada kullanılmaya en çok alışılmış grafik türü. Aynı pasta grafiği gibi bar grafiğinde verilerimizi de gözlemleri kategorik gruplara ayırarak inceleme yapmamıza olanak sağlar. Pasta grafiğinden farklı olarak bu gözlemleri farklı boylarda çubuklar kullanarak sergiler. Pasta grafik her gruba düşen yüzdeliği gösterirken, bar grafik her gruba düşen gözlemlerin sayısal değerlerini kullanır. ( frekans da denilebilir)


Örnek; Ulaşım harcamalarının Bar Grafik ile Karşılaştırılması ;
    Gelirlerine göre Amerikida yaşan insanlar evden işe, işten eve giderken ulaşım için ne kadar para harcarlar? Ulaşım İstatistikleri Bürosu böyle bir araştırma yapmış ve sonuçları bar grafik halinde sergilemiştir.

   Bu bar grafiği yıllık farklı hane gelir gruplarının ulaşım için ne kadar para harcadığını göstermektedir.



USA Piyango Ödemeleri Bar Grafiği

Nümerik Verilerde Grafik

Histogram Grafiği

    Histogram grafiği nümerik verilerin gruplandırılması için kullandığımız özel bir grafik çeşididir. Örneğin; bir yaş grubu mesela 10-20,21-30,31-40. Histogram grafiğindeki barlar çubuk grafiğinden farklı olarak bu yaş grupları arasında bağlantı kurarlar. Histogram grafiğinde veri setimizdeki her bir birey bir çubuğa denk gelmektedir.

Örnek; Oscar Ödülü Kazanan Oyuncuların Yaşları


   Bu örnekte 1928-2009 arası ödül kazanan oyuncuların yaşlarına histogram grafiği ile görselleştirme yapacağız. Ödül kazanan oyuncuların çoğunlukla gençmi , yaşlımı yoksa arasında mı, yaşları arasında bir yayılım varmı veya birbirine benzermi vb. sonuçları inceleyeceğiz.




     Burdaki yaş değişkenimiz veri setimiz için nümerik bir veri , yani histogram grafiğini bu veri seti için kullanabiliriz.



      Histogram grafiğini incelediğimiz zaman x ekseninde 5 yıl aralıklarla yaş grupları yer almaktadır. Belirli yaş grubuna düşen yüzdelikler ( veya göreceli sıklık) y ekseninde yer almaktadır. Örneğin %27 lik bir kısımda yaşı 30-35 arası olan oyuncular bulunmaktadır. Yine grafiği incelediğimizde oscar ödülü alan oyuncuların çocuğunun 25-40 yaş arasında olduğunu söyleyebiliriz.

     Betimsel istatistikler olarak, veri setinin merkezini veya değişimi sadece histogram grafiğinden yararlanarak hesaplayamayız, çünkü; kesin olarak verilerimizin değerlerini bilmiyoruz. Bulgularımıza ayrıntı eklemek için, her zaman betimsel istatistikselerimizi hesaplamamız gerekmektedir.
    Az önceki Oscar alan oyuncuların yaşlarının histogram grafiğinde yaşların sağa çarpık olarak dağıldığını görebiliriz. Ve ardından aşağıdaki Betimsel İstatistikler çıktısından medyanı 33 ve ortalamayı 35.69 olarak görmekteyiz.


 - Yaşaların sağa çarpık şekilde dağıldığını söyledik, hatırlarsanız bir önceki bölümde eğer ortalama medyandan büyükse örneklemimiz sağa çarpıktır demiştik ve bu örnekte de bunu görmekteyiz.

Box Plot Grafiği

    Boxplot nümerik verilerin 5-sayısal değeri(en küçük gözlem, birinci çeyrek, ortanca,3. çeyrek, en büyük gözlem) görselleştirmek için kullandığımız tek yönlü grafiktir. Bu 5 betimsel istatistik değeri aslında veri setimizinde her %25 düşen kısımları içermektedir.


Boxplot Grafiği Çizilirken İzlenilen Adımlar


1.Yukarıda söylediğimiz gibi 5 betimsel istatistik değeri bulunur.
2.Bulduğumuz 5 değeri içeren düşey sayı doğrusu kurulur.
3.Bulduğumuz 5 betimsel istatistiksel değerinin sayı doğrusu üzerindeki yerleri yukarısına denk gelen    yerlere işaretlenir.
4.25. yüzdelik ve 75. yüzdelik arasına bir kutu çizilir.
5.Medyanın olduğu kısıma bir doğru çizilir.
6.Aykırı değerler saptanır
7.Eğer aykırı değer yoksa , veri setimizin minimum değerinden maximum değerine uzanan bir doğru      çizilir.
8.Eğer aykırı değerler varsa , konumu ‘’ * ‘’ işareti ile belirtilir. (Aykırı değerlerin olduğu kısıma          doğru çizilmez)





   Adımlarımızı izleyerek oluşturduğumuz boxplot grafiğini incelediğimiz zaman . Oscar ödülü alan oyuncuların çoğunluk 25 ile 40 yaşları arasında olduğunu görürüz (Q1 veQ3 arası). Medyanımız 30 ile 35 yaş arasında olduğunu ve sağ tarafta bir kaç aykırı değerimiz olduğunu gözlemleyebiliriz.

ØBoxplot grafiğini sadece yatay değil, dikey şekilde de çizebiliriz.


Zaman Serisi Grafiği (Çizgi grafiği)

    Zaman serisi grafiğine aynı zamanda çizgi grafiği de denilir. Veri setimizdeki değerlerin zaman içindeki yükseliş ve alçalışını gösterir. Zaman serisi grafiğinde x ekseninde zaman, y ekseninde ise ölçülen değişkenimizin değerleri yer alır. Zaman serisi grafiğindeki her bir nokta belirli zamandaki toplanan verimizin özetini gösterir. Örneğin, şubat ayındaki ortalama biber fiyatı yada 2010 yılındaki toplam kazanç gibi.


    Bu grafiği az önce üzerinde çalıştığımız oscar ödülü alan oyuncular üzerinde uyguladığımız zaman. Bize yıllara göre hangi yaş aralığındaki oyuncuların ödül aldığını ve yıllara göre değişen ödül alan oyuncuların yaş artış ve azalışını çizgilerle göstermektedir.













Hiç yorum yok:

Yorum Gönder