1 Ocak 2016 Cuma

Temel İstatistikler

ORTALAMA



   Ortalama, veya başka bir ifadeyle veri setinin aritmetik ortalaması, X ̅  ifadesiyle gösterilir ve
Formülü şu şekildedir;


- Örneğin 13 tane 2010 NBA Las Angeles Lakers oyuncusunun ortalama aldığı ücretlerini bulalım.






      Daha öncede söylediğimiz gibi ortalama aykırı değerlerden çok etkilenir. Mesela burada Kobe Bryant’ın ödemesinin 23 milyon dolar civarında olduğunu görüyoruz ve diğerleriyle arasında büyük bir fark bulunuyor. Ve ortalamayı Kobe Brynat’ı çıkartıp hesapladığımızda 5 695 307 ortalama elde ederiz ve bunun ilk bulduğumuz ortalamayla arasında yaklaşık 1.3 milyon dolar fark vardır.

Medyan (Median)


        Ortaokul zamanlarında sınavlarda büyük bir kısım öğrenci düşük not alırken , bir kaç çalışkan
öğrencide sınavlardan sürekli 100 ve 100’e yakın notlar aldığı olurdu ve öğretmenler bunu sınıf geneline kötü performans olarak yansıtmazdı. Çünkü onlar muhtemelen genel ortalama için aritmetik ortalamayı kullanıyorlardı ve aritmetik ortalama aslında her zaman bu gibi durumlarda istatistikçilerin öğrenci notlarının merkezini bulmak için kullandıkları ölçüm yönetimi değildir. Çünkü daha öncede dediğimiz gibi aykırı değerlerden etkilenir.


    Peki aritmetik ortalamadan farklı olarak tipik bir NBA oyuncusunun aldığı ödemeyi veya bir sınıfta tipik bir öğrencinin sınavda ne kadar alabileceği notu nasıl hesaplarız? Verinin merkez değerini bulmak için kullanılan diğer istatistikte Medyandır. Medyan hala istatistikte tanınmayan bir kahraman aslında,insanlar medyanı kullanılması gerektiği kadar kullanmamakta.

Şimdi adım adım medyanı nasıl bulacağımıza bakalım ;



1- Verimizdeki numaraları küçükten büyüğe doğru sıralıyoruz.

2- Eğer veri setimizin gözlem sayısı tek sayı ise, tam olarak ortadaki sayımız medyanımız olur

3- Eğer veri setimizin gözlem sayısı çift sayı ise, veri setimiz ortasında 2 tane sayımız kalacak ve medyan için bu ortada kalan iki sayının ortalamasını almamız gerekecektir.




      Bu işlemleri NBA Los A. Lakers oyuncularının ödemelerini gösteren tabloya uyguladığımız zaman medyanımız 7.oyuncu DEREK FİSHER’in ödemesi olan 5 048 milyon dolar olduğunu görürüz.


Ortalama ve Medyanın Karşılaştırılması : HİSTOGRAM

    Veri setinizin şeklini sergileyebileceğimiz (Örneğin; ne kadar değer ortalamaya yakın/uzak, verinin merkezi ve ne kadar aykırı değere sahibiz) grafiklerden biride Histogram grafiğidir. Basitçe Histogram grafiği verinizin gruplarını, sayı veya yüzdelik olarak hangi grupta yer aldığını , organize eden ve görselleyen bir grafiktir.




- Eğer hist. grafiğinde verilerinizin çoğu sol tarafta ve bir kaç yüksek değer sağ tarafta ise buna sağ çarpıklık (skewed to the right.) denir. Bu durumda ortalama medyandan büyüktür
- Eğer hist. grafiğinde verilerinizin çoğu sağ tarafta ve bir kaç düşük değer sol tarafta ise buna sola çarpıklık (skewed to the left. ) denir. Bu durumda ortalama medyandan küçüktür.
- Eğer his.grafiğinde verileriniz sağ ve sola eşit ölçüde yayıldıysa bu durumda veriniz simetriktir.

Sağa Çarpıklık, Sola Çarpıklık ve Simetrik Olma Durumları - HİSTOGRAM



Değişim Hesaplamaları – Standart sapma
     Veri setinizde ne tür bir ölçüm yaparsanız yapın değişim her zaman vardır, çünkü her gözlem her değişkende aynı kesin değere sahip olmayacaktır. Örneğin, ev fiyatları, evden eve, yıldan yıla ve şehirden şehire değişim gösterir.
    Alışılmış en yaygın değişimi ölçme tekniği standart sapmadır. Standart sapma veri setimizin aritmetik ortalama etrafında ne kadar yoğunlaştığını ölçmektedir.

Hesaplanması ; 

Bir örneklem için standart sapmanın (s) formülü aşağıdaki gibidir ;






1.Veri setimizin ortalaması

2.Veri setimizdeki her sayının ortalamadan farkı ve bunun karelerilerinin toplamı 

3.Ve bulduğumuz sonucu gözlem sayısının bir eksiğine bölümü ardından sonucun kare kökü

4.Standart sapmanın kareside bize Varyansı verir.


Standart Sapma’nın Özellikleri;

Standart sapma hiç bir zaman negatif olmaz. Çünkü standart sapma bir nevi mesafe ölçer ve bunun negatif çıkması imkansızdır.

- Çok küçük bir ihtimalle Standart sapma ‘’0‘’ olabilir, ki böyle bir sonuç veri setinizdeki sayılar tam olarak aynı ise meydana gelir, yani değişim yoksa.

- Standart sapma aykırı değerlerden etkilenir (çok küçük veya çok büyük değerlerden). Çünkü standart sapma ortalamaya olan uzaklığı kapsar ve ortalama aykırı değerlerden etkilendiği için, standart sapmada aykırı değerlerden etkilenir.- Standart sapma veri setiyle aynı birime sahibidir.

Açıklık (range)


    Veri setindeki çeşitliliği ölçmek için kullanılan bir diğer ölçüm yöntemi de Açıklıktır. Açıklık veri setindeki en küçük değer ile veri setindeki en büyük değer arasındaki farktır. Oldukça basittir sadece yapmamız gereken bütün veri setinin sıraya koymak ve basit bir çıkarma işlemi.

Ampirik Kural(Empirical Rules)



Ampirik kuralda, eğer bir popülasyon normal dağılıyorsa ve aritmetik ortama μ , standart sapma σ ise

- Popülasyonun %68 lik kısmı ortalamadan ±1 standart sapma içine yayılmaktadır. ( Başka bir diyişle; ortalamanın 1 stardant sapma eksiğinin ve ortalamanın 1 standart sapma fazlasının arasındadır) İstatistiksel olarak notasyonunu şu şekilde gösteririz; μ±1σ

- Popülasyonun %95 lik kısmı ortalamadan ±2 satandart sapma içine yayılmaktadır. ( Başka bir diyişle; ortalamanın 2 standart sapma eksiğinin ve ortalamanın 2 standart sapma fazlasının arasındadır) İstatistiksel olarak notasyonunu şu şekilde gösteririz; μ±2σ

- Popülasyonun %99.7 lik kısmı ortalamadan ±3 satandard sapma içine yayılmaktadır. ( Başka bir diyişle; ortalamanın 3 stardant sapma eksiğinin ve ortalamanın 3 standart sapma fazlasının arasındadır) İstatistiksel olarak notasyonunu şu şekilde gösteririz; μ±3σ




















 

Hiç yorum yok:

Yorum Gönder