İSTATİSTİK

Ana kütlenin tümüne ulaşılamadığı durumda, ana kütle ile ilgili bir yargı elde etmek amacıyla üzerinde istatiksel değerlerin hesaplandığı gruba ÖRNEK adı verilir.

Gözardı edilemeyecek kadar önemli, gözönünde tutulması gereken fark anlamlı farktır.

Bir sınavda 4 seçenekli 40 soru soruluyor. Seçenekleri rasgele işaretleyen bir kişinin doğru cevaplarına ait beklenen frekansı 10 olur. Bir sorunun cevabının doğru olma olasılığı 1/4 olduğundan 40 x 1/4 = 10 bulunur.

Belli bir tanıma göre gerçekleşmesi umulan frekanslara beklenen frekanslar denir.

Hilesiz bir madeni paranın 9 kez atılışında 512 farklı sonuç elde edilir. 2N=29=512 bulunur.

Y ve T olayları karşılıklı ayrık olaylar olduğuna göre, Y veya T olayının olasılığını hesaplamak için iki olayın olasılıkları toplanır.

Hilesiz bir madeni para 10 kez atıldığında 1024 farklı sonuç elde edilir. 210=1024

"İki farklı ilacın da aynı hastalığa karşı etkileri arasında bir fark olup olmadığı sınanacaktır." Bu sınamada sıfır hipotezi: İki ilacın hastalığa karşı etkileri arasında fark yoktur.

Sıfır hipotezi ile iki ana kütlenin aynı olduğu kabul edilir.

Doğru olan sıfır hipotezinin reddedilmesi I.tür hatadır.

Bir hipotezi 0,02 anlam düzeyinde sınarken, doğru olan sıfır hipotezini reddederek hatalı karar verme olasılığı 0,02 dir.

Kilogramın kesirli değerlerini alabildiği için ağırlık sürekli bir değişkendir.

Puanlar: 90 87 80 65 53 43 Frekanslar: 1 3 3 7 8 2 ise puanı 87 ve daha az olanların toplam frekansı 23 olur. Çünkü 3+3+7+8+2=23

4 grubun gözlenen ve beklenen değerlerinin verildiği tablonun serbestlik derecesi 3 olur. Burada 1 satır verilmiş. kutucuk sayısı-1=4-1=3 bulunur.

Bir araştırmada erkek ve kadın sürücülerin öğrenim düzeylerine göre (ilköğretim, lise, yüksek) gözlenen frekansların verildiği tablonun serbestlik derecesi 2 olur. (2-1)x (3-1)=1x2=2

Gözlenen değeri 12, beklenen değeri 15 olan bir kutucuğun ki-kare değerine katkısı 0,6 dır. (12-15)x(12-15)=9 9/15=0,6

Günler: Pazartesi, Salı, Çarşamba, Perşembe, Cuma
Bilet sayısı: 30, 42, 33, 43, 40, 90,72
Günler arası farklılığın önemini belirlemek amacıyla yapılacak ki-kare uygunluk sınamasında Perşembe gününe ait gözlem sayısının ki-kareye katkısı en küçüktür. Ki-kare katkıları sırasıyla 8, 1.28 , 5.78, 0.98, 2, 32, 4.84 . Bunların en küçüğü 0.98 Buna karşı gelen gün Perşembe. Beklenen değer 350/7=50 dir. 30+42+33+43+40+90+72=350

Ayakkabı numarası: 38, 39, 40, 41, 42, 43, 44, 45
Ayakkabı sayısı: 2, 5,7,12,8,3,2,1 Bu frekans dağılımının modu 41 dir. Maksimum ayakkabı sayısı 12 olduğundan buna karşı gelen ayakkabı numarası 41. En sık gözlenen değer mod olmaktadır.

Gazete: F,G,H,J,K,L,M,N Satış sayısı: 20,40,28,64,12,86,45,49
Bir bayinin gazete satışlarına ait bir günlük gözlem değerlerinin yer aldığı bu serinin modu L dir. max 86 olduğundan buna karşı gelen L olmaktadır.

Not: 3,4,5,7,8,9 Frekans: 2,2,4,10,8,4 Bu frekans dağılımının aritmetik ortalaması 6.8 dir. N=2+2+4+10+8+4=30 3X2+4X2+5X4+7X10+8X8+9X4=204 204/30=6.8

Değerler: 6,8,9,12,a,15 Frekanslar: 4,5,5,7,3,1 Bu dağılımın aritmetik ortalaması 10 olduğuna göre a sayısı 14 olur. 6x4+8x5+9x5+12x7+ax3+15x1=208+3a
(208+3a)/25=10 Buradan a=42/3=14 bulunur.

2, 4, 6, 8, 10 serisinin varyansı 8 dir. Farkların karelerinin toplamının N=5 sayısına bölümü 8 olur. 40/5=8

Bir dağılımın sapma değerleri toplamı daima sıfırdır.

Aritmetik ortalaması 32, standart sapması 8 olan bir dağılımda X=22 değeri -1.25 standart değerine dönüşür. 22-32=-10 -10/8=-1.25 z=Standart değer=(Değer-Ortalama)/Sapma

5000 birimlik bir frekans eğrisinin altında kalan bölgelerden birinin oranlanmış alanı 0.25 tir. Bu bölgede birim sayısı 5000x0.25=1250 dir.

Normal eğri altında z=1.8 ile z=2.5 arasında kalan alan 0.0297 dir. Kitabınızın 184.sayfasındaki tablodan alan 0.4938-0.4641=0.0297 bulunur.

Aritmetik ortalaması 40 ton olan normal dağılımlı bir ana kütlede, ortalamadan 3 ton uzaktaki birimlerin z değeri z=1.25 bulunmuştur. Buna göre bu dağılımın standart sapması 2.40 bulunur. 1.25=(43-40)/s Buradan s=3/1.25=2.4 olur.

ÜNİTE 1 TEMEL KAVRAMLAR

İSTATİSTİK : Belli bir amaç için gözlenen yığın olaylardan verilerin derlenerek ilgili olayların incelenmesi ve yorumlanmasında kullanılan teknik ve yöntemler birimidir.
ÖRNEK : Osmangazi ilçesinde yaşayan ailelerin gelir düzeyleri hakkında bilgi edinilmek isteniyor bu amaçla 200 aile seçilerek araştırmaya başlanıyor.
ANAKÜTLE : Osmangazi ilçesinde yaşayan ailelerin tamamı.
ÖRNEKLEM : Seçilen 200 aile.
ANAKÜTLE : Hakkında bilgi edinilmek istenen topluluğun tamamına denir.
ÖRNEKLEM : Anakütle içinden seçilen ve anakütleyi temsil ettiğine inanılan alt topluluktur.

Anakütle


Örneklem


BİRİM : Yığın olay niteliğindeki her olaya birim denir. Canlı ve cansız varlıklar birim oluşturur. Bir olayın birim olabilmesi için sayılabilir ve ölçülebilir olması gerekir. Örnek çiçek,kalem gibi sevinç,korku,heyecan birim oluşturmaz.
BİRİM TÜRLERİ :
1. Maddesel varlığa sahip olan birimler (Sürekli) :
Birimler maddesel durumda ise bu tür birimlere ortamda devamlı ulaşabiliyorsa maddesel varlığa sahip olmayan birim denir.
2. Maddesel varlığa sahip olmayan birimler :
Trafik kazası doğum ölüm gibi ani biçimde ortaya çıkan bir anda olup biten birimlere denir.
Maddesel varlığı olmayan fakat gerçekte olan birimlerdir. Maddesel varlığa sahip olmayan birimler aynı zamanda ani birimlerdir.
3. Doğal birimler :
Parçalandığında yada birleştirildiğinde niteliğini kaybeden birimlere doğal birim denir. Örnek masa,araba,insan,kalem.
4. Doğal olmayan birim :
Parçalandığında yada birleştirildiğinde özelliğini kaybetmeyen birimlere denir. Örnek arsa,uzunluk(metre)
5. Gerçek birim :
Gerçekte var olan birimlere gerçek birim denir.
6. Varsayımsal birim :
Gerçekte var olmayan fakat oluşturulması düşünülen birimdir. Örnek 10 kişilik öğrenci grubundan seçilen 3 öğrenci grubu.
DE?İŞKEN : Birimlerin sahip olduğu özelliklere değişken denir. Değişkenin aldığı değerlerede şık denir.
Öğrencià öğrenci à boyu
Kilosu
Yaşı à 20
Birim 25 Şık
30
DE?İŞKEN TÜRLERİ :
· Zaman Değişkeni : Değişkenin aldığı değerler belli bir zaman içeriyorsa zaman değişkenidir. Örnek – Bir insanın doğum tarih , Şirket kuruluş yılı , Okulun kuruluş yılı
· Mekan Değişkeni : Değişkenin aldığı değerler mekana göre değişiyorsa mekan değişkenidir. Örnek – Doğum yeri , Üniversitenin kuruluş yeri gibi.
· Maddesel Değişken : Değişkenin aldığı değerler zamana ve mekana göre oluşmuyorsa maddesel değişkendir. Örnek – Cinsiyet , medeni hal.
ANAKÜTLE : Anakütle birimlerden oluşur. Anakütleyi oluştururken birimlerin aynı nedenlerin etkisi altında kalmasına dikkat edilir. Örneğin – öğrencilerle ilgili yapılan bir araştırmada anakütle tamamıyla öğrencilerden oluşmalıdır. Öğretmenler anakütlenin içine giremez.
KÜTLE TÜRLERİ :
· Gerçek Kütle : Gerçek birimlerden oluşmuş kütleye gerçek kütle denir.
· Varsayımsal Kütle : Varsayımsal birimlerden oluşan kütleye denir.
· Sonlu kütle : Kütledeki birimler sonlu sayıda ise yani sayılabiliyorsa bu tür kütlelere sonlu kütle denir. Örnek – Okuldaki öğrenciler.
· Sonsuz Kütle : Kütleyi oluşturan birimler sayılamıyorsa bu tür kütlelere sonsuz kütle denir. Örnek – Gökyüzündeki yıldızlar , denizdeki canlılar.
VERİ DERLEME :
· Ani veri derleme : Araştırılarak kütledeki birimler sürekli ise istenilen zaman gözlenmeye hazır olan bu birimlerin işlemlerine ani veri derleme denir. Örnek – Nüfus sıyımı ve işyeri sayımı diyebiliriz.
· Sürekli veri derleme : Kütle ani birimlerden oluşuyorsa belli bir aralıkta gözlenmesi gerekir. Bu işlemlerede sürekli veri derleme denir. Örnek – Doğum , ölüm.
· Genel veri derleme : Hakkında bilgi edinilmek istenilen kütlenin tamamının derlenmesine denir.
· Kısmi veri derleme : Hakkında bilgi edinilmek istenilen kütlenin birimleri arasından bir kısmının seçilerek derlenmesine denir.

Ünit two
İstatistik seriler
İstatistik serisi: derleme sonucunda elde edilen veriler bir veri yığını oluşturur. Verilerin büyüklüklerine göre sıralanması sonucu elde edilen rakamlar dizisine istatistik serisi adı verilir.
Geniş anlamda istatistik serileri: gözlem değerlerinin büyüklüklerine göre sıralanması ile oluşur.
Seri türleri:
Zaman serileri: gözlem sonuçları yıl ay hafta gibi zaman değişkenin sıklarına göre sıralanmasına zaman serisi adı verilir. Örnek: günün saatlerine göre trafik kazaları.
Mekân serileri: eğer gözlem sonuçları ülke bölge şehir ya da köy gibi bir mekân değişkenin şıklara göre sıralanmasına mekân serisi denir.
Dağılma serileri: gözlem sonuçların maddesel bir değişken şıklarına göre sıralanması ile oluşan serilere dağılma serileri denir.
Liste: eğer derlenen veriler ilgilenilen konunu dışında başka bir yönde örneğin gözlem sırasına göre sıralanmış ise bu sıralanmaya “liste” adı verilir.
Basit seri: liste belirlenen amaçlar doğrultusunda düzenlenirse başka bir anlatımla bir frekans dağılımı oluşturulur ise istenilen sonuçlara daha kısa sürede oluşulması ile elde edilen istatistik serisine “basit seri” denir.
Frekans serisi: verilerin daha kolay kavranması açısından gözlem değerlerinin yanına gözlem değerinin kaç kez tekrarlandığı kaydedilerek oluşturulan seriye “frekans seri” denir. Tekrarlara ise frekans denir.
Sınıflandırılmış( gruplandırılmış seriler) seriler: deney ya da gözlem sayıları çok iken deney ya da gözlem sonuçlarının belirli aralıklar ( sınıflar) içinde kalan şıklara göre düzenlenmesiyle oluşturulan istatistik serisine sınıflandırılmış seri denir.
Sınıf aralığı: bir sınıfın alt ve üst sınırları arasında ki farklara sınıf aralığı denir.
Açık sınıflar: başlangıç ve bitiş sınırları belirtilmeyen bu tür sınıflar açık sınıf denir.
Birikimli seri: her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan serilere birikimli seri denir. Bu tür oluşturula frekanslara da birimli frekans denir.
Birleşik seriler: birimlerin birden fazla değişkene göre dağılımlarının bir arada gösteren serilere birleşik seri denir. Birleşik serilerin grafiklerine serpilme diyagramı denir.
Sınıflandırılmış serilerin grafikte gösterilmesi:
Sınıflandırılmış seriler “histogram ya da frekans” poligonu adı verilir.
Histogram: alanı ile ilgili sınıfın frekansına ve tabanı da ilgili sınıfın aralığına eşit birbirine bitişik dikdörtgen lerden oluşan bir gösterimdir.
Frekans poligonumu: frekans poligonumu histogramın tepe orta noktaların birleştirilmesiyle elde edilen sınıflandırılmış serilere ilişkin grafik türüdür.
Ünit tree
Merkezi eğilim ve değişkenlik ölçüleri(ortalamalar)
Duyarlı ortalama: serilerdeki tüm gözlem değerlerinden etkilenen ortalamalardır.
Aritmetik ortalama: aritmetik ortalama bir seriyi oluşturulan gözlem değerleri toplamlarının gözlem sayısına oranı olarak tanımlanır.
Örnek: 3.5.7.9 sayılarının aritmetik ortalamasını bulalım.
X=3+5+7+9=24/4=6 bulunur.
Not: gözlem değerlerinin aritmetik ortalamadan cebirsel sapmalarının toplamı sıfırdır.
Tartılı aritmetik ortalama:
Gözlem değerleri arasında ki önem derecelerine göre farklar ortalama hesaplanırken göz önüne alınmak istenir ise tartılı ortalama denir.
Geometrik ortalama: seriyi oluşturan gözlem değerlerinin çarpımının gözlem değeri eşit mertebeden kökü alınarak tanımlanır.
Kareli ortalama: seriyi oluşturan gözlem değerlerinin kareli toplamlarının gözlem sayısına oranın karekökü alınarak hesaplanır.
Duyarlı olmayan ortalamalar:
Medyan: bir serinin medyanı ilgili seriyi tam eşit iki kısma bölen gözlem değeridir. Seriler küçükten büyüğe sıralanır.
Not: süreksiz serilerde medyanın hangi sıradaki gözlem değeri olduğu n serideki gözlem sayısını göstermek üzere (n+1)/2 ile bulunur.
Örnek: 150 adet gözlemden oluşan bir seride medyan; 150+1/2=75,5 bulunur.
Mod:
Bir seride en çok tekrarlanan değere mod adı verilir.
Örnek: 2 5 3 2 4 2 6 2 serisinin modunu bulalım?
Önce seriyi sıralayalım
2 2 2 3 4 5 6 seride en çok tekrarlanan değer iki olduğundan mod=2 dir.
Değişkenlik ölçütleri: bir seriyi oluştururken gözlem değerlerinin değer itibari ile birbirlerinden ya da ortalamalardan uzaklıkları esas alınarak oluşturulan ölçütlere değişkenli ölçüt denir.
Değişim aralığı: bir serideki en küçük değer ile en büyük değer arasındaki farktır.
D.A=X max-Xmin ile ifade edilir.
Örnek:
X
12
14
16
18
20 serinin değişim aralığı? D.A=20–12=8 dir.
Standart sapma: bir seriyi oluşturan gözlem değerlerinin aritmetik ortalamasında farklarının kareleri ortalamaları olarak tanımlanır. Sigma ile gösterilir.