İstatistik Terimler Sözlüğü
admin · 01 Ocak 2026 · 1205 kelime · 4 dk
Kayıt: 1 Ocak 2026 05:01 · Güncelleme: 1 Ocak 2026 05:01
İstatistik (Statistics): Verilerden anlam çıkarmak için kullanılan yöntemler bütünü. Tanımlayıcı istatistik (özetleme) ve çıkarımsal istatistik (genelleme) olarak iki ana kola ayrılır.
1) Temel Kavramlar ve Veri Yapısı
- İstatistik (Statistics): Verilerden anlam çıkarmak için kullanılan yöntemler bütünü. Tanımlayıcı istatistik (özetleme) ve çıkarımsal istatistik (genelleme) olarak iki ana kola ayrılır.
- Anakütle / Popülasyon (Population): İncelenmek istenen tüm birimler (tüm müşteriler, tüm hastalar gibi). Popülasyona ait gerçek değerler çoğunlukla doğrudan ölçülemez.
- Örneklem (Sample): Popülasyondan seçilen daha küçük bir grup. Amaç, örneklem üzerinden popülasyon hakkında güvenilir çıkarım yapmaktır.
- Gözlem (Observation): Her bir birime ait ölçülen kayıt (bir kişinin boy-kilo kaydı gibi).
- Veri Noktası (Data Point): Tek bir ölçüm veya kayıt değeri.
- Veri Seti (Dataset): Gözlemlerin bir araya geldiği tablo/koleksiyon. Genelde satırlar gözlem, sütunlar değişkenleri temsil eder.
- Değişken (Variable): Ölçülen özellik (yaş, gelir, memnuniyet puanı). Analizde bağımsız/bağımlı rol üstlenebilir.
- Nicel Değişken (Quantitative Variable): Sayısal büyüklük ifade eder; aritmetik işlemler anlamlıdır (gelir, sıcaklık).
- Nitel/Kategorik Değişken (Qualitative/Categorical Variable): Sınıf veya kategori ifade eder (şehir, ürün tipi). Sayısal kod verilse bile aritmetik anlam taşımayabilir.
- Kesikli Değişken (Discrete Variable): Sayılabilir; genelde tam sayılardan oluşur (arızalı ürün sayısı).
- Sürekli Değişken (Continuous Variable): Bir aralıkta teorik olarak sonsuz değer alır (ağırlık, süre).
- Ölçüm Düzeyi (Level of Measurement): Değişkenin türünü ve uygulanabilir istatistikleri belirler (nominal/ordinal/interval/ratio).
- Nominal Ölçek (Nominal Scale): Sadece sınıflandırma; sıra yok (kan grubu).
- Ordinal Ölçek (Ordinal Scale): Sıra var, aralıkların anlamı yok (memnuniyet: düşük-orta-yüksek).
- Eşit Aralıklı Ölçek (Interval Scale): Aralıklar anlamlı, mutlak sıfır yok (Celsius).
- Oransal Ölçek (Ratio Scale): Mutlak sıfır var; oranlar anlamlı (kg, metre).
2) Tanımlayıcı İstatistik ve Özet Ölçüler
- Merkezi Eğilim (Central Tendency): Verinin “tipik” değerini özetleyen ölçüler (ortalama, medyan, mod).
- Aritmetik Ortalama (Mean): Değerlerin toplamı / gözlem sayısı. Uç değerlere duyarlıdır; simetrik dağılımlarda iyi temsil eder.
- Ağırlıklı Ortalama (Weighted Mean): Her gözleme farklı önem (ağırlık) vererek hesaplanan ortalama; kredi notu gibi bileşik ölçümlerde kullanılır.
- Medyan (Median): Sıralı verinin ortasındaki değer. Aykırılara dayanıklıdır; özellikle çarpık dağılımlarda tercih edilir.
- Mod (Mode): En sık görülen değer/kategori. Kategorik veride merkezi eğilimin temel ölçüsüdür.
- Yayılım (Dispersion/Variability): Verinin ne kadar “dağıldığını” gösteren ölçüler (varyans, std sapma, IQR).
- Minimum (Minimum): En küçük gözlem; veri aralığının alt sınırını verir.
- Maksimum (Maximum): En büyük gözlem; veri aralığının üst sınırını verir.
- Aralık (Range): Maksimum − minimum. Basit bir yayılım ölçüsü; aykırılara çok duyarlıdır.
- Çeyrekler (Quartiles): Veriyi %25’lik dilimlere bölen değerler: Q1 (%25), Q2=medyan (%50), Q3 (%75).
- Çeyrekler Açıklığı (Interquartile Range, IQR): Q3 − Q1. Orta %50’lik verinin yayılımını verir; aykırılara dayanıklıdır.
- Varyans (Variance): Sapmaların karelerinin ortalaması. Kare alma nedeniyle büyük sapmaları daha fazla cezalandırır.
- Standart Sapma (Standard Deviation): Varyansın karekökü; birimi veriyle aynıdır, bu yüzden yorumlanması daha kolaydır.
- Ortalama Mutlak Sapma (Mean Absolute Deviation, MAD): Sapmaların mutlak değerlerinin ortalaması; bazı alanlarda daha “robust” kabul edilir.
- Yüzdelikler (Percentiles): Veriyi yüzde dilimlerine bölen eşikler (P90 = verinin %90’ı bunun altında).
- Özet İstatistik (Summary Statistics): Ortalama, medyan, std sapma, min-max gibi hızlı veri özeti.
3) Grafikler ve Dağılım Şekli
- Histogram (Histogram): Sürekli veriyi “bin” denen aralıklara bölerek frekanslarını gösterir; dağılımın şeklini görmeyi sağlar.
- Kutu Grafiği (Boxplot): Q1-Q3 kutusu, medyan çizgisi, bıyıklar ve aykırıları gösterir; gruplar arası hızlı karşılaştırmada etkilidir.
- Dağılım Grafiği (Scatter Plot): İki nicel değişken arasındaki ilişkiyi noktalarla gösterir; doğrusal/ doğrusal olmayan ilişkiler görülebilir.
- Çubuk Grafik (Bar Chart): Kategorik verinin frekanslarını/sıklıklarını gösterir; histogramdan farkı kategorik olmasıdır.
- Yoğunluk Grafiği (Density Plot): Histogramın pürüzsüzleştirilmiş hali; dağılım karşılaştırmalarında kullanılır.
- Normal Dağılım (Normal Distribution): Simetrik çan eğrisi; birçok test ve güven aralığı yaklaşımının temel varsayımıdır.
- Çarpıklık (Skewness): Kuyruğun yönünü ifade eder: sağa çarpık (pozitif), sola çarpık (negatif). Ortalama-medyan ilişkisini etkiler.
- Basıklık (Kurtosis): Kuyrukların “ağırlığı” ve tepe sivriliği hakkında fikir verir; uç değer olasılığıyla ilişkilidir.
- Aykırı Değer (Outlier): Genel dağılımdan belirgin uzak gözlem. Hatalı kayıt veya gerçek ama uç bir durum olabilir; etkisi analiz amacına göre ele alınır.
4) Olasılık ve Temel Dağılımlar
- Olasılık (Probability): Bir olayın gerçekleşme derecesi (0–1). Frekans yorumu (uzun vadeli oran) ve öznel yorumları vardır.
- Örnek Uzay (Sample Space): Tüm olası sonuçlar kümesi (yazı-tura gibi).
- Olay (Event): Örnek uzayın bir alt kümesi (tura gelmesi).
- Birleşim (Union): A veya B olayının olması.
- Kesişim (Intersection): Hem A hem B’nin olması.
- Koşullu Olasılık (Conditional Probability): B gerçekleşmişken A’nın olasılığı; bağımlılık analizinde kritiktir.
- Bağımsızlık (Independence): Bir olayın olasılığının diğerinden etkilenmemesi.
- Rastgele Değişken (Random Variable): Sonucu sayısallaştıran fonksiyon; ayrık veya sürekli olabilir.
- Olasılık Dağılımı (Probability Distribution): Rastgele değişkenin değerlerine olasılık atayan yapı (PMF/PDF).
- Beklenen Değer (Expected Value): Teorik uzun dönem ortalaması; karar verme ve risk ölçümünde kullanılır.
- Varyans (Variance): Rastgele değişkenin belirsizliği/yayılımı; riskin matematiksel ölçüsüdür.
- Bernoulli Dağılımı (Bernoulli Distribution): 0/1 sonuçlu tek deneme (başarı/başarısızlık).
- Binom Dağılımı (Binomial Distribution): n bağımsız Bernoulli denemesindeki başarı sayısı.
- Poisson Dağılımı (Poisson Distribution): Sabit zaman/alan başına olay sayısı (arama çağrısı, arıza).
- Uniform Dağılım (Uniform Distribution): Belirli aralıkta her değerin eşit olasılıklı olması.
- Üstel Dağılım (Exponential Distribution): Olaylar arası süre; Poisson sürecinde bekleme zamanı.
- t Dağılımı (t Distribution): Küçük örneklem ve bilinmeyen varyansta ortalama çıkarımı için kullanılır.
- Ki-kare Dağılımı (Chi-square Distribution): Varyans ve kategorik testlerde ortaya çıkar.
5) Örnekleme, Tahmin ve Güven Aralıkları
- Örnekleme (Sampling): Popülasyondan veri toplama yöntemi; sonuçların genellenebilirliğini belirler.
- Basit Rastgele Örnekleme (Simple Random Sampling): Her birimin eşit seçilme şansı olduğu yöntem.
- Tabakalı Örnekleme (Stratified Sampling): Popülasyonu tabakalara ayırıp her tabakadan örnekleme; temsil gücünü artırır.
- Küme Örneklemesi (Cluster Sampling): Birimleri tek tek değil, kümeler halinde seçme; maliyeti düşürür ama varyansı artırabilir.
- Örneklem Dağılımı (Sampling Distribution): Bir istatistiğin (ör. ortalama) örneklemden örnekleme nasıl değiştiği.
- Standart Hata (Standard Error): Bir tahminin örnekleme nedeniyle beklenen oynaklığı; std sapmanın “tahmin belirsizliği” versiyonu.
- Nokta Tahmini (Point Estimate): Parametre için tek değer önerisi (örneklem ortalaması gibi).
- Yanlılık (Bias): Tahmin yönteminin sistematik olarak gerçek değerden sapması.
- Tutarlılık (Consistency): Örneklem büyüdükçe tahminin doğru değere yaklaşması.
- Güven Aralığı (Confidence Interval): Tek sayı yerine belirsizliği içeren aralık tahmini.
- Güven Düzeyi (Confidence Level): Yöntemin uzun vadede doğru aralığı kapsama oranı (genelde %95).
- Hata Payı (Margin of Error): Güven aralığının yarı genişliği; örneklem büyüdükçe azalır.
6) Hipotez Testleri ve Karar Teorisi
- Hipotez (Hypothesis): Popülasyon hakkında test edilebilir iddia.
- Sıfır Hipotezi (Null Hypothesis, H₀): “Etki/fark yok” varsayımı; test bunun aleyhine kanıt arar.
- Alternatif Hipotez (Alternative Hypothesis, H₁): “Etki/fark var” iddiası; yönlü/yönsüz olabilir.
- Test İstatistiği (Test Statistic): Veriden hesaplanan karar ölçüsü (t, z, χ² gibi).
- p-değeri (p-value): H₀ doğru varsayımı altında en az gözlenen kadar uç bir sonuç görme olasılığı. Küçük p, H₀’a karşı kanıt demektir.
- Anlamlılık Düzeyi (Significance Level, α): H₀’ı reddetmek için kabul edilen maksimum yanlış alarm oranı (Tip I hata).
- Tip I Hata (Type I Error): H₀ doğruyken reddetmek (yanlış pozitif).
- Tip II Hata (Type II Error): H₀ yanlışken reddetmemek (yanlış negatif).
- Test Gücü (Power): H₀ yanlışken onu reddetme olasılığı (1 − β). Örneklem büyüklüğü ve etki boyutuna bağlıdır.
- Tek Kuyruk / Çift Kuyruk (One-tailed / Two-tailed): Alternatif hipotezin yönlü veya yönsüz olması.
- Etki Büyüklüğü (Effect Size): İstatistiksel anlamlılıktan bağımsız olarak etkinin pratik büyüklüğü (Cohen’s d gibi).
- Çoklu Karşılaştırma (Multiple Comparisons): Birden fazla test yapılınca yanlış pozitif riski artar; düzeltme gerekebilir.
- Bonferroni Düzeltmesi (Bonferroni Correction): Çoklu testlerde α’yı test sayısına bölerek daha sıkı eşik kullanma.
7) Yaygın Testler ve Yöntemler
- Z-Testi (Z-test): Varyans biliniyorsa veya büyük örneklemde ortalama için kullanılan test.
- t-Testi (t-test): Küçük örneklem/ bilinmeyen varyansta ortalama karşılaştırması (tek örneklem, bağımsız iki örneklem, eşleştirilmiş).
- Ki-Kare Testi (Chi-square Test): Kategorik değişkenlerde bağımsızlık/uygunluk testi.
- ANOVA (Analysis of Variance): İkiden fazla grubun ortalamasını karşılaştırma; varyans bileşenleri üzerinden çalışır.
- Post-hoc Test (Post-hoc Test): ANOVA sonrası hangi grupların farklı olduğunu belirlemek için ek testler.
- Kruskal–Wallis Testi (Kruskal–Wallis Test): ANOVA’nın parametrik olmayan alternatifi; sıralamalara dayanır.
- Mann–Whitney U Testi (Mann–Whitney U Test): İki bağımsız grubun parametrik olmayan karşılaştırması.
- Wilcoxon İşaretli Sıralar (Wilcoxon Signed-Rank): Eşleştirilmiş ölçümler için parametrik olmayan test.
8) İlişki, Kovaryans, Regresyon
- Kovaryans (Covariance): İki değişkenin birlikte nasıl değiştiğini gösterir; işaret yönü verir ama ölçeğe bağlıdır.
- Korelasyon Katsayısı (Correlation Coefficient): Kovaryansın ölçekten arındırılmış hali (genelde Pearson r); -1 ile +1 arası.
- Pearson Korelasyonu (Pearson Correlation): Doğrusal ilişkiyi ölçer; uç değerlere duyarlıdır.
- Spearman Korelasyonu (Spearman Correlation): Sıralamalara dayanır; monoton ilişkiyi ölçer, daha robust olabilir.
- Basit Doğrusal Regresyon (Simple Linear Regression): Tek bağımsız değişkenle Y’yi tahmin eder; hata terimi içerir.
- Çoklu Regresyon (Multiple Regression): Birden fazla bağımsız değişkenle tahmin; karıştırıcı (confounder) kontrolü için kullanılır.
- Katsayı (Coefficient): Regresyonda değişkenin marjinal etkisini temsil eden parametre tahmini.
- R-Kare (R-squared): Modelin toplam varyansın ne kadarını açıkladığını gösteren uyum ölçüsü (açıklanan varyans oranı).
Henüz yorum yok.