İstatistik Terimler Sözlüğü

Dakikadaki kelime 300 Blok boyutu 1 Toplam 1205 kelime
Metni okumaya başlamak için Başlat’a dokun.
0%
Ücretsiz içerik TR

İstatistik Terimler Sözlüğü

admin · 01 Ocak 2026 · 1205 kelime · 4 dk

Kayıt: 1 Ocak 2026 05:01 · Güncelleme: 1 Ocak 2026 05:01

İstatistik (Statistics): Verilerden anlam çıkarmak için kullanılan yöntemler bütünü. Tanımlayıcı istatistik (özetleme) ve çıkarımsal istatistik (genelleme) olarak iki ana kola ayrılır.

1) Temel Kavramlar ve Veri Yapısı


  1. İstatistik (Statistics): Verilerden anlam çıkarmak için kullanılan yöntemler bütünü. Tanımlayıcı istatistik (özetleme) ve çıkarımsal istatistik (genelleme) olarak iki ana kola ayrılır.
  2. Anakütle / Popülasyon (Population): İncelenmek istenen tüm birimler (tüm müşteriler, tüm hastalar gibi). Popülasyona ait gerçek değerler çoğunlukla doğrudan ölçülemez.
  3. Örneklem (Sample): Popülasyondan seçilen daha küçük bir grup. Amaç, örneklem üzerinden popülasyon hakkında güvenilir çıkarım yapmaktır.
  4. Gözlem (Observation): Her bir birime ait ölçülen kayıt (bir kişinin boy-kilo kaydı gibi).
  5. Veri Noktası (Data Point): Tek bir ölçüm veya kayıt değeri.
  6. Veri Seti (Dataset): Gözlemlerin bir araya geldiği tablo/koleksiyon. Genelde satırlar gözlem, sütunlar değişkenleri temsil eder.
  7. Değişken (Variable): Ölçülen özellik (yaş, gelir, memnuniyet puanı). Analizde bağımsız/bağımlı rol üstlenebilir.
  8. Nicel Değişken (Quantitative Variable): Sayısal büyüklük ifade eder; aritmetik işlemler anlamlıdır (gelir, sıcaklık).
  9. Nitel/Kategorik Değişken (Qualitative/Categorical Variable): Sınıf veya kategori ifade eder (şehir, ürün tipi). Sayısal kod verilse bile aritmetik anlam taşımayabilir.
  10. Kesikli Değişken (Discrete Variable): Sayılabilir; genelde tam sayılardan oluşur (arızalı ürün sayısı).
  11. Sürekli Değişken (Continuous Variable): Bir aralıkta teorik olarak sonsuz değer alır (ağırlık, süre).
  12. Ölçüm Düzeyi (Level of Measurement): Değişkenin türünü ve uygulanabilir istatistikleri belirler (nominal/ordinal/interval/ratio).
  13. Nominal Ölçek (Nominal Scale): Sadece sınıflandırma; sıra yok (kan grubu).
  14. Ordinal Ölçek (Ordinal Scale): Sıra var, aralıkların anlamı yok (memnuniyet: düşük-orta-yüksek).
  15. Eşit Aralıklı Ölçek (Interval Scale): Aralıklar anlamlı, mutlak sıfır yok (Celsius).
  16. Oransal Ölçek (Ratio Scale): Mutlak sıfır var; oranlar anlamlı (kg, metre).



2) Tanımlayıcı İstatistik ve Özet Ölçüler


  1. Merkezi Eğilim (Central Tendency): Verinin “tipik” değerini özetleyen ölçüler (ortalama, medyan, mod).
  2. Aritmetik Ortalama (Mean): Değerlerin toplamı / gözlem sayısı. Uç değerlere duyarlıdır; simetrik dağılımlarda iyi temsil eder.
  3. Ağırlıklı Ortalama (Weighted Mean): Her gözleme farklı önem (ağırlık) vererek hesaplanan ortalama; kredi notu gibi bileşik ölçümlerde kullanılır.
  4. Medyan (Median): Sıralı verinin ortasındaki değer. Aykırılara dayanıklıdır; özellikle çarpık dağılımlarda tercih edilir.
  5. Mod (Mode): En sık görülen değer/kategori. Kategorik veride merkezi eğilimin temel ölçüsüdür.
  6. Yayılım (Dispersion/Variability): Verinin ne kadar “dağıldığını” gösteren ölçüler (varyans, std sapma, IQR).
  7. Minimum (Minimum): En küçük gözlem; veri aralığının alt sınırını verir.
  8. Maksimum (Maximum): En büyük gözlem; veri aralığının üst sınırını verir.
  9. Aralık (Range): Maksimum − minimum. Basit bir yayılım ölçüsü; aykırılara çok duyarlıdır.
  10. Çeyrekler (Quartiles): Veriyi %25’lik dilimlere bölen değerler: Q1 (%25), Q2=medyan (%50), Q3 (%75).
  11. Çeyrekler Açıklığı (Interquartile Range, IQR): Q3 − Q1. Orta %50’lik verinin yayılımını verir; aykırılara dayanıklıdır.
  12. Varyans (Variance): Sapmaların karelerinin ortalaması. Kare alma nedeniyle büyük sapmaları daha fazla cezalandırır.
  13. Standart Sapma (Standard Deviation): Varyansın karekökü; birimi veriyle aynıdır, bu yüzden yorumlanması daha kolaydır.
  14. Ortalama Mutlak Sapma (Mean Absolute Deviation, MAD): Sapmaların mutlak değerlerinin ortalaması; bazı alanlarda daha “robust” kabul edilir.
  15. Yüzdelikler (Percentiles): Veriyi yüzde dilimlerine bölen eşikler (P90 = verinin %90’ı bunun altında).
  16. Özet İstatistik (Summary Statistics): Ortalama, medyan, std sapma, min-max gibi hızlı veri özeti.



3) Grafikler ve Dağılım Şekli


  1. Histogram (Histogram): Sürekli veriyi “bin” denen aralıklara bölerek frekanslarını gösterir; dağılımın şeklini görmeyi sağlar.
  2. Kutu Grafiği (Boxplot): Q1-Q3 kutusu, medyan çizgisi, bıyıklar ve aykırıları gösterir; gruplar arası hızlı karşılaştırmada etkilidir.
  3. Dağılım Grafiği (Scatter Plot): İki nicel değişken arasındaki ilişkiyi noktalarla gösterir; doğrusal/ doğrusal olmayan ilişkiler görülebilir.
  4. Çubuk Grafik (Bar Chart): Kategorik verinin frekanslarını/sıklıklarını gösterir; histogramdan farkı kategorik olmasıdır.
  5. Yoğunluk Grafiği (Density Plot): Histogramın pürüzsüzleştirilmiş hali; dağılım karşılaştırmalarında kullanılır.
  6. Normal Dağılım (Normal Distribution): Simetrik çan eğrisi; birçok test ve güven aralığı yaklaşımının temel varsayımıdır.
  7. Çarpıklık (Skewness): Kuyruğun yönünü ifade eder: sağa çarpık (pozitif), sola çarpık (negatif). Ortalama-medyan ilişkisini etkiler.
  8. Basıklık (Kurtosis): Kuyrukların “ağırlığı” ve tepe sivriliği hakkında fikir verir; uç değer olasılığıyla ilişkilidir.
  9. Aykırı Değer (Outlier): Genel dağılımdan belirgin uzak gözlem. Hatalı kayıt veya gerçek ama uç bir durum olabilir; etkisi analiz amacına göre ele alınır.



4) Olasılık ve Temel Dağılımlar


  1. Olasılık (Probability): Bir olayın gerçekleşme derecesi (0–1). Frekans yorumu (uzun vadeli oran) ve öznel yorumları vardır.
  2. Örnek Uzay (Sample Space): Tüm olası sonuçlar kümesi (yazı-tura gibi).
  3. Olay (Event): Örnek uzayın bir alt kümesi (tura gelmesi).
  4. Birleşim (Union): A veya B olayının olması.
  5. Kesişim (Intersection): Hem A hem B’nin olması.
  6. Koşullu Olasılık (Conditional Probability): B gerçekleşmişken A’nın olasılığı; bağımlılık analizinde kritiktir.
  7. Bağımsızlık (Independence): Bir olayın olasılığının diğerinden etkilenmemesi.
  8. Rastgele Değişken (Random Variable): Sonucu sayısallaştıran fonksiyon; ayrık veya sürekli olabilir.
  9. Olasılık Dağılımı (Probability Distribution): Rastgele değişkenin değerlerine olasılık atayan yapı (PMF/PDF).
  10. Beklenen Değer (Expected Value): Teorik uzun dönem ortalaması; karar verme ve risk ölçümünde kullanılır.
  11. Varyans (Variance): Rastgele değişkenin belirsizliği/yayılımı; riskin matematiksel ölçüsüdür.
  12. Bernoulli Dağılımı (Bernoulli Distribution): 0/1 sonuçlu tek deneme (başarı/başarısızlık).
  13. Binom Dağılımı (Binomial Distribution): n bağımsız Bernoulli denemesindeki başarı sayısı.
  14. Poisson Dağılımı (Poisson Distribution): Sabit zaman/alan başına olay sayısı (arama çağrısı, arıza).
  15. Uniform Dağılım (Uniform Distribution): Belirli aralıkta her değerin eşit olasılıklı olması.
  16. Üstel Dağılım (Exponential Distribution): Olaylar arası süre; Poisson sürecinde bekleme zamanı.
  17. t Dağılımı (t Distribution): Küçük örneklem ve bilinmeyen varyansta ortalama çıkarımı için kullanılır.
  18. Ki-kare Dağılımı (Chi-square Distribution): Varyans ve kategorik testlerde ortaya çıkar.



5) Örnekleme, Tahmin ve Güven Aralıkları


  1. Örnekleme (Sampling): Popülasyondan veri toplama yöntemi; sonuçların genellenebilirliğini belirler.
  2. Basit Rastgele Örnekleme (Simple Random Sampling): Her birimin eşit seçilme şansı olduğu yöntem.
  3. Tabakalı Örnekleme (Stratified Sampling): Popülasyonu tabakalara ayırıp her tabakadan örnekleme; temsil gücünü artırır.
  4. Küme Örneklemesi (Cluster Sampling): Birimleri tek tek değil, kümeler halinde seçme; maliyeti düşürür ama varyansı artırabilir.
  5. Örneklem Dağılımı (Sampling Distribution): Bir istatistiğin (ör. ortalama) örneklemden örnekleme nasıl değiştiği.
  6. Standart Hata (Standard Error): Bir tahminin örnekleme nedeniyle beklenen oynaklığı; std sapmanın “tahmin belirsizliği” versiyonu.
  7. Nokta Tahmini (Point Estimate): Parametre için tek değer önerisi (örneklem ortalaması gibi).
  8. Yanlılık (Bias): Tahmin yönteminin sistematik olarak gerçek değerden sapması.
  9. Tutarlılık (Consistency): Örneklem büyüdükçe tahminin doğru değere yaklaşması.
  10. Güven Aralığı (Confidence Interval): Tek sayı yerine belirsizliği içeren aralık tahmini.
  11. Güven Düzeyi (Confidence Level): Yöntemin uzun vadede doğru aralığı kapsama oranı (genelde %95).
  12. Hata Payı (Margin of Error): Güven aralığının yarı genişliği; örneklem büyüdükçe azalır.



6) Hipotez Testleri ve Karar Teorisi


  1. Hipotez (Hypothesis): Popülasyon hakkında test edilebilir iddia.
  2. Sıfır Hipotezi (Null Hypothesis, H₀): “Etki/fark yok” varsayımı; test bunun aleyhine kanıt arar.
  3. Alternatif Hipotez (Alternative Hypothesis, H₁): “Etki/fark var” iddiası; yönlü/yönsüz olabilir.
  4. Test İstatistiği (Test Statistic): Veriden hesaplanan karar ölçüsü (t, z, χ² gibi).
  5. p-değeri (p-value): H₀ doğru varsayımı altında en az gözlenen kadar uç bir sonuç görme olasılığı. Küçük p, H₀’a karşı kanıt demektir.
  6. Anlamlılık Düzeyi (Significance Level, α): H₀’ı reddetmek için kabul edilen maksimum yanlış alarm oranı (Tip I hata).
  7. Tip I Hata (Type I Error): H₀ doğruyken reddetmek (yanlış pozitif).
  8. Tip II Hata (Type II Error): H₀ yanlışken reddetmemek (yanlış negatif).
  9. Test Gücü (Power): H₀ yanlışken onu reddetme olasılığı (1 − β). Örneklem büyüklüğü ve etki boyutuna bağlıdır.
  10. Tek Kuyruk / Çift Kuyruk (One-tailed / Two-tailed): Alternatif hipotezin yönlü veya yönsüz olması.
  11. Etki Büyüklüğü (Effect Size): İstatistiksel anlamlılıktan bağımsız olarak etkinin pratik büyüklüğü (Cohen’s d gibi).
  12. Çoklu Karşılaştırma (Multiple Comparisons): Birden fazla test yapılınca yanlış pozitif riski artar; düzeltme gerekebilir.
  13. Bonferroni Düzeltmesi (Bonferroni Correction): Çoklu testlerde α’yı test sayısına bölerek daha sıkı eşik kullanma.



7) Yaygın Testler ve Yöntemler


  1. Z-Testi (Z-test): Varyans biliniyorsa veya büyük örneklemde ortalama için kullanılan test.
  2. t-Testi (t-test): Küçük örneklem/ bilinmeyen varyansta ortalama karşılaştırması (tek örneklem, bağımsız iki örneklem, eşleştirilmiş).
  3. Ki-Kare Testi (Chi-square Test): Kategorik değişkenlerde bağımsızlık/uygunluk testi.
  4. ANOVA (Analysis of Variance): İkiden fazla grubun ortalamasını karşılaştırma; varyans bileşenleri üzerinden çalışır.
  5. Post-hoc Test (Post-hoc Test): ANOVA sonrası hangi grupların farklı olduğunu belirlemek için ek testler.
  6. Kruskal–Wallis Testi (Kruskal–Wallis Test): ANOVA’nın parametrik olmayan alternatifi; sıralamalara dayanır.
  7. Mann–Whitney U Testi (Mann–Whitney U Test): İki bağımsız grubun parametrik olmayan karşılaştırması.
  8. Wilcoxon İşaretli Sıralar (Wilcoxon Signed-Rank): Eşleştirilmiş ölçümler için parametrik olmayan test.



8) İlişki, Kovaryans, Regresyon


  1. Kovaryans (Covariance): İki değişkenin birlikte nasıl değiştiğini gösterir; işaret yönü verir ama ölçeğe bağlıdır.
  2. Korelasyon Katsayısı (Correlation Coefficient): Kovaryansın ölçekten arındırılmış hali (genelde Pearson r); -1 ile +1 arası.
  3. Pearson Korelasyonu (Pearson Correlation): Doğrusal ilişkiyi ölçer; uç değerlere duyarlıdır.
  4. Spearman Korelasyonu (Spearman Correlation): Sıralamalara dayanır; monoton ilişkiyi ölçer, daha robust olabilir.
  5. Basit Doğrusal Regresyon (Simple Linear Regression): Tek bağımsız değişkenle Y’yi tahmin eder; hata terimi içerir.
  6. Çoklu Regresyon (Multiple Regression): Birden fazla bağımsız değişkenle tahmin; karıştırıcı (confounder) kontrolü için kullanılır.
  7. Katsayı (Coefficient): Regresyonda değişkenin marjinal etkisini temsil eden parametre tahmini.
  8. R-Kare (R-squared): Modelin toplam varyansın ne kadarını açıkladığını gösteren uyum ölçüsü (açıklanan varyans oranı).


Topluluk

Yorumlar

Yorum yapmak için giriş yapmalısın.

Henüz yorum yok.