Önemli Olasılık Dağılımları ve Uygulamaları

Cahit Barkin Ozer
23 min readMay 3, 2024

En önemli olasılık dağılımlarını, onların özelliklerini ve kullanım alanlarını inceleyeceğiz.

En popüler olasılık dağılımları

Günlük yaşamımızda dünyayı esas olarak deterministik olarak algılarız. Her şey katı kurallara uyuyor gibi görünür ve her eylemin farklı bir çıktısı olduğunu varsayarız.

Günlük yaşamımızda sarkaçlı saat gibi (hava direncini veya sürtünmeyi ihmal edersek) gerçekten deterministik sistemler varken, basit sistemleri bile bu şekilde tanımlayamayacağımızı görürüz. Önreğin bir parayı atarsak yazı mı yoksa tura mı gelir? Gelecek saat içinde evimizin önünde yoldan tam olarak kaç araba geçecek? Bir mağazaya kaç müşteri girecek? Belirli bir donanım ne zaman bozulur? Bunların ve diğer olayların çoğuna baktığımızda, belirli bir durumdaki sonucu tanımlayamasak da, gözlemlenen olayların belirli bir modeli takip ettiğini görürüz. Bu, kazanan sayıları hiçbir şekilde tahmin edemediğimiz piyango çekilişinde olduğu gibi olayların ortaya çıkmasının tamamen rastgele olmadığı, ancak olayların düzenini oldukça doğru bir şekilde tanımlayabildiğimiz anlamına gelir.

Örneğin, bir sonraki saatte bir mağazaya girecek müşterilerin tam sayısını tahmin edemesek de, altta yatan davranışı dağılım açısından tanımlayabiliriz: Her sonuç, diyelim ki, 10, 11, 12 veya daha fazla müşteri gözlemliyoruz. önümüzdeki saat içinde bir olasılıkla ilişkilendirilebilir. Bu dağılımları beklenen değer (ortalama) veya varyans gibi tanımlayıcı istatistikler açısından da tanımlayabiliriz.

Binom ve Negatif Binom Dağılımı (Binomial and Negative Binomial Distributions)

Bernoulli Denemeleri (Bernoulli Trials)

Bir e-ticaret sitemiz olduğunu varsayalım. Amacımız özet olarak müşteriye ürünlerimizi satmaktır. Bu sitede ödeme butonunu nereye yerleştirmeliyiz? Bir tasarımda buton sağ üstte, diğerinde ise sol üstte; hangisi daha çok satış getirir?

Buna A/B testi denir. İstatistik dilinde ise buna Bernoulli denemesi denir ve bu sonuçlara A ve B diyebiliriz. Genellikle bir şeyi başarmak istediğimiz için sonuçlar “başarı” veya “başarısızlık” olarak etiketlenir. Bir web sayfasına reklam yerleştirirsek, müşterilerin reklama tıklayacağını ve reklam kampanyamızın başarılı olacağını umuyoruz. A sonucunu gözlemleme olasılığı P(A) = p ile veriliyorsa, B için karşılık gelen olasılık P(B) = q = 1 − p olur. Bunun nedeni yalnızca iki seçeneğimizin olmasıdır, A veya B ve dolayısıyla A’yı gözlemlersek B’yi gözlemleyemeyiz ve bunun tersi de geçerlidir.

Bir X rastgele değişkeni, başarı olasılığı p olan bir Bernoulli denemesini tanımladığında, genellikle X~B(p) yazılır.

Binom Dağılımı (Binomial Distribution)

Binom dağılımı n bağımsız Bernoulli denemesi yaparsak ne olacağını açıklar. Örneğin, parayı n kez atarsa, parayı her atışımız diğerlerinden bağımsızdır, bu da sonucun önceki gözlemlerin sırasına bağlı olmadığı anlamına gelir.

X rastgele değişkeni, A olayını gözlemleme olasılığımızı, yani n denememizde m kez “başarı” yaşamımızı tanımlar. Sonuç olarak X, şu değerleri alabilen ayrık bir rastgele değişkendir: 0, 1, 2, …, n. Denemelerimizi tamamladıktan sonra, X “başarımız” (veya A olayının gerçekleşmesi) ve n — X değeri “başarısızlıklarımız” olur. P (A) = p ve P (B) = q = 1 − p ile genel olasılık şu şekilde verilir: p^x * q^(n − x). Ancak bireysel olayların veya sonuçların bağımsız olduğunu da varsaydık. Bu, ABAB dizisinin AABB, BBAA veya BABA dizisiyle aynı olasılığa sahip olduğu anlamına gelir: Her durumda iki “başarı” ve iki “başarısızlık” bulunur.

Sonuç permütasyonlarının sayısı binom katsayısıyla verilir:

0 ⩽ k ⩽ n için bu, olayların sırası veya dizisi önemli değilse sonuçları düzenleyebileceğimiz yolların sayısını açıklar. Binom dağılımı, n denemede k “başarı” gözlemleme olasılığını tanımlar; burada p, tek bir deneme veya olayda bir “başarı” gözlemleme olasılığıdır:

Ortalama veya beklenti değeri şu şekilde verilir:

Bu, Binom dağılımının n Bernoulli denemesi dizisini tanımlaması gerçeğiyle sezgisel olarak anlaşılabilir. Her Bernoulli denemesinin başarı için bir beklenti değeri p vardır ve olayların bağımsız olduğunu varsaydığımız için serinin beklenti değeri np’dir.

Aşağıdaki görsel p = 0,1, 0,25, 0,50 ve p = 0,75 olan n = 100 deneme için dağılımın davranışını göstermektedir.

Örnek Binom Dağılım Grafiği

Örnek

Adil bir paranın 10 atıştan beşinde tura gelme olasılığı nedir? Paranın adil olduğunu varsayıyoruz, tura (veya “başarı”) olasılığı: p = 0,5. Dolayısıyla, eğer K tura sayısını gösteren rastgele değişken ise:

P(K=5) = 0.25

Pratik uygulamalarda aşağıdaki yineleme formülü genellikle faydalıdır:

Negatif Binom Dağılımı (Negative Binomial Distribution)

Şu ana kadar binom dağılımını tartışırken, sabit sayıdaki denemelerde başarı sayısını gözlemlediğimizi varsaydık. Örneğin, bir parayı 10 kez atıp gelen yazı ve tura sayısını gözlemlemek gibi.

Biz ayrıca şunu da sorabiliriz: K’inci başarıyı gözlemlemeden önce kaç tane başarısız deneme yapıyoruz? Bu sonucu elde etmenin bir yolu: Nihai başarıyı gözlemlemeden önce önce k — 1 başarıyı, sonra m başarısızlığı gözlemlektir. Yine, bir başarı gözlemleme olasılığı p ve başarısızlık olasılığı q = 1 − p’dir, dolayısıyla bu dizinin olasılığı şöyledir:

Bu özel dizi sadece bir permütasyondur ve olayların birbirinden bağımsız olduğunu unutmamamız gerekir. Bu değeri daha önce olduğu gibi binom katsayısıyla ifade edebiliriz ve negatif binom dağılımı şu şekilde verilir:

Burada m, k’inci başarıdan önceki başarısızlıkların sayısıdır, k başarıların sayısı ve p bir başarıyı gözlemleme olasılığıdır.

Dağılım adını ilişkiden alır:

Çünkü bu dağılım negatif tam sayılar için binom katsayısını tanımlar. Negatif binom dağılımının ortalaması ve varyansı şu şekilde verilebilir:

1.Soru:

Bize bir dizi gözlem veriliyor: 𝐴𝐵𝐴𝐵𝐴𝐵𝐴𝐵, burada 𝐴 “başarıyı” ve 𝐵 “başarısızlığı” ifade ediyor. Bunu binom dağılımıyla mı yoksa negatif binom dağılımıyla mı açıklayacağız?

Daha fazla bilgi olmadan bu soruya cevap veremeyiz. Verileri elde etmek için deneme sayısının sabit olup olmadığını bilmemiz gerekir. Başarıların sayısı sabit olsaydı negatif binom dağılımını kullanırdık, değilse binom dağılımı kullanırız.

Deneme sayısının sabitliğini şu örnekle daha iyi kavrayabilirsiniz. Adil bir parayı 10 kez atarsak ve tam olarak 7 tura gelme olasılığını bilmek istersek, deneme sayısı (10) sabittir, dolayısıyla binom dağılımını kullanırız. Üçüncü kez 6 gelene kadar zarı kaç kez atmamız gerektiğini bilmek istiyorsak, başarı sayısı (3) sabittir ancak deneme sayısı sabit değildir, dolayısıyla gerekli deneme sayısını belirlemek için negatif binom dağılımını kullanırız.

2. Soru:

Bir zarı altı kez atarsak, üç sayısının dört kez görülme olasılığı nedir?

2 farklı sonucu olan olasılıksal bir deneyin n sefer tekrarlanmasıyla alakalı bir soru olduğu için Binom olasılık formülünü kullanırız:

P(X=k)=( n k )*p^k * (1−p) ^ (n−k).

Değerleri formüle yerleştirirsek:

P(X=4) = (6 4) * (1/6)⁴ * (5/6)²= 0.0080

Gauss veya Normal Dağılım

Gauss veya normal dağılım istatistikteki en önemli dağılımlardan biridir. Tarihsel gelişmelerin daha karmaşık olmasına rağmen, bu Gauss’a (1877) atfedilmektedir. Normal dağılım günlük hayatımızın, bilimin ve mühendisliğin her alanında karşımıza çıkar.

x ∈ − ∞ , ∞ için normal bir rastgele değişken X, olasılık yoğunluk fonksiyonuna sahiptir:

Yoğunluk μ ve σ olmak üzere iki parametreye bağlıdır. μ dağılımın ortalama veya beklenti değerini ifade ederken σ standart sapmayı gösterir.

μ = 0 ve σ = 1 olarak ayarlarsak, yoğunluk fonksiyonu aşağıdaki şekilde gösterilen “standart” normal dağılımı elde ederiz. Normal dağılım genellikle N (μ, σ²) gösterimiyle gösterilir.

Normal dağılımın bu kadar önemli olmasının nedeni merkezi limit teoremidir.

Merkezi Limit Teoremi (Central Limit Theorem)

Birbirinden bağımsız n adet rassal değişken Xi’nin toplamı W = ∑_(i = 1)^n Xi’nin olasılık dağılımı, ortalama 〈X〉 ve varyans σ² ile bazı olasılık dağılımlarını takip eden Xi’lerin normal dağılımına yakınsayacaktır. Bu normal dağılımın ortalaması 〈W〉 = n 〈X〉 ve varyansı V [W] = nσ² olacaktır.

Diyelim ki bir restoranın günlük satışlarını inceliyorsunuz ve her günün satış miktarını rastgele değişkenlerle temsil ediyorsunuz. Bu rastgele değişkenlerin dağılımı belirli bir gün için düzensiz olabilir. Yani bazı günler satışlar daha fazla olurken bazı günler daha az olabiliyor. Ancak Merkezi Limit Teoremi bize, bu günlük satış verilerini bir yıl boyunca toplarsanız (toplamı alırsanız) bu toplamın dağılımının normal dağılıma yakınsadığını söyler. Yani örneğin bir yıldaki toplam günlük satışları incelediğinizde, günlük satışların dağılımının normal olup olmadığına bakılmaksızın sonuçların normal dağıldığını göreceksiniz. Bu, istatistiksel analiz yaparken toplam örneklemi kullanarak güvenilir sonuçlar elde etmenizi sağlar.

Matematiksel ifade edersek, n rastgele değişken Xi’nin xi değerlerinin toplamını alırsak, toplamın normal dağılıma yaklaşacağı anlamına gelir. Xi rastgele değişkenlerinin genel olarak aynı ve bağımsız olarak dağılması gerekir. Xi’nin aynı dağılımı takip etmediği ancak belirli bir yakınsama kriterinin varsayıldığı durumlar için merkezi limit teoreminin alternatifleri mevcuttur.

Bunu biraz daha iyi anlamak için ünlü Galton tahtasına bakalım. Tahta, içine misket koyduğumuz üst kısmındaki rezervuardan oluşur. Huni, misketleri düzenli bir ızgara halinde çivili bir tahtaya bırakır ve misketler daha sonra alttaki bir dizi yuvada toplanır. Bir misket çivilerin arasından düşerken sola ya da sağa doğru yönlendirilir; bu da her bir çivide, misketin sola gitmesi ve “başarıyı” tanımlayabileceğimiz bir Bernoulli denemesinin (iki farklı sonucu olan bir deney) yapıldığı anlamına gelir. Misket sağa doğru giderken “başarısızlık”. Misket çivilerden düşerken bu Bernoulli denemesi satır satır tekrarlanır ve sonunda her misket için Bernoulli denemelerinin toplamını gözlemleriz. Aşağıdaki şekilde sol kısımdan da görüleceği üzere ortaya çıkan dağılımın şekli normal dağılımı vermektedir.

Bunu başka bir şekilde de gösterebiliriz: Aşağıdaki şekil, 0 ve 1 aralığında tekdüze bir dağılıma göre dağıtılan beş rastgele sayıdan oluşan bir örneği göstermektedir; bu, bu aralıktaki her değerin ortaya çıkma olasılığının eşit olduğu anlamına gelir. Aşağıdaki şekilde gösterildiği gibi, bu toplamı hesaplamayı tekrarlarsak, bu yeni rastgele değişkenin dağılımı, yani düzgün dağılımdan elde ettiğimiz bireysel değerlerin toplamı, normal dağılıma yaklaşır.

Beş Rastgele 100 (solda) ve 100000 (sağda) Sayının Toplamlarının Dağılımı

Pratik uygulamalardaki muazzam önemi nedeniyle, ölçülen veya belirlenen değerlerin yanı sıra bir dağılım ilişkisini rapor ederken genellikle normal bir dağılım olduğunu varsayarız. Örneğin İtalya’da 18–30 yaş arası genç erkeklerin ortalama vücut kitle indeksinin (BMI) 23,05 ± 2 olduğunu söylersek. Şekil 83'ten BMI dağılımının μ = 23,05 ve σ = 2,83 ile normal bir dağılım izlediğini anlıyoruz. Uygulamada sıklıkla unutulan önemli bir detay, dağılımın yalnızca ≈%68'inin ±1σ dahilinde ve %32'sinin dışında olmasıdır. Örneğin, eğer 26,38'lik bir BMI ölçecek olsaydık, değer ±1σ aralığının dışında kalır (ama sadece bu kadarı) ve vakaların %32'sinde bunun olmasını beklerdik.

Belirsizliklerin gösterdiği aralığın dışında kalan değerlerin %32'den azını gözlemlersek, sonuçların doğru raporlanması durumunda bu durum şüphe uyandırmalıdır. İlk üç standart sapmanın dışındaki yüzdeler şöyledir:

1. Soru

Gerçekleşen olayların ne kadarı ||x — μ|| içindedir? ≤ σ?

Normal dağılımın belirli bir aralığına giren olayların oranı genellikle normal dağılımın kümülatif dağılım fonksiyonu (CDF) kullanılarak hesaplanır. Bu durumda ||x — μ|| aralığını dikkate alırsak ≤ σ, ortalamanın bir standart sapması dahilindeki olayları dikkate aldığımız anlamına gelir.
Standart bir normal dağılım için (ortalama µ = 0 ve standart sapma σ = 1 ile), ortalamanın bir standart sapması dahilindeki olayların oranı, o noktaya kadar eğrinin altında kalan alan tarafından verilir. Bu alan eğri altındaki toplam alanın yaklaşık %68'idir.

2. Soru

Merkezi limit teoremi, bağımsız ve aynı şekilde dağılmış rastgele değişkenlerin toplamının davranışı hakkında ne ifade eder?

Merkezi limit teoremine göre, çok sayıda bağımsız ve aynı şekilde dağıtılmış rastgele değişkenlerin toplamı (iid), bireysel değişkenlerin varyansının sonlu olması koşuluyla, bireysel rastgele değişkenlerin dağılımına bakılmaksızın normal bir dağılıma yakınlaşacaktır.

Poisson, Gama-Poisson ve Üstel (Exponential) Dağılım

Bir satranç tahtasına bir avuç pirinç atarsanız her kareye kaç tane pirinç düşer? Bu, günlük yaşam deneyimlerimizle kendimize sık sık sormadığımız bir soru olabilir, ancak bu tür sorular birçok farklı bağlamda karşımıza çıkabilir. Örneğin, bir kilometrekarelik alana kaç yıldırım düşer? Belirli bir süpermarkette herhangi bir günde belirli bir ürünün ne kadar satılacağı tahmin edilebilir mi? Bu gibi sorularda, belirli bir durumda kaç ürün sayabileceğimizi ve bu sayının, süreç tamamen tahmin edilebilir olsaydı beklediğimizden ne kadar farklı olabileceğini araştırmak isteriz.

Poisson Dağılımı

Poisson dağılımı, bir olayın belirli bir süre içinde kaç kez meydana gelme ihtimalinin olduğunu göstermek için kullanılır. Poisson dağılımı, tamamen rastgele bir süreç için tanımlanmış birim zaman aralığı başına gözlemlediğimiz öğelerin sayısı olan sayım verilerini tanımlar. X~P(λ) dağılımı şu şekilde tanımlanır:

Poisson dağılımı kesikli bir dağılımdır ve P (X = k), birim zaman başına ortalama λ olay gözlemlendiğinde k olayı gözlemleme olasılığıdır. Örneğin, belirli bir süpermarket mağazasında belirli bir ürünün ortalama olarak günde 5 kez satıldığını düşünelim:

k = 0, 1, 2, 3, … olan herhangi bir günde 0, 1, 2, 3, … öğenin satılma olasılığıdır.

Ortalama E [X] = λ = np’yi sabit tutarken çok sayıda n denemesi yaparsak Poisson dağılımı limit olarak ortaya çıkar.

Özellikle, λ parametresi arttıkça Poisson dağılımı Gaussian veya normal dağılıma yaklaşır.

Kanıt

Binom dağılımlarının XnB(n, p) sabit ortalama λ = np’li olduğu durumda, lim n → ∞ Χn için Poisson dağılımının XP(λ) olarak ortaya çıktığını gösterin.

Xn = k alma olasılığı:

Şimdi n →∞ limitini alıyoruz:

Poisson dağılımının ortalama veya beklenti değeri λ ile verilir ve varyansa eşittir. Bu, Poisson dağılımının yalnızca bir serbest parametreyle tanımlandığı anlamına gelir:

Bir süpermarket zincirinin satış verilerine bakarsak, bazı ürün satışlarının Poisson dağılımı tarafından oldukça iyi bir şekilde tanımlanabileceğini görebiliriz. Veriler ortalamanın varyansla aynı olmadığını gösteriyor, dolayısıyla Poisson dağılımı varsayımı pek geçerli değil, ancak beklenen davranışı gözlemlenen verilerle örtüştürürsek açıklamanın bizi doğru yöne işaret ettiğini görebiliriz.

Poisson Dağılımı Örneği

Bağımsız Poisson sayılarının toplamı bir Poisson’dur

Şimdi Poisson dağılımına göre dağılan bağımsız sayıların toplamının yine Poisson dağılımına göre dağıldığını göstereceğiz. λ1 ve λ2 parametreleriyle bir Poisson dağılımını takip eden iki rastgele değişken X1 ve X2 ile başlayalım. Z = X1 + X2'nin de Poisson dağılımını takip ettiğini göstermemiz gerekiyor. Başlangıç noktası şudur:

Z = X1 + X2 olduğundan, toplamı elde etmek için ikisini birleştirebileceğimiz tüm yolları elde etmek amacıyla x1 ve x2'yi seçmemiz gerekir. x1 ve x2'nin birbirinden bağımsız olduğunu varsaydığımız için ortak olasılık, bireysel olasılıkların çarpımında çarpanlara ayrılır:

P (X1 = j & X2 = z − j ) = P (X1 = j) P (X2 = z − j)

Bununla şunları yazabiliriz:

Bir sonraki adımda pay ve paydayı z! ile çarpıyoruz. Bunu hem payda hem de paydada yaptığımız için etkili bir şekilde 1 ile çarpıyoruz.

Burada e^(− λ1 + λ2) = e^(−λ)’yi ve z paydasını çarpanlara ayırdık! Binom katsayısının tanımını kullanarak:

İlk terimi toplamın içine daha rahat yazabiliriz:

Daha sonra binom kimliğini (identity) kullanırız (“kimlik” terimi, matematikte iki tarafı da eşit olan bir denklem veya ifadedir) :

Bunu yukarıdaki formülümüzle karşılaştırdığımızda şunu not ediyoruz:

Bunu tekrar yerine koyarsak şunu görüyoruz:

Bu da yine λ = λ1 + λ2 parametresiyle bir Poisson dağılımıdır.

Aynı yaklaşımı Poisson dağılımını takip eden daha fazla sayıya uygulayabiliriz. x1 + x2 + … + xn toplamı da λ = λ1 + λ2 + …λn parametresiyle bir Poisson dağılımını takip edecektir λ parametresi ne kadar büyük olursa, ortaya çıkan Poisson dağılımı, merkezi limit dağılım teoreminden beklediğimiz gibi, normal bir dağılıma o kadar çok benzer.

Gama-Poisson Karışımı Modeli (Gamma-Poisson Mixture Model)

Poisson dağılımının ana özelliği, yani ortalamanın varyansla aynı olması, aynı zamanda sınırlamasıdır: Poisson dağılımını, σ² > λ durumunda (σ: standart sapma, λ: belirli bir zaman diliminde olayın meydana gelme sayısı) aşırı dağılmış sayım verilerini tanımlamak için kullanamayız. Yukarıdaki şekilde görüldüğü gibi, altta yatan sürecin Poisson benzeri olduğunu görebilsek bile, onu tanımlamak için Poisson dağılımını kullanamayız. Bu nedenle ayrık sayım verilerini tanımlamak için daha genel bir yaklaşıma ihtiyacımız var. Poisson dağılımı, dağılımın ortalamasını tanımlayan bir serbest parametre λ tanımına sahiptir. Ancak bu, ortalamanın değerini belirsizlik olmadan bildiğimiz anlamına gelir. Pratik uygulamalarda ortalamanın kendisi tipik olarak rastgele bir değişkendir ve bu nedenle Bayes istatistiklerinde yapılabilecek bir olasılık dağılımıyla tanımlanması gerekir; Bu alanda, bir örneklemin bilgisi ve ön varsayım, modellenen dağılımın hesaplanmasına olanak sağlar. Gama dağılım ailesi, Poisson dağılımı için bir eş önseldir (Önceki bir eşlenik için, önceki, sondakiyle aynı dağılım ailesindendir) ve bu nedenle Gama’yı seçiyoruz. Poisson parametresi λ için önceki dağılım. Bu, ni = P X = k rastgele sayılarının, λ’nın sabit tek bir sayı olmadığı ancak bir Gama dağılımını takip ettiği bir Poisson dağılımı tarafından verildiği anlamına gelir. Bu, bir rastgele değişken X için şu anlama gelir:

X~Poisson (λ) burada λ~Gama (r, p)

Bu genellikle Gama olarak parametrelendirilir.

Burada r bir form parametresidir ve p/(1 − p) oranı binom dağılımından seçilir; bu, önceki p/(1 − p) gözlemlerindeki toplam r − 1 sayısını tanımladığını gösterir.

Bunu aşağıdaki evrişim integraliyle de ifade edebiliriz:

Gama-Poisson Karışım Modeli ve Negatif Binom Dağılımı

Gama-Poisson karışım modelinin negatif binom dağılımı olarak ifade edilebileceğini göstermek için evrişim integralinden başlıyoruz ve dağılımların tanımını ekliyoruz. Poisson dağılımının yoğunluk fonksiyonu ve Gama dağılımı:

Burada α bir şekil parametresidir ve β bir ters ölçek parametresidir. Gama işlevi, faktöriyelin tam sayı olmayan sayılara genişletilmesinden kaynaklanır.

ve

Bunu ekleyerek α = r ve β = (p/(1 − p))^−1 kullanarak (ters ölçek parametresi nedeniyle) şunu elde ederiz:

Aşağıdaki kimliği (identity’i) kullanarak:

İntegrali hesaplayabiliriz:

Daha sonra şunu yazabiliriz:

Bu, negatif binom dağılımını kullanmadan önce parametreyi bir Gama fonksiyonunu takip eden rastgele bir değişken olarak ele aldığımız bir Poisson sürecini tanımlayabileceğimiz anlamına gelir.

Gama-Poisson karışım modelinin avantajı, varyansın ortalamadan büyük olabilmesi nedeniyle Poisson dağılımına göre aşırı dağılmış rastgele olayları tanımlamasıdır. Aşağıdaki ilk şekilde μ = 0 durumu için bazı örnekler gösterilmektedir. 1, σ² = 0. 5, µ = 1. 5, σ² = 3. 5 ve μ = 15, σ²= 30. Aşağıdaki ikinci şekil, negatif binomun aynı ortalama ancak σ²> μ için Poisson dağılımına göre nasıl aşırı dağıldığını göstermektedir.

Poisson ve Negatif Binom Dağılımının Karşılaştırılması

Negatif binom dağılımının parametreleriyle dağılımın ortalaması ve varyansı arasında aşağıdaki ilişkiyi kullanabiliriz:

Burada σ² > μ olduğunu varsayıyoruz. σ² = μ durumu için Poisson dağılımını kullanacağız.

Yukarıdaki süpermarket örneğine dönecek olursak, aşağıdaki şekilde gösterildiği gibi verileri tanımlamak için Gamma-Poisson karışım modelini veya negatif binom dağılımını kullanabiliriz. Satış verilerini tanımlamak için kullanımı Yöneylem Araştırması (Operation Research) teorisinde iyice yerleşmiştir.

Gama-Poisson Dağılımı ile Yerleştirilen Süpermarket Satışlarının Sayısı

Üstel Dağılım

Şu ana kadarki tartışmamızda adet verilerini açıklamaya odaklandık; bu, belirli bir zaman biriminde kaç öğeyi gözlemleyebileceğimizi tanımladığımız anlamına geliyor. Bir süpermarkette belirli bir ürünün günlük satış sayısını bulmak veya bir duraktan günde kaç otobüs geçeceğini hesaplamak bunlara örnektir.

Alternatif olarak buna benzer başka bir soru da sorabiliriz: Bir sonraki olayı gözlemlemek için ne kadar beklememiz gerekmektedir? Bu durumda iki hız ve ortalama sayım olayı arasındaki süreyi tanımlamak istiyoruz, buna “varış süresi” (arrival time) denir. Daha önce Poisson dağılımının, birim zaman başına ortalama olarak kaç olayın gerçekleştiğini bildiğimiz rastgele olayları tanımladığını söylemiştik, yani sabit bir λ oranıyla (oran ve ortalama μ = λt ile bağlantılıdır). Bu durum için Poisson dağılımını şu şekilde yeniden yazabiliriz:

Artık böyle bir sürecin bir sonraki etkinliğe kadar varış süresini belirlemek istiyoruz. Yn, ölçümümüzün başlangıcından, yani saati başlattığımız andan n’inci ölçümü gözlemleyene kadar geçen süreyi göstersin. X(t), t zamanına kadar gözlemlediğimiz olayların sayısını, yani karşılık gelen sayım verilerini belirtir. İki miktar aşağıdaki şekilde ilişkilidir:

Sayım verilerinin dağılımını Cn(t) olarak gösterirsek, bunu aşağıdaki ilişkiyi kullanarak ifade edebiliriz:

Eğer Fn(t), Y n(t)’nin kümülatif olasılık dağılımı ise, bunu şu şekilde ifade edebiliriz:

Saf bir Poisson sürecini düşünürsek, birim zamanda ortalama μ = λ olayları gözlemleriz. Alternatif olarak olayların oluşumunu sabit bir λ oranıyla gözlemlediğimizi söyleyebiliriz. Bir olayın (örneğin ilkinin) gözlenmesine kadar geçen süreyi L ile belirtirsek, olayın gerçekleşmesine kadar geçen sürenin t’den uzun olma olasılığını şu şekilde ifade edebiliriz:

Sabit bir λ oranı için Poisson dağılımının tanımını kullanılır. Sonuç olarak eğer

P (L > t) = e^(−λt), P (L ⩽ t)’nin dağılımı şu şekilde verilir:

P (L ⩽ t) = 1 − e^(−λt)

Bu kümülatif dağılım olduğundan, uyum açısından türevi alarak olasılık dağılımını ve şunu elde ederiz:

t > 0 iken f(t) = λe^(−λt)

Bu üstel bir dağılımdır ve yukarıdaki türetim, üstel dağılımın sabit bir hızla gerçekleşen ancak bunun dışında tamamen rastgele olan iki olay arasındaki süreyi tanımlayabildiğini göstermiştir.

1. Soru

Poisson veya Gamma-Poisson dağılımı kullanılarak hangi tür gözlemlenebilir veriler tanımlanabilir?

Poisson ve Gamma-Poisson dağılımı sayım verilerini, yani parametreler göz önüne alındığında gözlemlenen olayların sayısının dağılımını tanımlar.

2. Soru

Gamma-Poisson dağılımı ile Poisson dağılımı arasındaki karakteristik fark nedir?

Gamma-Poisson dağılımı, Poisson dağılımına kıyasla daha esnek ve çok yönlüdür. Gamma-Poisson dağılımı, Poisson dağılımının özel bir durumunu genişletir. Poisson dağılımı, belirli bir zaman aralığında veya alanda meydana gelen olayların sayısını modellemek için kullanılırken, Gamma-Poisson dağılımı aynı tür verileri modellemek için kullanılabilir ancak daha fazla esneklik sağlar.

Bunun sebebi Gamma-Poisson dağılımının esnekliği, Poisson dağılımının sabit bir ortalama ve varyansı varsaydığı yerde, Gamma-Poisson dağılımının değişken bir varyansı (varyansın ortalamaya bağlı olduğu) hesaba katabilmesinden kaynaklanır. Bu, gerçek dünyadaki birçok senaryoyu daha iyi modellemek için faydalıdır, çünkü olayların varyansı, ortalama olay oranından sapabilir.

Örneğin, bir şirketin günlük satışlarını modellemek istediğinizi düşünün. Poisson dağılımı, sabit bir satış oranı ve sabit bir varyans varsayımına dayanırken, Gamma-Poisson dağılımı, satışların farklı günlerde farklı olabileceği ve bu nedenle varyansın ortalama satış sayısına bağlı olduğu bir senaryoyu daha iyi yansıtabilir. Bu, özellikle talebin mevsimsel veya trendsel dalgalanmalar gösterdiği durumlarda önemlidir.

3. Soru

Üstel dağılım Poisson dağılımıyla nasıl ilişkilidir?

Üstel dağılım, Poisson dağılımı tarafından adet dağılımı olarak tanımlanan gözlemlenen olaylar arasındaki varış süresini tanımlar. Örneğin otobüsün durağa gelme süresi örneğinde:

  • Poisson Dağılımı saat gibi belirli bir zaman aralığında durağa gelen otobüs sayısını modeller. Dağılım belirli zaman aralığında belirli bir miktarda otobüs görme ihtimalini tahmin eder.
  • Üstel Dağılım: Durağa art arda gelen otobüslerin gelme süreleri arasındaki zamanı tanımlar. Bir otobüs görüldükten sonra bir sonraki gelene kadarki süre aynı saatte gelen otobüs sayısı ortalaması ile üstel dağılımı takip eder.

Weibull Dağılımı

Ortalama bir oranla tanımlanan rastgele bir Poisson süreci için iki olay arasındaki süreyi tartıştığımızda daha önce üstel dağılımla karşılaşmıştık. Bu, olayların birim zaman başına belirli ve sabit bir hızda meydana geldiği anlamına gelir ve üstel dağılım, bir sonraki olayın meydana gelme olasılığının en yüksek olduğu zamanı tanımlar. Üstel dağılımın doğası göz önüne alındığında, üstel dağılım monoton bir şekilde düştüğü için bir sonraki olay için en olası an her zaman “şu an”dır. Ancak çoğu durumda istediğimiz bu değildir, aslında mühendislikte işlerin rastgele zamanlarda bozulmamasını sağlamak için çok fazla çaba sarf edilmektedir.

Örneğin, güvenlik nedeniyle “şu an” arızalanmayacağından emin olmak istediğimiz bir uçağın türbinini hayal edin. Ancak “türbin arızası” olayının olasılık dağılımını, olayın bir sonraki bakım döngüsü planlanmadan önce meydana gelme ihtimali son derece düşük olacak şekilde şekillendirebilmek istiyoruz.

Uygulamada, çoğu bakım döngüsü şu anda katı bir modeli takip ediyor ancak “bakım ihtiyacının tahmini” fikri, makine öğrenimini kullanan bir makineden gelen operasyonel verileri kullanarak bir sonraki arızaya kadar geçen süreyi tahmin etmektir.

Weibull dağılımı, başlangıçta malzeme bilimi bağlamında, malzemelerin stres altındaki hasarını tanımlamak için geliştirilmiştir ancak aynı zamanda güvenilirlik mühendisliği, arıza analizi ve hatta rüzgar hızlarının tanımlanması gibi çok sayıda başka uygulamaya da sahiptir.

Weibull dağılımı şu şekilde verilir:

k > 0 parametresine “şekil parametresi” (shape parameter) veya Weibull modülü denir (malzeme biliminde Weibull modülü, kırılgan malzemeleri karakterize etmek için kullanılır) ve λ > 0, “ölçek parametresi” (scale parameter) olarak adlandırılır. k = 1 durumunda Weibull dağılımı üstel dağılıma indirgenir. Bu nedenle k şekil parametresi için üç farklı rejimi tartışabiliriz:

  • k < 1: Başarısızlık oranı zamanla azalır, bu da çoğu başarısızlığın erken meydana geldiği anlamına gelir.
  • k = 1: Bu durumda Weibull dağılımı üstel dağılım haline gelir. Arızalar zaman içinde sabit bir oranda rastgele meydana gelir.
  • k > 1: Başarısızlık oranı zamanla artar. Bu, başlangıçta çok az arıza olduğu veya hiç arıza olmadığı, ancak daha sonra arızaların ortaya çıktığı anlamına gelir.

Bu üç durum aşağıdaki şekilde gösterilmektedir. Özellikle, k >> 1 değerleri için dağılım daha simetrik ve lokalize hale gelir. Bu, örneğin arıza olasılığının belirli bir bölgede lokalize olduğu anlamına gelir.

X ekseni zamanı temsil ediyorsa, arıza olasılığı başlangıçta çok düşüktür ve bir süre sonra artar. Belirli bir bileşen için bakımı planlayacaksak, örneğin arıza riskinin kabul edilebilir olduğu bir eşik tanımlayabilir (bu, tam kullanım durumuna bağlıdır) ve ardından, arıza olasılığı bu eşiğe yaklaştığında bakımı planlayabiliriz. Tahmine dayalı bakımda, bu bileşeni tanımlayan Weibull dağılımının parametrelerini tahmin etmek için bileşenden gelen gözlemsel verileri kullanabilir ve ardından bakımı bu tahmine göre planlayabiliriz.

1. Soru

Weibull dağılımı k=1 olduğunda hangi dağılıma indirgenir ve bu, zaman içinde başarısızlığın ortaya çıkması açısından ne anlama gelir?

k=1 için Weibull dağılımı üstel dağılıma indirgenir, bu da başarısızlığın birim zamanda rastgele sabit bir oranda meydana gelebileceği anlamına gelir.

2. Soru

Weibull dağılımında k>>1 neyi ifade eder?

Weibull dağılımında k’nin 1'den çok büyük olması tipik olarak azalan bir tehlike oranına işaret eder, bu da başarısızlık oranının zamanla azaldığı anlamına gelir. Bu, çoğu arızanın sistem veya ürünün ömrünün erken dönemlerinde meydana geldiği anlamına gelir.

Dönüştürülmüş Rastgele Değişkenler (Transformed Random Variables)

Rastgele bir deneyin, sağ üst çeyrekte puanlar veren bir sistem tarafından belirlendiğini bildiğinizi varsayalım (yani her ikisi de ℝ+ değerlerine sahip X ve Y iki rastgele değişkenle tanımlanabilir. Örneğin, X ve Y bağımsızdır ve Γ (2, 5) dağılımını takip eder X Γ (2, 5) ve Y~Γ (2, 5) farkı hakkında ne söylenebilir ki fark yine rastgeledir? Örnek uzaydan gerçek sayılara T :S → ℝ eşlemesi olan değişken, T’nin yoğunluğunu hesaplamak mümkün mü? Evet, çok değişkenli rastgele değişkenler üzerinde akıl yürütmeyi gerektiren genel teorem tarafından sağlanır. (yani rastgele değişkenlerin ℝ^n değerlerine sahip olduğunu görmek için).

Dönüştürülen Değişkenler (Transformed Variables)

Çok değişkenli bir sürekli rastgele değişkenin S örnek uzayından ℝ^n’deki vektörler kümesine bir eşleme olduğunu hatırlayın: X:S →ℝ^n; X(s)’nin olası değerlerinin kümesine D diyelim. X ve Y durumunda, her ikisi de Gama yukarıdaki gibi, Dis (x, y) kümesi, x > 0 ve y > 0.

E’nin ℝ^n’nin bir alt kümesi olduğu bir g:D →E eşlememiz olduğunu varsayalım: Dönüştürülen rastgele değişkene, genellikle g(X) olarak yazılan g ∘ X adını veriyoruz; örnek uzaydaki her sonuç için değerleri g (X(s)) olan rastgele değişken.

Bu, bir dizi sürekli rastgele Xi değişkenine (0 ⩽ i ⩽ n) ve bir dizi gi fonksiyonuna sahip olduğumuzu varsayalım: ℝ^n → ℝ demekle aynı şeydir. Aşağıdaki şekilde tanımlanan dönüştürülmüş g(X) değişkenini ele alıyoruz:

Yukarıdaki örnekte X1 = X ve X2 = Y’ye sahibiz. D = ℝ+ × ℝ+ ‘den g(x, y) = (x − y, x + y) eşlemesini dönüşüm olarak alabiliriz.

g’nin türevlenebilir bir dönüşüm olduğunu varsayalım (yani: gi (x1,…., xn), her 0 ⩽ i, j ⩽ n için ∂gi ∂xj mevcut olacak şekilde türevlenebilirdir) ve bunun tersi g −1:E → D/g mevcuttur. Dönüşüm teoremi şunu söyler:

  • g(X) Sürekli bir rastgele değişkendir.
  • X’in bir olasılık yoğunluk fonksiyonu varsa (pdf) fX:D →ℝ o zaman g (X), not edilen fg(X)’in pdf’si aşağıdakine eşittir, ∀e ∈ E:

Jg^−1 (e), g^-1 dönüşümünün Jacobian’ıdır ve en azından birinde sıfır değildir: Jacobian, g^−1'in her bir kısmi türevinin matrisinin determinantıdır:

Basitçe söylemek gerekirse, dönüşüm teoremi, yoğunluğu dönüşümün tersiyle birleştirerek ve dönüşümün tersinin Jacobian’ı ile çarparak dönüştürülmüş bir rastgele değişkenin olasılık yoğunluk fonksiyonunu hesaplamamıza olanak tanır. Eğer X tek bir boyuta sahipse (ve dolayısıyla g, g(x) = u olarak yazılabilir):

D (X’in değer kümesi ve dönüşümün kaynak kümesi) ve E’nin (dönüşümün değer kümesi) nadiren tam ℝ^n’ye eşit olduğuna dikkat etmek önemlidir. Örnekte göreceğimiz gibi en düşük x’in y’ye bağlı olduğu bir düzlemin alt kümesi olabilir.

Örnek: İki gama değişkeni arasındaki fark

Örneğimize dönersek rastgele değişken T(s) = X(s) − Y(s), X~Γ (2, 5) ve Y~Γ (2, 5) birbirinden bağımsızdır. Olası her rastgele sonuç için bir puan veren C(s) = (X(s), Y(s)) rastgele değişken çiftini göz önünde bulunduruyoruz (noktalar üst yarı çeyrektedir {(x, y) | x > 0 ve y > 0 }).

T = X − Y’nin yoğunluğunu hesaplamak için, x − y’nin bileşenlerden biri olduğu bir dönüşümü kullanabiliriz. Örneğin aşağıdaki eşlemeyi seçebiliriz:

g dönüşümünün hedef alt kümesi E ⊂ ℝ × ℝ nedir? (a, b) = g (x, y) kümesidir. Yani, x − y = a ve x + y = b ile (x, y) ∈ D’yi bulabileceğimiz bir a, b kümesidir. Bu seti a ve b’den x ve y’yi elde edecek denklemi çözerek hesaplayabiliriz:

Dolayısıyla E, aşağıdaki şekilde taranmış bölge olan b − a > 0 ve b + a > 0 olacak şekilde (a, b) ∈ ℝ × ℝ çiftlerinin kümesidir.

Denklem çözümü, g^-1 ters dönüşümünü hesaplamamıza olanak tanır:

Şimdi g(C)’nin yoğunluğunu elde etmek için dönüşüm teoreminin formülünü g dönüşümüyle birlikte uyguluyoruz. Bu bize X − Y, X + Y’nin ortak yoğunluğunu verecek ve bundan amaçlandığı gibi X − Y’nin yoğunluğunu çıkarabileceğiz. Teoremi uygulamak için g^-1'in Jacobian’ını hesaplamamız gerekir:

X ve Y’nin (her ikisi de ~Γ (2, 5) ) yoğunluğunun şu fonksiyonla verildiğini hatırlatalım: f(t) = 25 /1 · t ^(2 − 1) · e ^(−5t) ) = 25te^(−5t) ve bunlar bağımsızdır dolayısıyla X, Y’nin ortak yoğunlukları:

Böylece teorem bize g(X, Y)’nin ortak yoğunluğunun (a, b) ∈ E için aşağıdaki olduğunu, aksi halde 0 olduğunu verir:

X − Y’nin yoğunluğunu hesaplamak için, g’nin (X, Y) ilk bileşeni olan a’nın yoğunluğunu hesaplamamız yeterlidir; g (x, y) = (x − y, x + y) olduğundan. Bu, g (X, Y)’nin marjinal yoğunluğunu hesaplayarak yapılabilir:

fg (X, Y) (a, b) E’nin dışında 0 olduğundan Wolfram Alpha tarafından hesaplandığı gibi:

1. Soru

Eğer X ve Y iki sürekli rastgele değişken ise, X+Y’nin olasılık yoğunluk fonksiyonu fX+fY midir?

Yanlış, iki sürekli rastgele değişken 𝑋X ve 𝑌Y’nin toplamının olasılık yoğunluk fonksiyonu (PDF), bireysel PDF’lerinin evrişimi ile verilir. Matematiksel gösterimde, 𝑓𝑋+𝑌(𝑧)=∫−∞∞𝑓𝑋(𝑥)⋅𝑓𝑌(𝑧−𝑥) 𝑑𝑥 şeklinde temsil edilir. Dolayısıyla, toplamı hesaba katmak için PDF’lerden birinin x kadar kaydırıldığı 𝑋 ve 𝑌 PDF’lerinin çarpımının entegre edilmesini içerir. Bu nedenle, 𝑋+𝑌 PDF’si yalnızca 𝑓𝑋fX​ ve 𝑓𝑌fY PDF’lerinin toplamı değildir.

Not: Ancak dönüşüm teoreminin, iki sürekli rastgele değişkenin toplamının yoğunluk fonksiyonunun yoğunluk fonksiyonlarının evrişimi olduğunu belirten bir sonucu vardır.

2. Soru

Eğer X, fx olasılık yoğunluk fonksiyonuna sahip sürekli bir gerçek rastgele değişken ise o zaman “666.X”, f66.x(u) = fx(1/666.u) yoğunluk fonksiyonuna sahip bir rastgele değişken midir?

Doğru. Dönüşüm 𝑔:𝑥↦𝑢=666·𝑥 olduğundan ters dönüşümün Jacobian’ı 1/666 olur.

Özet

Pek çok süreçte, belirli olasılık dağılımları gözlemlenen verilerin tanımlanmasında önemli bir rol oynar. Bu nedenle gözlemlenen verilerin, belirli bir olasılık dağılımını takip eden rastgele bir değişkenin somut gerçeklemeleri olduğunu söylüyoruz. Binom ve negatif binom dağılımları, yazı tura atmak gibi iki sonucu olan tekrarlanan denemelerdeki başarı ve başarısızlıkların sayısını tanımlayan ayrık olasılık dağılımlarıdır. Normal veya Gauss dağılımı, herhangi bir olasılık dağılımını takip eden rastgele sayıların toplamının normal veya Gauss dağılımına yakınsadığını belirten merkezi limit teoremine bağlı olarak en önemli olasılık dağılımlarından biridir.

Normal dağılım genellikle N (μ, σ) olarak gösterilir ve ortalama μ ve standart sapma σ olmak üzere iki parametreyle tanımlanır. Ayrık Poisson dağılımı, sabit bir hızla meydana gelen rastgele olayların gözlemlenen sayım verilerini tanımlar ve hızı veya ortalamayı tanımlayan bir parametre ile karakterize edilir. Poisson dağılımının varyansı ortalamaya eşittir. Bu dağılım Poisson olayları arasındaki varış zamanını tanımlayan üstel dağılımla bağlantılıdır. Gama-Poisson dağılımı, varyansın ortalamadan büyük olduğu saf Poisson dağılımına göre aşırı dağılmış sayım verilerini tanımlar.

Weibull dağılımı özellikle malzeme veya bileşenlerin arızasını tanımlamada önemli bir rol oynar. Şekil parametresi k’nin değeri, bir arızanın çoğunlukla erken mi, sabit bir hızla rastgele mi yoksa belirli bir zaman aralığında daha lokalize mi olduğunu belirler.

--

--

Cahit Barkin Ozer

Daha fazla şey öğrenmek ve daha iyi olmak isteyen bir yazılım mühendisi.