Despre baie - Tavan. Băi. Ţiglă. Echipamente. Reparație. Instalatii sanitare

Aşteptări matematice de distribuţie binomială. Distribuția binomială a unei variabile aleatoare. Proprietăţi ale distribuţiei binomiale


Desigur, atunci când calculați funcția de distribuție cumulativă, ar trebui să utilizați conexiunea menționată între distribuțiile binomiale și beta. Această metodă este în mod evident mai bună decât însumarea directă atunci când n > 10.

În manualele clasice de statistică, pentru a obține valorile distribuției binomiale, se recomandă adesea utilizarea formulelor bazate pe teoreme limită (cum ar fi formula Moivre-Laplace). Trebuie remarcat faptul că din punct de vedere pur computaţional valoarea acestor teoreme este aproape de zero, mai ales acum, când aproape fiecare birou are un computer puternic. Principalul dezavantaj al aproximărilor de mai sus este acuratețea lor complet insuficientă pentru valorile de n caracteristice majorității aplicațiilor. Nu mai puțin un dezavantaj este absența oricăror recomandări clare cu privire la aplicabilitatea uneia sau aceleia aproximări (doar în textele standard formulări asimptotice, nu sunt însoțite de estimări de acuratețe și, prin urmare, sunt de puțin folos). Aș spune că ambele formule sunt potrivite doar pentru n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Nu mă gândesc aici la problema găsirii cuantilelor: pentru distribuțiile discrete este banală, iar în acele probleme în care apar astfel de distribuții, nu este, de regulă, relevantă. Dacă mai sunt necesare cuantile, recomand reformularea problemei în așa fel încât să se lucreze cu valorile p (semnificații observate). Iată un exemplu: la implementarea unor algoritmi de căutare exhaustivi, la fiecare pas este necesar să se testeze ipoteza statistică despre o variabilă aleatoare binomială. Conform abordării clasice, la fiecare pas este necesar să se calculeze criteriul statistic și să se compare valoarea acesteia cu limita mulțimii critice. Deoarece, totuși, algoritmul este exhaustiv, este necesar să se determine din nou granița setului critic de fiecare dată (la urma urmei, dimensiunea eșantionului se schimbă de la pas la pas), ceea ce crește neproductiv costurile de timp. Abordarea modernă recomandă calcularea semnificației observate și compararea acesteia cu probabilitatea de încredere, economisind la căutarea cuantilelor.

Prin urmare, în codurile de mai jos nu există un calcul al funcției inverse în schimb, este dată funcția rev_binomialDF, care calculează probabilitatea p de succes într-o încercare individuală având în vedere numărul dat n de încercări, numărul m de succese în ele; valoarea y a probabilităţii obţinerii acestor m succese. Aceasta folosește conexiunea menționată mai sus dintre distribuțiile binomiale și beta.

De fapt, această funcție vă permite să obțineți limitele intervalelor de încredere. Într-adevăr, să presupunem că în n încercări binomiale avem m succese. După cum se știe, limita din stânga a intervalului de încredere cu două fețe pentru parametrul p cu un nivel de încredere este egală cu 0 dacă m = 0 și for este o soluție a ecuației . În mod similar, limita dreaptă este 1 dacă m = n și pentru este o soluție a ecuației . Rezultă că pentru a găsi limita stângă trebuie să rezolvăm ecuația relativă , și pentru a găsi cea potrivită - ecuația . Acestea sunt rezolvate în funcțiile binom_leftCI și binom_rightCI, care returnează limitele superioare și, respectiv, inferioare ale intervalului de încredere cu două fețe.

Aș dori să observ că, dacă nu aveți nevoie de o precizie absolut incredibilă, atunci pentru n suficient de mare puteți utiliza următoarea aproximare [B.L. van der Waerden, Statistica matematică. M: IL, 1960, cap. 2, secțiunea 7]: , unde g este o cuantilă a distribuției normale. Valoarea acestei aproximări este că există aproximări foarte simple care vă permit să calculați cuantile ale unei distribuții normale (vezi textul despre calcularea distribuției normale și secțiunea corespunzătoare a acestei cărți de referință). În practica mea (în principal cu n > 100), această aproximare a dat aproximativ 3-4 cifre, ceea ce, de regulă, este destul de suficient.

Pentru a calcula folosind următoarele coduri, veți avea nevoie de fișierele betaDF.h, betaDF.cpp (vezi secțiunea despre distribuția beta), precum și de logGamma.h, logGamma.cpp (vezi Anexa A). De asemenea, puteți vedea un exemplu de utilizare a funcțiilor.

Fișier binomDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" binom dubluDF(încercări duble, succese duble, p dublu); /* * Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare. * Calculați probabilitatea B(reușite|încercări,p) ca numărul * reușite să fie între 0 și „reușite” (inclusiv). */ double rev_binomialDF(încercări duble, succese duble, y dublu); /* * Fie probabilitatea y de a cel puțin m succese să apară * în încercările de testare a schemei Bernoulli. Funcția găsește probabilitatea p* de succes într-o încercare individuală. * * Următoarea relație este utilizată în calcule * * 1 - p = rev_Beta(încercări-reușite| succese+1, y). */ double binom_leftCI(double trials, double success, double level); /* Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare * și numărul de succese egal cu „reușite”. * Limita din stânga a intervalului de încredere cu două fețe este calculată * cu nivelul nivelului de semnificație. */ double binom_rightCI(double n, double succeses, double level); /* Să fie „încercări” de observații independente * cu probabilitatea „p” de succes în fiecare * și numărul de succese egal cu „reușite”. * Limita dreaptă a intervalului de încredere cu două fețe este calculată * cu nivelul de semnificație. */ #endif /* Se termină #ifndef __BINOMIAL_H__ */

Fișier binomialDF.cpp

/************************************************ * *********/ /* Distribuție binomială */ /******************************** * **************************/ #include #include #include "betaDF.h" ENTRY double binomDF(dublu n, dublu m, dublu p) /* * Fie "n" observații independente * cu probabilitatea "p" de succes în fiecare. * Se calculează probabilitatea B(m|n,p) ca numărul de reușite să fie * între 0 și „m” (inclusiv), adică. * suma probabilităților binomiale de la 0 la m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Calculele nu implică o însumare netă - * se folosește următoarea relație cu distribuția beta centrală: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Argumentele trebuie să fie pozitive, cu 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) întoarcere 1; altfel returnează BetaDF(n-m, m+1).valoare(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Fie probabilitatea y a cel puțin m succese să apară * în n încercări ale schemei Bernoulli. Funcția găsește probabilitatea p* de succes într-o încercare individuală. * * Următoarea relație este utilizată în calcule * * 1 - p = rev_Beta(y|n-m,m+1). */ ( afirmă ((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

Teoria probabilității este prezentă invizibil în viața noastră. Nu îi acordăm atenție, dar fiecare eveniment din viața noastră are o probabilitate sau alta. Ținând cont de numărul imens de scenarii posibile, devine necesar să stabilim cel mai probabil și cel mai puțin probabil dintre ele. Cel mai convenabil este să analizați grafic astfel de date probabilistice. Distribuția ne poate ajuta în acest sens. Binomul este unul dintre cele mai simple și mai precise.

Înainte de a trece direct la matematică și teoria probabilității, să ne dăm seama cine a fost primul care a venit cu acest tip de distribuție și care este istoria dezvoltării aparatului matematic pentru acest concept.

Poveste

Conceptul de probabilitate este cunoscut din cele mai vechi timpuri. Cu toate acestea, matematicienii antici nu i-au acordat prea multă importanță și au putut doar să pună bazele teoriei care a devenit ulterior teoria probabilității. Au creat câteva metode combinatorii care i-au ajutat foarte mult pe cei care au creat și dezvoltat ulterior teoria în sine.

În a doua jumătate a secolului al XVII-lea a început formarea conceptelor și metodelor de bază ale teoriei probabilităților. Au fost introduse definiții ale variabilelor aleatoare și metode de calculare a probabilității unor evenimente independente și dependente simple și unele complexe. Acest interes pentru variabilele aleatoare și probabilitățile a fost dictat de jocurile de noroc: fiecare persoană dorea să știe care sunt șansele sale de a câștiga jocul.

Următoarea etapă a fost aplicarea metodelor de analiză matematică în teoria probabilităților. Matematicieni proeminenți precum Laplace, Gauss, Poisson și Bernoulli au preluat această sarcină. Ei au fost cei care au avansat această zonă a matematicii la un nou nivel. James Bernoulli a fost cel care a descoperit legea distribuției binomiale. Apropo, după cum vom afla mai târziu, pe baza acestei descoperiri s-au făcut mai multe, care au făcut posibilă crearea legii distribuției normale și multe altele.

Acum, înainte de a începe să descriem distribuția binomială, ne vom reîmprospăta puțin memoria despre conceptele teoriei probabilităților, pe care probabil le-am uitat deja de la școală.

Bazele teoriei probabilităților

Vom lua în considerare astfel de sisteme, în urma cărora sunt posibile doar două rezultate: „succes” și „eșec”. Acest lucru este ușor de înțeles cu un exemplu: aruncăm o monedă, în speranța că va veni cu capul. Probabilitățile fiecăruia dintre evenimentele posibile (cădere capete – „succes”, cădere capete – „eșec”) sunt egale cu 50 la sută dacă moneda este perfect echilibrată și nu există alți factori care ar putea afecta experimentul.

A fost cel mai simplu eveniment. Dar există și sisteme complexe în care sunt efectuate acțiuni secvențiale, iar probabilitățile rezultatelor acestor acțiuni vor diferi. De exemplu, luați în considerare următorul sistem: într-o cutie, al cărei conținut nu îl putem vedea, există șase bile absolut identice, trei perechi de albastru, roșu și flori albe. Trebuie să luăm câteva bile la întâmplare. În consecință, scoțând mai întâi una dintre bile albe, vom reduce semnificativ probabilitatea ca apoi să obținem și o bilă albă. Acest lucru se întâmplă deoarece numărul de obiecte din sistem se modifică.

În secțiunea următoare, ne vom uita la concepte matematice mai complexe care ne aduc mai aproape de ceea ce înseamnă cuvintele „distribuție normală”, „distribuție binomială” și altele asemenea.

Elemente de statistică matematică

În statistică, care este unul dintre domeniile de aplicare a teoriei probabilităților, există multe exemple în care datele pentru analiză nu sunt date în mod explicit. Adică nu numeric, ci sub formă de împărțire după caracteristici, de exemplu, după gen. Pentru a aplica instrumente matematice unor astfel de date și pentru a trage unele concluzii din rezultatele obținute, este necesară convertirea datelor originale într-un format numeric. De obicei, pentru a face acest lucru, unui rezultat pozitiv i se atribuie o valoare de 1, iar unui rezultat negativ i se atribuie o valoare de 0. Astfel, obținem date statistice care pot fi analizate folosind metode matematice.

Următorul pas în înțelegerea ce este distribuția binomială variabilă aleatorie, este definiția varianței unei variabile aleatoare și așteptarea matematică. Vom vorbi despre asta în secțiunea următoare.

Valorea estimata

Intelege cu adevarat ce este valorea estimata, nu e complicat. Luați în considerare un sistem în care există multe evenimente diferite cu propriile lor probabilități diferite. Așteptarea matematică va fi numită o valoare egală cu suma produselor valorilor acestor evenimente (în forma matematică despre care am vorbit în ultima secțiune) și probabilitatea apariției lor.

Așteptările matematice ale unei distribuții binomiale se calculează folosind aceeași schemă: luăm valoarea unei variabile aleatoare, o înmulțim cu probabilitatea unui rezultat pozitiv și apoi însumăm datele rezultate pentru toate variabilele. Este foarte convenabil să prezentați aceste date grafic - în acest fel diferența dintre așteptările matematice ale diferitelor valori este mai bine percepută.

În secțiunea următoare vă vom spune puțin despre un alt concept - varianța unei variabile aleatoare. De asemenea, este strâns legat de conceptul de distribuție binomială a probabilității și este caracteristica acestuia.

Varianta distributiei binomiale

Această valoare este strâns legată de cea anterioară și, de asemenea, caracterizează distribuția datelor statistice. Reprezintă pătratul mediu al abaterilor valorilor de la așteptările lor matematice. Adică, varianța unei variabile aleatoare este suma diferențelor pătrate dintre valoarea unei variabile aleatoare și așteptarea ei matematică, înmulțită cu probabilitatea acestui eveniment.

În general, acesta este tot ce trebuie să știm despre varianță pentru a înțelege ce este o distribuție de probabilitate binomială. Acum să trecem direct la subiectul nostru principal. Și anume, ce se află în spatele unei astfel de expresii aparent destul de complexe „legea distribuției binomiale”.

Distribuție binomială

Să ne dăm seama mai întâi de ce această distribuție este binomială. Provine de la cuvântul „binom”. Poate ați auzit de binomul lui Newton - o formulă care poate fi folosită pentru a extinde suma oricăror două numere a și b la orice putere nenegativă n.

După cum probabil ați ghicit deja, formula binomială a lui Newton și formula de distribuție binomială sunt aproape aceleași formule. Cu singura excepție că al doilea are o semnificație practică pentru cantități specifice, iar primul este doar un instrument matematic general, ale cărui aplicații în practică pot fi diferite.

Formule de distribuție

Funcția de distribuție binomială poate fi scrisă ca suma următorilor termeni:

(n!/(n-k)!k!)*p k *q n-k

Aici n este numărul de experimente aleatoare independente, p este numărul de rezultate reușite, q este numărul de rezultate nereușite, k este numărul experimentului (poate lua valori de la 0 la n)! - denumirea de factorial, o funcție a unui număr a cărui valoare este egală cu produsul tuturor numerelor care vin înaintea lui (de exemplu, pentru numărul 4: 4!=1*2*3*4=24).

În plus, funcția de distribuție binomială poate fi scrisă ca o funcție beta incompletă. Cu toate acestea, aceasta este o definiție mai complexă, care este utilizată numai atunci când se rezolvă probleme statistice complexe.

Distribuția binomială, exemple din care am analizat mai sus, este una dintre cele mai multe tipuri simple distribuții în teoria probabilităților. Există și o distribuție normală, care este un tip de binom. Este folosit cel mai des și este cel mai ușor de calculat. Există, de asemenea, distribuții Bernoulli, distribuții Poisson și distribuții condiționate. Toate acestea caracterizează grafic intervalele de probabilitate ale unui anumit proces în diferite condiții.

În secțiunea următoare vom lua în considerare aspecte legate de utilizarea acestui aparat matematic în viata reala. La prima vedere, desigur, se pare că acesta este doar un alt lucru matematic, care, ca de obicei, nu își găsește aplicație în viața reală și, în general, nu este nevoie de nimeni, cu excepția matematicienilor înșiși. Cu toate acestea, acesta nu este cazul. La urma urmei, toate tipurile de distribuții și reprezentările lor grafice au fost create exclusiv în scopuri practice și nu ca un capriciu al oamenilor de știință.

Aplicație

Desigur, cea mai importantă aplicație a distribuțiilor este în statistică, deoarece necesită o analiză complexă a multor date. După cum arată practica, multe seturi de date au aproximativ aceleași distribuții de valori: regiunile critice cu valori foarte scăzute și foarte mari, de regulă, conțin mai puține elemente decât valorile medii.

Analiza seturilor mari de date este necesară nu numai în statistică. Este indispensabil, de exemplu, în chimia fizică. În această știință, este folosit pentru a determina multe cantități care sunt asociate cu vibrații aleatorii și mișcări ale atomilor și moleculelor.

În secțiunea următoare vom înțelege cât de important este să folosim concepte statistice precum binom distribuția unei variabile aleatoare în viața de zi cu zi pentru tine și pentru mine.

De ce am nevoie de el?

Mulți oameni își pun această întrebare când vine vorba de matematică. Apropo, matematica nu este numită degeaba regina științelor. Ea stă la baza fizicii, chimiei, biologiei, economiei, iar în fiecare dintre aceste științe se folosește și o anumită distribuție: indiferent dacă este o distribuție binomială discretă sau una normală, nu contează. Și dacă aruncăm o privire mai atentă asupra lumii din jurul nostru, vom vedea că matematica este folosită peste tot: în viața de zi cu zi, la locul de muncă și chiar relațiile umane pot fi reprezentate sub formă de date statistice și analizate (aceasta, de altfel , este ceea ce lucrează în organizații speciale implicate în colectarea informațiilor).

Acum haideți să vorbim puțin despre ce să faceți dacă aveți nevoie să știți mult mai multe despre acest subiect decât ceea ce am subliniat în acest articol.

Informațiile pe care le-am oferit în acest articol sunt departe de a fi complete. Există multe nuanțe în ceea ce privește forma poate lua distribuția. Distribuția binomială, așa cum am aflat deja, este unul dintre principalele tipuri pe care se bazează toate statisticile matematice și teoria probabilității.

Dacă devii interesat, sau în legătură cu munca ta trebuie să știi mult mai multe pe această temă, va trebui să studiezi literatura de specialitate. Ar trebui să începi cu un curs universitar analiză matematicăși ajungeți acolo la secțiunea despre teoria probabilității. Cunoașterea serii va fi, de asemenea, utilă, deoarece o distribuție de probabilitate binomială nu este altceva decât o serie de termeni succesivi.

Concluzie

Înainte de a termina articolul, am dori să vă mai spunem un lucru interesant. Se referă direct la subiectul articolului nostru și la întreaga matematică în general.

Mulți oameni spun că matematica este o știință inutilă și nimic din ceea ce au studiat la școală nu le-a fost de folos. Dar cunoașterea nu este niciodată de prisos, iar dacă ceva nu vă este util în viață, înseamnă că pur și simplu nu vă amintiți. Dacă ai cunoștințe, ei te pot ajuta, dar dacă nu ai, atunci nu te poți aștepta la ajutor de la ei.

Deci, ne-am uitat la conceptul de distribuție binomială și la toate definițiile asociate cu acesta și am vorbit despre modul în care este aplicat în viața noastră.

Distribuția binomială este una dintre cele mai importante distribuții de probabilitate ale unei variabile aleatoare care variază discret. Distribuția binomială este distribuția de probabilitate a numărului m producerea unui eveniment A V n observații reciproc independente. Adesea un eveniment A se numește „succesul” unei observații, iar evenimentul opus se numește „eșec”, dar această desemnare este foarte condiționată.

Condiții de distribuție binomială:

  • în total efectuate n procese în care evenimentul A poate sau nu să apară;
  • eveniment Aîn fiecare încercare poate apărea cu aceeași probabilitate p;
  • testele sunt independente reciproc.

Probabilitatea ca în n eveniment de testare A va veni exact m ori, poate fi calculat folosind formula lui Bernoulli:

Unde p- probabilitatea producerii unui eveniment A;

q = 1 - p- probabilitatea producerii evenimentului opus.

Să ne dăm seama de ce distribuția binomială este legată de formula lui Bernoulli în modul descris mai sus? . Eveniment - numărul de succese la n testele sunt împărțite într-un număr de opțiuni, în fiecare dintre ele succesul este obținut în m teste, și eșec - în n - m teste. Să luăm în considerare una dintre aceste opțiuni - B1 . Folosind regula de adunare a probabilităților, înmulțim probabilitățile evenimentelor opuse:

,

iar dacă notăm q = 1 - p, Acea

.

Orice altă variantă în care m succes și n - m eșecuri. Numărul de astfel de opțiuni este egal cu numărul de moduri în care se poate n test get m succes.

Suma tuturor probabilităților m numerele de apariție a evenimentului A(numerele de la 0 la n) este egal cu unu:

unde fiecare termen reprezintă un termen din binomul lui Newton. Prin urmare, distribuția luată în considerare se numește distribuție binomială.

În practică, este adesea necesar să se calculeze probabilitățile „nu mai mult de m succes in n teste” sau „cel puțin m succes in n teste". Pentru aceasta se folosesc următoarele formule.

Funcția integrală, adică probabilitate F(m) ce este în n eveniment observațional A nu va mai veni m o singura data, poate fi calculat folosind formula:

La randul lui probabilitate F(≥m) ce este în n eveniment observațional A va veni nici mai puțin m o singura data, se calculează prin formula:

Uneori este mai convenabil să se calculeze probabilitatea ca n eveniment observațional A nu va mai veni m ori, prin probabilitatea evenimentului opus:

.

Ce formulă de utilizat depinde de care dintre ele are suma care conține mai puțini termeni.

Caracteristicile distribuției binomiale se calculează folosind următoarele formule .

Valorea estimata: .

Dispersie: .

Deviație standard: .

Distribuție binomială și calcule în MS Excel

Probabilitate binomială P n ( m) și valorile funcției integrale F(m) poate fi calculat folosind funcția MS Excel BINOM.DIST. Fereastra pentru calculul corespunzător este prezentată mai jos (clic stânga pentru mărire).


MS Excel vă solicită să introduceți următoarele date:

  • numărul de succese;
  • numărul de teste;
  • probabilitatea de succes;
  • integrală - valoare logică: 0 - dacă trebuie să calculați probabilitatea P n ( m) și 1 - dacă probabilitatea F(m).

Exemplul 1. Managerul companiei a rezumat informații despre numărul de camere vândute în ultimele 100 de zile. Tabelul rezumă informațiile și calculează probabilitățile ca un anumit număr de camere să fie vândute pe zi.

Ziua se încheie cu un profit dacă sunt vândute 13 sau mai multe camere. Probabilitatea ca ziua să fie lucrată profitabil:

Probabilitatea ca o zi să fie lucrată fără profit:

Fie ca probabilitatea ca o zi să fie lucrată cu profit să fie constantă și egală cu 0,61, iar numărul de camere vândute pe zi nu depinde de zi. Apoi putem folosi distribuția binomială, unde evenimentul A- ziua se va lucra cu profit, - fara profit.

Probabilitatea ca toate cele 6 zile să fie rezolvate cu profit:

.

Obținem același rezultat folosind funcția MS Excel BINOM.DIST (valoarea valorii integrale este 0):

P 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Probabilitatea ca din 6 zile 4 sau mai multe zile să fie lucrate cu profit:

Unde ,

,

Folosind funcția MS Excel BINOM.DIST, calculăm probabilitatea ca din 6 zile nu mai mult de 3 zile să fie finalizate cu profit (valoarea valorii integrale este 1):

P 6 (≤3 ) = BINOM.DIST(3; 6; 0,61; 1) = 0,435.

Probabilitatea ca toate cele 6 zile să fie rezolvate cu pierderi:

,

Putem calcula același indicator folosind funcția MS Excel BINOM.DIST:

P 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Rezolvați singur problema și apoi vedeți soluția

Exemplul 2.În urnă sunt 2 bile albe și 3 bile negre. Se scoate o minge din urna, se pune culoarea si se pune la loc. Încercarea se repetă de 5 ori. Numărul de apariții de bile albe este o variabilă aleatorie discretă X, distribuit conform legii binomiale. Întocmește o lege de distribuție a unei variabile aleatoare. Definiți modul, așteptările matematice și dispersia.

Să continuăm să rezolvăm problemele împreună

Exemplul 3. De la serviciul de curierat am mers pe site-uri n= 5 curieri. Fiecare curier este probabil p= 0,3, indiferent de altele, este întârziat pentru obiect. Variabilă aleatorie discretă X- numarul de curieri intarziati. Construiți o serie de distribuție pentru această variabilă aleatoare. Găsiți așteptările sale matematice, varianța, abaterea standard. Găsiți probabilitatea ca cel puțin doi curieri să întârzie obiectele.

Capitolul 7.

Legile specifice de distribuție a variabilelor aleatoare

Tipuri de legi de distribuție a variabilelor aleatoare discrete

Fie ca o variabilă aleatorie discretă să ia valorile X 1 , X 2 , …, x n,…. Probabilitățile acestor valori pot fi calculate folosind diverse formule, de exemplu, folosind teoremele de bază ale teoriei probabilităților, formula lui Bernoulli sau alte formule. Pentru unele dintre aceste formule, legea distribuției are propriul nume.

Cele mai comune legi ale distribuției unei variabile aleatoare discrete sunt legea binomială, geometrică, hipergeometrică și legea distribuției Poisson.

Legea distribuției binomiale

Lasă-l să fie produs n procese independente, în fiecare dintre ele evenimentul poate apărea sau nu A. Probabilitatea ca acest eveniment să apară în fiecare încercare este constantă, nu depinde de numărul încercării și este egală cu R=R(A). De aici probabilitatea ca evenimentul să nu se producă Aîn fiecare test este de asemenea constantă și egală q=1–R. Luați în considerare variabila aleatoare X egal cu numărul de apariţii ale evenimentului A V n teste. Evident, valorile acestei cantități sunt egale

X 1 =0 – eveniment A V n testele nu au apărut;

X 2 =1 – eveniment A V n a apărut o dată în procese;

X 3 =2 – eveniment A V n testele au apărut de două ori;

…………………………………………………………..

x n +1 = n- eveniment A V n totul a apărut în timpul testelor n o singura data.

Probabilitățile acestor valori pot fi calculate folosind formula Bernoulli (4.1):

Unde La=0, 1, 2, …,n .

Legea distribuției binomiale X, egal cu numărul de succese în n Teste Bernoulli, cu probabilitate de succes R.

Deci, o variabilă aleatorie discretă are o distribuție binomială (sau este distribuită conform legii binomiale) dacă valorile sale posibile sunt 0, 1, 2, ..., n, iar probabilitățile corespunzătoare sunt calculate folosind formula (7.1).

Distribuția binomială depinde de două parametrii RȘi n.

Seria de distribuție a unei variabile aleatoare distribuite conform legii binomiale are forma:

X k n
R

Exemplu 7.1 . Trei focuri independente sunt trase în țintă. Probabilitatea de a lovi fiecare lovitură este de 0,4. Valoare aleatoare X– numărul de lovituri pe țintă. Construiți-i seria de distribuție.

Soluţie. Valori posibile ale unei variabile aleatorii X sunt X 1 =0; X 2 =1; X 3 =2; X 4 =3. Să găsim probabilitățile corespunzătoare folosind formula lui Bernoulli. Nu este greu de demonstrat că folosirea acestei formule aici este complet justificată. Rețineți că probabilitatea de a nu lovi ținta cu o singură lovitură va fi egală cu 1-0,4=0,6. Primim

Seria de distribuție are următoarea formă:

X
R 0,216 0,432 0,288 0,064

Este ușor de verificat că suma tuturor probabilităților este egală cu 1. Variabila aleatoare în sine X distribuite conform legii binomiale. ■

Să găsim așteptarea și varianța matematică a unei variabile aleatoare distribuite conform legii binomiale.

La rezolvarea exemplului 6.5, s-a arătat că așteptarea matematică a numărului de apariții ale evenimentului A V n studii independente, dacă probabilitatea apariției Aîn fiecare test este constantă și egală R, egal n· R

Acest exemplu a folosit o variabilă aleatoare distribuită conform legii binomiale. Prin urmare, soluția de la Exemplul 6.5 este în esență o demonstrație a următoarei teoreme.

Teorema 7.1. Așteptarea matematică a unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări și probabilitatea de „reușită”, i.e. M(X)=n· R.

Teorema 7.2. Varianta unei variabile aleatoare discrete distribuite conform legii binomiale este egală cu produsul dintre numărul de încercări cu probabilitatea de „reușit” și probabilitatea de „eșec”, i.e. D(X)=nрq.

Asimetria și curtoza unei variabile aleatoare distribuite conform legii binomiale sunt determinate de formulele

Aceste formule pot fi obținute folosind conceptul de momente inițiale și centrale.

Legea distribuției binomiale stă la baza multor situații din viața reală. La valori mari n Distribuția binomială poate fi aproximată folosind alte distribuții, în special distribuția Poisson.

Distribuția Poisson

Să fie n Testele Bernoulli, cu numărul de teste n suficient de mare. S-a arătat mai devreme că în acest caz (dacă, în plus, probabilitatea R evenimente A foarte mic) pentru a afla probabilitatea ca evenimentul A a aparea T Odată ajuns la teste, puteți utiliza formula Poisson (4.9). Dacă variabila aleatoare Xînseamnă numărul de apariții ale evenimentului A V n Bernoulli teste, apoi probabilitatea ca X va lua valoarea k poate fi calculat folosind formula

, (7.2)

Unde λ = .

Legea distribuției Poisson se numește distribuția unei variabile aleatoare discrete X, pentru care valorile posibile sunt numere întregi nenegative și probabilitățile r t aceste valori se găsesc folosind formula (7.2).

Magnitudinea λ = numit parametru Distribuții Poisson.

O variabilă aleatoare distribuită conform legii lui Poisson poate lua un număr infinit de valori. Deoarece pentru această distribuţie probabilitatea R Apariția unui eveniment în fiecare proces este mică, atunci această distribuție este uneori numită legea evenimentelor rare.

Seria de distribuție a unei variabile aleatoare distribuită conform legii lui Poisson are forma

X T
R

Este ușor să verificați că suma probabilităților celui de-al doilea rând este egală cu 1. Pentru a face acest lucru, trebuie să vă amintiți că funcția poate fi extinsă într-o serie Maclaurin, care converge pentru orice X. În acest caz avem

. (7.3)

După cum sa menționat, legea lui Poisson înlocuiește legea binomială în anumite cazuri limitative. Un exemplu este variabila aleatoare X, ale căror valori sunt egale cu numărul de defecțiuni într-o anumită perioadă de timp în timpul utilizării repetate a unui dispozitiv tehnic. Se presupune că acesta este un dispozitiv extrem de fiabil, de ex. Probabilitatea de eșec într-o singură aplicație este foarte mică.

Pe lângă astfel de cazuri limitative, în practică există variabile aleatoare distribuite conform legii lui Poisson care nu sunt asociate cu distribuția binomială. De exemplu, distribuția Poisson este adesea folosită atunci când se tratează numărul de evenimente care au loc într-o perioadă de timp (numărul de apeluri primite la o centrală telefonică în timpul unei ore, numărul de mașini care sosesc la o spălătorie în timpul unei zile, numărul de opriri ale mașinii pe săptămână etc.). Toate aceste evenimente ar trebui să formeze așa-numitul flux de evenimente, care este unul dintre conceptele de bază ale teoriei cozilor de așteptare. Parametru λ caracterizează intensitatea medie a fluxului de evenimente.

Exemplu 7.2 . La facultate sunt 500 de studenți. Care este probabilitatea ca 1 septembrie să fie ziua de naștere a trei studenți din această secție?

Soluţie . De la numărul de elevi n=500 este destul de mare și R– probabilitatea de a fi născut la 1 septembrie pentru oricare dintre elevi este egală cu , i.e. este suficient de mic, atunci putem presupune că variabila aleatoare X– numărul elevilor născuți la 1 septembrie este repartizat conform legii lui Poisson cu parametrul λ = n.p.= =1,36986. Apoi, conform formulei (7.2) obținem

Teorema 7.3. Fie variabila aleatoare X distribuite conform legii lui Poisson. Atunci așteptarea și varianța sa matematică sunt egale între ele și egale cu valoarea parametrului λ , adică M(X) = D(X) = λ = n.p..

Dovada. Prin definiția așteptărilor matematice, folosind formula (7.3) și seria de distribuție a unei variabile aleatoare distribuite conform legii lui Poisson, obținem

Înainte de a găsi varianța, găsim mai întâi așteptarea matematică a pătratului variabilei aleatoare luate în considerare. Primim

De aici, prin definiția dispersiei, obținem

Teorema a fost demonstrată.

Folosind conceptele de momente inițiale și centrale, se poate demonstra că pentru o variabilă aleatoare distribuită conform legii lui Poisson, coeficienții de asimetrie și curtoză sunt determinați de formulele

Nu este greu de înțeles că, din moment ce conținutul semantic al parametrului λ = n.p. este pozitivă, atunci o variabilă aleatoare distribuită conform legii lui Poisson are întotdeauna asimetrie și curtoză pozitive.

Să luăm în considerare distribuția binomială, să calculăm așteptările, varianța și modul ei matematic. Folosind funcția MS EXCEL BINOM.DIST(), vom reprezenta grafice ale funcției de distribuție și ale densității de probabilitate. Să estimăm parametrul de distribuție p, așteptarea matematică a distribuției și abaterea standard. Să luăm în considerare și distribuția Bernoulli.

Definiție. Lasă-le să aibă loc nîncercări, în fiecare dintre ele pot apărea doar 2 evenimente: evenimentul „succes” cu probabilitatea p sau un eveniment de „eșec” cu o probabilitate q =1-p (așa-numitul Schema Bernoulli,Bernoulliîncercări).

Probabilitatea de a primi exact X succes in acestea n teste este egal cu:

Numărul de succese în eșantion X este o variabilă aleatoare care are Distribuție binomială(Engleză) Binomdistributie) pȘi n sunt parametrii acestei distribuţii.

Vă rugăm să rețineți că pentru a utiliza Scheme Bernoulliși în mod corespunzător Distribuție binomială, trebuie îndeplinite următoarele condiții:

  • Fiecare test trebuie să aibă exact două rezultate, numite în mod convențional „succes” și „eșec”.
  • rezultatul fiecărui test nu trebuie să depindă de rezultatele testelor anterioare (independența testului).
  • probabilitatea de succes p trebuie să fie constantă pentru toate testele.

Distribuție binomială în MS EXCEL

În MS EXCEL, începând cu versiunea 2010, pt există o funcție BINOM.DIST(), numele în engleză este BINOM.DIST(), care vă permite să calculați probabilitatea ca să existe exact X„succes” (adică funcția de densitate de probabilitate p(x), vezi formula de mai sus) și funcția de distribuție cumulativă(probabilitatea ca eșantionul să aibă X sau mai puține „reușite”, inclusiv 0).

Înainte de MS EXCEL 2010, EXCEL avea o funcție BINOMIST(), care vă permite, de asemenea, să calculați functie de distributieȘi probabilitate densitate p(x). BINOMIST() este lăsat în MS EXCEL 2010 pentru compatibilitate.

Fișierul exemplu conține grafice distribuția densității de probabilitateȘi .

Distribuție binomială are denumirea B (n ; p) .

Notă: Pentru constructii funcția de distribuție cumulativă diagrama de tip perfectă Programa, Pentru densitatea de distribuțieHistogramă cu grupare. Pentru mai multe informații despre crearea diagramelor, citiți articolul Tipuri de bază de diagrame.

Notă: Pentru comoditatea scrierii formulelor, în fișierul exemplu au fost create nume pentru parametri Distribuție binomială: n și p.

Fișierul exemplu arată diferite calcule de probabilitate folosind funcțiile MS EXCEL:

După cum puteți vedea în imaginea de mai sus, se presupune că:

  • Populația infinită din care este prelevat eșantionul conține 10% (sau 0,1) elemente valide (parametru p, al treilea argument al funcției = BINOM.DIST() )
  • Pentru a calcula probabilitatea ca într-un eșantion de 10 elemente (parametrul n, al doilea argument al funcției) vor fi exact 5 elemente valide (primul argument), trebuie să scrieți formula: =BINOM.DIST(5; 10; 0,1; FALSE)
  • Ultimul, al patrulea element este setat = FALSE, i.e. returnează valoarea funcției densitatea de distribuție .

Dacă valoarea celui de-al patrulea argument = TRUE, atunci funcția BINOM.DIST() returnează valoarea funcția de distribuție cumulativă sau pur și simplu Funcția de distribuție. În acest caz, puteți calcula probabilitatea ca numărul de elemente bune dintr-un eșantion să fie dintr-un anumit interval, de exemplu, 2 sau mai puțin (inclusiv 0).

Pentru a face acest lucru trebuie să scrieți formula: = BINOM.DIST(2; 10; 0,1; TRUE)

Notă: Pentru o valoare neîntregătoare a lui x, . De exemplu, următoarele formule vor returna aceeași valoare: =BINOM.DIST( 2 ; 10; 0,1; ADEVĂRAT)=BINOM.DIST( 2,9 ; 10; 0,1; ADEVĂRAT)

Notă: În fișierul exemplu probabilitate densitateȘi functie de distributie de asemenea, calculat folosind definiția și funcția NUMBERCOMB() .

Indicatori de distribuție

ÎN exemplu de fișier pe foaia de lucru Exemplu Există formule pentru calcularea unor indicatori de distribuție:

  • =n*p;
  • (abaterea standard la pătrat) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ROOT(n*p*(1-p)).

Să derivăm formula așteptări matematiceDistribuție binomială folosind circuitul Bernoulli .

Prin definiție, variabila aleatoare X este Schema Bernoulli(variabilă aleatoare Bernoulli) are functie de distributie :

Această distribuție se numește distribuția Bernoulli .

Notă : distribuția Bernoulli- caz special Distribuție binomială cu parametrul n=1.

Să generăm 3 matrice a câte 100 de numere fiecare cu diferite probabilități de succes: 0,1; 0,5 și 0,9. Pentru a face acest lucru în fereastră Generarea numerelor aleatorii Să setăm următorii parametri pentru fiecare probabilitate p:

Notă: Dacă setați opțiunea Imprăștire aleatorie (Sămânță aleatorie), apoi puteți selecta un anumit set aleatoriu de numere generate. De exemplu, setând această opțiune =25, puteți genera aceleași seturi de numere aleatorii pe computere diferite (dacă, desigur, alți parametri de distribuție sunt aceiași). Valoarea opțiunii poate lua valori întregi de la 1 la 32.767 Imprăștire aleatorie poate fi confuz. Ar fi mai bine să o traducem ca Formați numărul cu numere aleatorii .

Ca urmare, vom avea 3 coloane de 100 de numere, pe baza cărora putem, de exemplu, estima probabilitatea de succes p dupa formula: Număr de succese/100(cm. exemplu de fișă de fișier GenerationBernoulli).

Notă: Pentru distribuții Bernoulli cu p=0,5 puteți folosi formula =RANDBETWEEN(0;1) care corespunde cu .

Generarea numerelor aleatorii. Distribuție binomială

Să presupunem că în eșantion există 7 produse defecte. Aceasta înseamnă că este „foarte probabil” ca proporția de produse defecte să se fi schimbat p, care este o caracteristică a procesului nostru de producție. Deși o astfel de situație este „foarte probabilă”, există o posibilitate (risc alfa, eroare de tip 1, „alarma falsă”) ca p a rămas neschimbată, iar numărul crescut de produse defecte s-a datorat prelevării aleatorii.

După cum se poate observa în figura de mai jos, 7 este numărul de produse defecte care este acceptabil pentru un proces cu p=0,21 la aceeași valoare Alfa. Acest lucru ilustrează faptul că atunci când valoarea prag a articolelor defecte dintr-un eșantion este depășită, p„cel mai probabil” a crescut. Expresia „cel mai probabil” înseamnă că există doar o probabilitate de 10% (100%-90%) ca abaterea procentului de produse defecte peste prag să se datoreze numai unor motive aleatorii.

Astfel, depășirea numărului prag de produse defecte din eșantion poate servi drept semnal că procesul a devenit deranjat și a început să producă produse uzate. O procent mai mare de produse defecte.

Notă: Înainte de MS EXCEL 2010, EXCEL avea o funcție CRITBINOM(), care este echivalentă cu BINOM.INV(). CRITBINOM() este lăsat în MS EXCEL 2010 și mai sus pentru compatibilitate.

Relația distribuției binomiale cu alte distribuții

Dacă parametrul nDistribuție binomială tinde spre infinit și p tinde spre 0, atunci în acest caz Distribuție binomială poate fi aproximată. Putem formula condiții când aproximarea Distribuția Poisson functioneaza bine:

  • p(mai putin pși altele n, cu atât aproximarea este mai precisă);
  • p >0,9 (având în vedere că q =1- p, calculele în acest caz trebuie făcute prin q(A X trebuie inlocuit cu n - X). Prin urmare, cu atât mai puțin qși altele n, cu atât aproximarea este mai precisă).

La 0,110 Distribuție binomială poate fi aproximată.

La randul lui, Distribuție binomială poate servi ca o bună aproximare atunci când dimensiunea populației este N Distribuție hipergeometrică mult marime mai mare mostre n (adică, N>>n sau n/N Puteți citi mai multe despre relația dintre distribuțiile de mai sus în articol. Exemple de aproximare sunt, de asemenea, date acolo și condițiile pentru când este posibil și cu ce precizie sunt explicate .

SFAT: Puteți citi despre alte distribuții MS EXCEL în articol.



Ți-a plăcut articolul? Imparte cu prietenii tai!
A fost de ajutor articolul?
da
Nu
Vă mulțumim pentru feedback-ul dumneavoastră!
Ceva a mers prost și votul tău nu a fost numărat.
Mulțumesc. Mesajul tau a fost trimis
Ați găsit o eroare în text?
Selectați-l, faceți clic Ctrl + Enter si vom repara totul!