Strony

niedziela, 26 czerwca 2016

Uwagi o uczeniu rachunku prawdopodobieństwa

Adam Kleiner

To artykuł dla nauczyciela lub dla zdolnego ucznia, którego nie satysfakcjonuje poznana definicja prawdopodobieństwa. Zawiera też nietypowe ujęcie zagadnienia niezależności zdarzeń, komentarze o prawdopodobieństwie warunkowym i o niektórych zadaniach z „losowo wybraną liczbą”.

Zwykle podaje się definicję prawdopodobieństwa opierającą się na hipotetycznym powtarzaniu danego doświadczenia nieskończenie wiele razy (definicja von Misesa). Jest oczywiste, że taka definicja nie da się zastosować w praktyce, choć może być teoretycznie poprawna. A uczeń nie otrzymuje aparatu, pozwalającego na stosowanie tej definicji w sposób pośredni, dlatego odnosi wrażenie, że pojęcie prawdopodobieństwa jest wciąż niezdefiniowane. Proponuję więc poniższe ujęcie, które nie stwarza złudzeń, wzorowane na definicji Kołmogorowa. Zaczynamy od pojęcia nieco abstrakcyjnego – dowolnej miary, która po unormowaniu do jedynki staje się prawdopodobieństwem. To, jak określić tę miarę, nie jest częścią matematyki, ale umiejętnością, której wymagamy od ucznia na równi z radzeniem sobie z zadaniami z treścią. Tę umiejętność
uczeń posiądzie przez przerobienie wielu przykładów doświadczeń losowych i dopasowanie do nich poprawnie dobranej przestrzeni probabilistycznej i prawdopodobieństwa (definicje niżej).


Przypuśćmy, że mamy dany zbiór Ω (grecka duża litera omega) i że mamy funkcję P, której argumentami są podzbiory zbioru Ω, a wartościami liczby nieujemne. Pod pewnymi warunkami funkcję P nazywamy miarą w zbiorze Ω. Te warunki to:
AB=∅ ⇒ P(AB)=P(A)+P(B);
P(∅)=0.

Pierwszy z tych warunków jest uproszczony – nie podajemy go w pełnej postaci, bo wkroczylibyśmy w zakres matematyki wyższej. Jeśli przy tym P(Ω)=1, to miarę P nazywamy prawdopodobieństwem w zbiorze Ω, a zbiór Ω nazywamy przestrzenią probabilistyczną (od łac. probabilis – prawdopodobny), inaczej mówiąc przestrzenią zdarzeń elementarnych. Elementy zbioru Ω nazywamy zdarzeniami elementarnymi, a podzbiory zbioru Ω nazywamy zdarzeniami.
Formalnie więc zdarzenie elementarne nie jest zdarzeniem – ale tolerujemy utożsamienie zbioru jednoelementowego z jego elementem. W szczególności mówimy o prawdopodobieństwie zdarzenia elementarnego mając na myśli miarę odpowiedniego zbioru jednoelementowego.

Zdarzenie ∅ nazywamy zdarzeniem niemożliwym; ma ono prawdopodobieństwo 0. Zdarzenie Ω nazywamy zdarzeniem pewnym; jak już powiedziano ma ono prawdopodobieństwo 1.

Na razie (przez dłuższy czas) zajmiemy się przypadkiem, kiedy zbiór Ω jest skończony. Wtedy najnaturalniej jest przyjąć, że miarą zbioru A⊆Ω jest liczba jego elementów: |A|. Tak określona miara nie jest prawdopodobieństwem, ale się nim stanie jeśli ją podzielimy przez |Ω|. Można jednak określić także inne miary w zbiorze Ω, w szczególności inne prawdopodobieństwa. Jeśli zbiór Ω jest skończony, to wystarczy określić prawdopodobieństwo każdego zdarzenia elementarnego (ale tak, by suma tych prawdopodobieństw dała 1) – wtedy prawdopodobieństwo każdego zdarzenia obliczymy przez zsumowanie prawdopodobieństw jego elementów:

P(A)=∑ω∈A P({ω})

(symbol ∑ω∈A czytamy „suma po wszystkich omega należących do A”; symbol ∑ to grecka duża litera sigma).

Jeśli mamy w zadaniu opisane tzw. doświadczenie losowe, czyli zespół czynności, który prowadzi do jakiegoś rezultatu, który nie daje się jednoznacznie przewidzieć, to pierwszym krokiem jest określenie przestrzeni probabilistycznej opisującej to doświadczenie (zbioru Ω) i prawdopodobieństw poszczególnych zdarzeń elementarnych. Jeśli zbiór Ω jest nieskończony, to nie wystarczy określić prawdopodobieństwa zdarzeń elementarnych – trzeba w inny sposób określić miary nieskończonych podzbiorów zbioru Ω; na przykład jeśli zbiór Ω jest jakąś figurą płaską o polu 1, to miarą jej podzbioru może być jego pole – tak określona miara też będzie prawdopodobieństwem w zbiorze Ω. Zauważ, że w przypadku losowania punktu z takiej figury prawdopodobieństwa zdarzeń elementarnych (zbiorów jednopunktowych) są równe 0, co nie oznacza, że są to zdarzenia niemożliwe: jakiś punkt figury zostaje wylosowany, mimo że prawdopodobieństwo jego wylosowania było równe 0. Podobnie zdarzenie powstające przez usunięcie ze zbioru Ω jednego punktu ma prawdopodobieństwo 1, ale nie jest zdarzeniem pewnym.

Gdy określimy zbiór Ω i prawdopodobieństwo w tym zbiorze, to dopiero wtedy zaczyna się matematyka! Mimo to wymagamy od ucznia umiejętności prawidłowego określania zbioru zdarzeń elementarnych i prawdopodobieństwa w tym zbiorze – podobnie jak od ucznia szkoły podstawowej wymagamy umiejętności przetłumaczenia zadania z treścią na ciąg operacji arytmetycznych.
Najlepiej jest określić zbiór zdarzeń elementarnych tak, żeby każde miało takie samo prawdopodobieństwo – wtedy mamy

P(A)=|A|/|Ω|   (1)

(Wzór ten nosi nazwę klasycznej definicji prawdopodobieństwa). Należy jednak pamiętać, że ten wzór nie stosuje się do przypadku nierównoprawdopodobnych zdarzeń elementarnych. Jeśli zapytamy, jakie jest prawdopodobieństwo, że jutro w moim domu pojawi się kosmita, to żartem jest odpowiedź, że "1/2, bo zbiór Ω jest dwuelementowy".

Jeśli rzucamy dwiema monetami i pytamy, ile wypadnie orłów, to wolno podać jako zbiór zdarzeń elementarnych zbiór {0, 1, 2}, którego elementy określają liczbę orłów, ale trzeba (!) dopowiedzieć, że zdarzenie 1 ma prawdopodobieństwo 1/2 zaś zdarzenia 0 i 2 mają prawdopodobieństwa 1/4. Jeśli natomiast chcemy podać taki zbiór Ω, przy którym prawdopodobieństwa będzie można obliczać według wzoru (1), to należy ustalić, która moneta jest pierwsza, a która druga, i podać Ω={RR, OR, RO, OO}.

Komentarz o niektórych zadaniach z „losowo wybraną liczbą całkowitą”: nie istnieje naturalne prawdopodobieństwo w zbiorze liczb całkowitych (podobnie w zbiorze liczb rzeczywistych – ale istnieje naturalne prawdopodobieństwo w ograniczonym przedziale liczb rzeczywistych, mimo że jest to zbiór nieskończony). W tego rodzaju zadaniach należy podzielić zbiór liczb całkowitych na skończoną liczbę podzbiorów, w obrębie których liczby są równoprawne. Na przykład, jeśli padnie pytanie, jakie jest prawdopodobieństwo, że losowo wybrana liczba całkowita jest podzielna przez 3, to autor oczekuje podzielenia zbioru liczb całkowitych C na 3 podzbiory: {k⋅3: kC}, {k⋅3+1: kC}, {k⋅3+2: kC} i stwierdzenia, że każdy z tych zbiorów ma takie samo prawdopodobieństwo, a więc wynosi ono 1/3. Jeżeli w zadaniu występuje podzielność przez 4 i przez 6, to należy podzielić liczby na 12 podzbiorów, według reszty z dzielenia przez 12 (bo 12=NWW(4,6)).

Komentarz o prawdopodobieństwie warunkowym. Jeśli rozważamy doświadczenie, które już nastąpiło, ale my jeszcze nie znamy jego wyniku, to jest oczywiste, że otrzymanie częściowej informacji o wyniku doświadczenia może zmieniać naszą ocenę prawdopodobieństw. Na przykład, jeśli rzucono kostką i powiedziano nam, że nie wypadła szóstka, to prawdopodobieństwo wypadnięcia liczby parzystej wynosi teraz 2/5.
Nazywamy to prawdopodobieństwem warunkowym
– tu: prawdopodobieństwo parzystej liczby oczek przy warunku, że nie wypadła szóstka. Zapis P(A|B) oznacza „prawdopodobieństwo zdarzenia A przy warunku B”, czyli pod warunkiem, że zaszło B. Jest ono równe P(A∩B)/P(B) - to bardzo naturalne: zdarzenie A może zostać zrealizowane tylko za pomocą tych zdarzeń elementarnych, które leżą w B (i oczywiście równocześnie w A), stąd w liczniku P(A∩B); z kolei zbiór B awansował do roli przestrzeni probabilistycznej (zdarzenia elementarne leżące poza B są już niemożliwe), więc aby prawdopodobieństwo nowej przestrzeni probabilistycznej zwiększyć do 1, dzielimy wszystkie prawdopodobieństwa przez P(B).

Jeśli mamy skończoną przestrzeń probabilistyczną z równo prawdopodobnymi zdarzeniami elementarnymi, to prawdopodobieństwo warunkowe
P(A|B)= |A∩B|/|B|

Dowód
To znów jest bardzo naturalne: mamy nową przestrzeń zdarzeń elementarnych B z równoprawdopodobnymi zdarzeniami elementarnymi, a interesuje nas ta część zbioru A, która nie jest wykluczona informacją, że zaszło B; tą częścią zbioru A jest A∩B – i teraz stosujemy klasyczną definicję prawdopodobieństwa.

Komentarz o zdarzeniach niezależnych (to ujęcie zaczerpnąłem z wykładu prof. Marka Capińskiego; Wikipedia i parę innych źródeł też podaje podobne uzasadnienie swojej definicji). Pojęcie to należy wprowadzać po prawdopodobieństwie warunkowym.

Definicja. Zdarzenie A nazywamy niezależnym od zdarzenia B jeśli:
P(B) = 0 lub
(P(B)≠0 i P(A|B)=P(A))

Ostatnia równość oznacza, że informacja, że zaszło zdarzenie B nie zmienia oceny prawdopodobieństwa, że zaszło zdarzenie A. Na przykład przy rzucie dwiema kostkami, czerwoną i zieloną, zdarzenie, że na kostce czerwonej wyszło 6 oczek, jest niezależne od zdarzenia, że na kostce zielonej wyszła parzysta liczba oczek.

Uczniowie powszechnie uważają, że zdarzenia są niezależne, gdy się wykluczają, czyli gdy A∩B=∅. To błąd. Przypuśćmy, że mamy dwa wykluczające się zdarzenia, A i B, nie 0- prawdopodobne. Czy zdarzenie A może być niezależne od zdarzenia B? Otóż nie może, bo skoro się wykluczają, to P(A|B)=0, gdy tymczasem P(A)≠0

Twierdzenie. Zdarzenie A jest niezależne od zdarzenia B wtedy i tylko wtedy, gdy P(A∩B)=P(A)⋅P(B)

[...]

Cały artykuł w pliku pdf ->

Brak komentarzy:

Prześlij komentarz