Azok a fránya feltételes valószínűségek!

(A cikk eredeti változata a Magyar Narancsnál lévő Hamis dilemma című blogomon jelent meg)

210 évvel ezelőtt, 1809. február 12-én született Charles Darwin. Tíz éve ünnepeltük a kerek évfordulót, amely egyben a nagy mű, A Fajok eredete megjelenésének 150. évfordulója is volt. Akkor igen sokat lehetett hallani tévében, rádióban az evolúcióelméletről. Mi is létrehoztunk egy portált: Darwin-nap. Azóta is minden évben Darwin születésnapja körül igyekszem írni a nagy biológusról, az élővilág fejlődéséről, az azt körülvevő téveszmékről, áltudományos elméletekről. Tavaly is megjelentettem két cikket itt a Hamis dilemma blogon.

Ma Magyarországon a felmérések szerint a lakosság nagyobb része gondolja úgy, hogy az evolúcióelmélet helyes és csak negyede állítja, hogy nem. A maradék a bizonytalan, vagy olyan, akit nem érdekel a kérdés. Hogy ez jó-e vagy sem, azt most nem elemzem. Inkább boncolgassuk kicsit az Önző gén, A vak órásmester és számos más populáris könyv írójának, Richard Dawkinsnak az alábbi ezzel kapcsolatos megállapítását:

„Az evolúció gyakorlatilag általánosan elfogadott azok közt, akik értik a működését, és gyakorlatilag általánosan elutasított azok közt, akik nem értik”

Ez a mondás felvet egy érdekes valószínűségszámítási kérdést. Öveket becsatolni, bár nyugi, általános iskolás mateknál többet nem várok el!

Szóval, tegyük fel, hogy egy buliban annyira unalmas a társaság, hogy nincs jobb dolgod, mint hogy az asztaltársadat megkérdezed, elfogadja-e az evolúcióelméletet. Tegyük fel, hogy igennel válaszol. Azaz elfogadja.

Mekkora lehet a valószínűsége annak, hogy az illető érti is az evolúcióelméletet? Olvasd el újból a Dawkins idézetet! Nem pontos számra vagyunk kíváncsiak. Kicsi vagy nagy a valószínűsége, hogy érti?

Valószínű, hogy elsőre azt mondanád: nagy. Úgy tűnik a szöveg alapján. Pedig nem feltétlenül! Szerintem sokkal többen vannak olyanok, akik nem értik az evolúció elméletét, mint akik értik. És ezért, ha a nem értők csoportjában kisebb is azok aránya, akik elfogadják az elméletet, akkor is többen vannak az olyanok, akik valójában nem értik, DE elfogadják, mint akik értik ÉS elfogadják.

Elemezzük ezt egy kicsit ki! Tegyünk egy harmadik állítást a két dawkinsi után:

  1. „Az evolúció gyakorlatilag általánosan elfogadott azok közt, akik értik a működését,…”
  2. „… és gyakorlatilag általánosan elutasított azok közt, akik nem értik.”
  3. “Aki elfogadja az evolúcióelméletet, az általában érti is”

Bár ez igaznak tűnik 1/ és 2/ alapján, de nem minden ilyen esetben az. Nézzünk egy példát kitalált számokkal, ami didaktikai célból szándékosan sarkított. Az evolúcióelméletet EE-vel jelölöm:

  • 1 000 ember érti az EE-t és ezek közül 990 elfogadja (99%).
  • 1 000 000 ember nem érti az EE-t és ezek közül 10 000 fogadja el (1%). Azaz ebből a csoportból 99% nem fogadja el.
  • Akkor 10 990 olyan emberből, aki elfogadja EE-t kevesebb mint 10% (990) érti csak.

Miért fontos ez?

Ha találkozom egy emberrel, aki elfogadja az evolúcióelméletet, akkor ne tételezzem fel róla automatikusan, hogy érti is azt!

A tapasztalatom alátámasztja ezt az elméleti levezetést. Ez még mindig a tudomány presztízsét mutatja. Az emberek inkább elfogadják a tudományos magyarázatokat akkor is, ha nem értik azt.

Akkor tehát tényleg igaz, hogy a tudomány is csak hit kérdése? Egyáltalán nem! Hiszen azok, akik tényleg művelik a tudományt (az evolúcióbiológiát), azok értik azt, és ez alapján messze legtöbbjük helyesnek is tartja az evolúcióelméletet. A tények és ismereteik alapján. Az más kérdés, hogy a laikusok közt ez lehet hit kérdése, de nem az ő hitük vagy nem hitük igazolja vagy cáfolja a tudományos eredményeket.

Csak hogy tudd, az úgynevezett feltételes valószínűségekkel próbállak összezavarni: „mi a valószínűsége annak, hogy valaki elfogadja az evolúcióelméletet, FELTÉVE, hogy ismeri is azt”, illetve fordítva: „mi a valószínűsége annak, hogy valaki érti az evolúcióelméletet, FELTÉVE, hogy elfogadja”.

Ha még FELTÉTLENÜL folytatni szeretnéd, akkor itt egy másik, az előzőnél valószínűleg jóval fontosabb példa, ami szintén sok zavart szokott okozni: HIV teszt.

Ha az alábbi állításokból az 1/ igaz, akkor következik-e belőle, hogy a 2/ is igaz?

  1. Azoknál, akik HIV fertőzöttek, a HIV teszt nagyon-nagy valószínűséggel pozitív lesz.
  2. Ha valakinek a HIV tesztje pozitív, akkor nagy valószínűséggel HIV fertőzött. (ez igaz?)

Az 1/ igaz és ez alapján úgy érezzük, hogy a 2/ is igaz, pedig NEM. Ha vaktában végzünk HIV teszteket, akkor a pozitív eredmények nagyon kis része fog tényleg HIV fertőzésre utalni. Ennek magyarázata az előző példa gondolatmenete alapján történhet. Állj meg egy kicsit itt, és próbáld megindokolni!

Sikerült? Nézzük tovább…

Egy orvosi teszt szenzitivitása (erről szólt az 1/ állítás) azt jelenti, hogy milyen százalékban mutatja ki a teszt a valós betegséget, azaz milyen százalékban pozitív az eredmény, FELTÉVE, ha a páciens tényleg beteg. Ez a HIV teszt esetén igen magas. Pontosan nem tudom, de mondjuk 99%.

Egy orvosi teszt specifikussága (specificity) azt mutatja, hogy hány százalékban lesz negatív a teszt eredménye, FELTÉVE, ha a páciens tényleg nem szenved a betegségben. Egy jó tesztnél ez sem alacsony, de általában alacsonyabb érték, mint a szenzitivitás. De legyen mondjuk ez is 99%.

Azonban a populációban a nem HIV fertőzöttek aránya sokkal-sokkal magasabb, mint a fertőzötteké. Ezért egy véletlenszerűen elvégzett és pozitív teszt esetén még mindig sokkal nagyobb annak a valószínűsége, hogy a páciens nem fertőzött, mint annak, hogy fertőzött. Ez egy fordított feltételes valószínűség, aminek számításához pont az kellett, hogy ismerjük a fertőzöttség (nem feltételes) valószínűségének nagyságát.

Ezért van, hogy ilyen tesztet nem minden betegség esetében érdemes vaktában, nagy tömegeken elvégezni. Olyankor célszerű használni, amikor van egy gyanúnk (úgy nevezett a priori, előzetes feltételezésünk), hogy a páciens fertőzött. Ezt erősítheti meg vagy cáfolhatja jó hatásfokkal a teszt.

Akinek nem sikerült e második matekpélda, itt a megoldás:

  • Tegyük fel, hogy a HIV fertőzöttség (ami az AIDS betegséghez vezet) gyakorisága a lakosságban (az úgynevezett prevalencia) 0,1 ezrelék, azaz 1 000 000 emberből 100 fertőzött, és mindenkin elvégezzük a HIV tesztet.
  • A száz ténylegesen fertőzött közül 99 esetében (99%) pozitív lesz a teszt, egy esetben (1%) téves negatív.
  • A 999 900 nem fertőzött ember tesztjéből 9 999 téves pozitívot kapunk (1%), a többieket (99%) helyesen egészségeseknek mutatja a tesz.
  • Azaz 99 + 9 999 = 10 098 pozitív HIV tesztünk lesz, miközben valójában csak ezek nagyjából 1%-a ténylegesen fertőzött.

Képzeljük el, hogy min mehet keresztül az a majdnem tízezer ember, akiknek csak jó pár további vizsgálat után derül ki, hogy nem is betegek!

Ha az unalmas buliban nem akárkivel, hanem egy kókadozó orvossal futsz össze, és nem az evolúciós kérdéssel fárasztod, hanem ezzel, akkor valószínűleg kiderül, hogy kapásból rosszul oldja meg a feladatot, azaz a 2/ állítást igaznak véli.

Nem véletlen! Bár láthatóan matematikailag egyáltalán nem bonyolult ez, valahogy az agyunk nem áll rá az ilyen problémákra, ahol nagyon alacsony gyakoriságú részhalmazokkal kell valószínűségeket becsülnünk. Sok téveszme, hibás feltételezés mögött ezek a rusnya félreértett feltételes valószínűségek állnak. Érdemes velük barátságban lenni!

X-Aknák - az igazság nem odaát van!