Az adathalászat szerepe és veszélye a tudományban

“Melyik hónapban született? A választól függhet, hogy milyen betegségre van nagy esélye” – írnak egy újabb kutatásról a napilapokban. Azonban nem árt egy kicsit óvatosabban fogalmazni!

Az eredeti cikket (alább) is átfutva feltűnik, hogy ez egy tipikus “adathalász” kutatás. Az ilyesmi teljesen “legális” tudományos értelemben, de nagyon kell vigyázni az eredmények interpretálásával! Az abstract szerint:

“We developed a hypothesis-free method that minimizes publication and disease selection biases by systematically investigating disease-birth month patterns across all conditions.”

Azaz hipotézis nélkül kezdtek, és egy hatalmas adatbázisban kerestek vaktában összefüggéseket. Ilyeneket BIZTOS lehet találni még akkor is, ha valójában nincs is összefüggés. Ha sok betegséget vizsgálnak, akkor még magas szignifikanciaszintet is használva bejön néhány fals pozitív. Ez nemhogy oksági összefüggést, de még sima korrelációt sem jelent biztosan. Ennek leellenőrzésére ilyenkor az eredmények fényében célzott, már hipotézis alapú vizsgálatokat kell folytatni. És ha az pozitív lesz, akkor valószínűsíthető a korreláció, azután lehet megvizsgálni az oksági összefüggés létét.

Tehát az ilyen adathalász (hipotézis nélküli) vizsgálatok hipotézis generálásra alkalmasak, nem pedig hipotézis igazolására.

Az ilyenféle kutatások egyre gyakoribbak lesznek a “Big Data”, a hatalmas adathalmazokon végzett analízisek előtérbe kerülésével. Ezek tényleg hasznosak lehetnek, de a fenti okok miatt nagyon kell vigyázni, hogy az előzetes eredményekből milyen következtetéseket vonunk le. Félő, hogy a statisztikai módszerek, a számítástechnika rohamos fejlődésével az ilyen hipotézisgeneráló kutatások népszerűek lesznek, mert gyors publikálást tesznek lehetővé, míg az igazi bizonyító jellegű kutatások a nehézségek miatt a háttérbe szorulhatnak. Ezt elősegítheti, ha a két kutatástípus közti különbséget nem hangsúlyozzák eléggé, ha egyre inkább bizonyítékként kezdik értékelni az adathalász típusú vizsgálatok eredményét.


Források:

X-Aknák - az igazság nem odaát van!