Skaičių valdžia: kaip tūkstančiai mokslininkų tapo 50 metų trukusio sąmokslo dalimi ir kada skaičiai sako tiesą? (2)
Ryšys tarp dviejų reiškinių (koreliacija) nereiškia, kad vienas yra kito priežastis (priežastingumas).
Prisijunk prie technologijos.lt komandos!
Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.
Sudomino? Užpildyk šią anketą!
Nyderlandų žurnalistės Sanne Blauw bestselerio „Skaičių valdžia: kaip skaičiai valdo mūsų gyvenimus ir klaidina“ ištrauka.
„Skaičiai lemia tai, ką geriame, valgome, kur dirbame, kiek uždirbame, kur gyvename, su kuo tuokiamės, už ką balsuojame, kaip apsisprendžiame imti ipoteką, kaip apmokame draudimą. Negana to, jie lemia net ir tai, sergame mes ar gyjame, gyvename ar mirštame. Mes negalime rinktis; net jeigu nesidomime skaičiais, skaičiai valdo mūsų gyvenimą. Šios knygos tikslas — prasklaidyti skaičių pasaulio paslaptis, kad kiekvienas galėtų atskirti, kada skaičiai naudojami korektiškai, o kada jais piktnaudžiaujama. Kad visi mes galėtume paklausti: kokį vaidmenį savo gyvenime norime skirti skaičiams?“
1953 metai tabako pramonei buvo sunkus laikas. Philip Morris & Co., United States Tobacco Company ir kitų tabako gamintojų akcijų kursas staigiai ir netikėtai nukrito. Tiesiogine to priežastimi tapo Ernsto Wynderio ir jo kolegų, užsiimančių vėžio tyrimais, publikacija. Jie kupranugario plaukų šepetėliais tepė nuskustas baltųjų pelių nugaras dervomis iš cigarečių.
Šio eksperimento rezultatai buvo siaubingi: 44 procentams bandomųjų pelių išsivystė vėžys. Po dvidešimties mėnesių liko gyvos tik 10 procentų iš 81 pelės, ant kurių nugaros buvo tepama derva. Kontrolinėje grupėje, kurioje pelės derva tepamos nebuvo, nepasitaikė nė vieno vėžio atvejo, o po metų ir aštuonių mėnesių 53 procentų pelių dar buvo gyvos.
Apie šį nerimą keliantį eksperimentą rašė New York Times, Life ir itin populiarus žurnalas Reader’s Digest. Pastarajame straipsnis išleistas su niūria antrašte „Vėžys pakeliais“ (Cancer by the Carton). Tabako magnatai kilusio triukšmo ignoruoti nebegalėjo ir tų pačių metų gruodį susirinko greta Niujorko Centrinio parko stovinčio „Plazza“ viešbučio Ąžuolo salėje (Oak Room). Šiame žymiame restorane jie pabandė sukurti savo pramonės šakos apsaugos nuo kritiškai nusiteikusių tyrėjų planą.
Šiuo klausimu niekas negalėjo pagelbėti geriau, nei prie jų stalo prisėdęs žmogus, — Johnas Hillas. Jis buvo vienos iš galingiausių viešųjų ryšių firmos JAV, agentūros Hill and Knowlton generalinis direktorius. Su jo pagalba tabako magnatai norėjo įtikinti visuomenę, kad Wynderio ir jo kolegų kaltinimai niekaip moksliškai nepagrįsti. Reikėjo pademonstruoti, kad visas nerimas dėl cigarečių žalos – nerimtas ir juokų vertas.
1954 metų sausio 4 dieną stambūs tabako gamintojai įsteigė Tabako pramonės tyrimų komitetą (Tobacco Industry Research Committee). Daugiau nei keturiuose šimtuose įvairiausių leidinių skelbimuose, užimančiuose visą skiltį, jie tikino visuomenę, kad jų produkcija nekenkia. Jie teigė, kad per tuos šimtmečius, kai žmonės mėgaujasi tabaku, kritikai vadino jį „praktiškai visų žmogaus ligų priežastimi“. Tokie kaltinimai vėl ir vėl buvo atmetami dėl medicininių įrodymų stokos, skelbė komitetas. Tačiau skelbimuose sakyta, kad gamintojus labai neramina net menkiausios žalos įtarimai. Jungtinis šakos komitetas galės prisidėti prie „visų tabako vartojimo stadijų ir jo medicininių aspektų tyrimo“.
Taip radosi beveik penkiasdešimt metų trukęs ir nesuskaičiuojamai daug gyvybių nusinešęs sąmokslas. Galiausiai JAV Teisingumo departamentas paskelbė, kad tą gruodžio dieną magnatai nutarė „suklaidinti amerikiečius dėl medicininių rūkymo pasekmių“. Tačiau ši apgavystė nebuvo vien tabako pramonės darbas. Jos bendrininkais tapo ir tūkstančiai mokslininkų.
Statistika paremtas melas
Tais pačiais metais, kai laikraščiuose pasirodė ištisus puslapius užimantys tabako magnatų skelbimai, Darrellas Huffas išleido knygą „Kaip meluoti, naudojant statistiką“ (How to Lie with Statistics). Ši 142 puslapių knygelė tapo viena iš populiariausių knygų apie skaičius per visą istoriją.
Huffas buvo ne statistikas, o nepasotinamai žingeidus žurnalistas. Ankstesnės jo knygos buvo apie fotografiją, karjeros siekimą ir apie šunis, o dabar jis suleido nagus į piktnaudžiavimą skaičiais: „Sukčiai šiuos triukus jau žino; padorūs žmonės apie juos privalo sužinoti, kad apsigintų“.
Knygos pasisekimas buvo stulbinamas: vien angliškos versijos parduota daugiau, nei 1,5 milijono egzempliorių. Tai yra mano mylima knyga apie skaičius. Margindamas pasakojimą humoru, Huffas rašo apie klaidas, kurias darome iki šiol, — pavyzdžiui, apie nereprezentatyvias apklausas ir apgaulingus grafikus. Pasakoja ir apie dar vieną klasikinę klaidą: koreliacijos painojimą su priežasties ir pasekmės priklausomybe.
Klaidinga idėja, – kad ryšio tarp dviejų reiškinių buvimas automatiškai reiškia, kad vienas yra kito priežastis. Pavyzdžiui, Huffas mikliai parodo, kad vaikų skaičių šeimoje galima gan gerai įvertinti pagal gandrų, sukančių lizdų ant tų namo stogo, skaičių. Kitaip tariant, tarp naujagimių ir gandrų yra ryšys. Tačiau, atskleisiu jums paslaptį, gandrai naujagimių neatneša. Ryšio tarp šių dviejų reiškinių buvimas (koreliacija) nereiškia, kad vienas yra kito priežastis (priežastingumas). Gan tikėtina, kad yra kitas faktorius, kuris veikia abu šiuos reiškinius: „Didesnės — ir potencialiai didesnės — šeimos įprastai apsigyvena dideliuose namuose, — rašo Huffas, — o ant didelių namų būna daugiau krosnių kaminų, ant kurių lizdus gali sukti gandrai“.
Huffas šį pavyzdį pateikė ne knygoje, o savo 1965 m. kalboje Senato prekybos komiteto posėdyje, apie kurį bus kalbama toliau, ir nepublikuotame kitos knygos — „Kaip meluoti, panaudojant rūkymo statistiką“ (How to Lie with Smoking Statistics) — rankraštyje.
Mokėjimas suvokti savo klaidas svarbus ne tik statistikams, bet ir mums visiems. Daugelį sprendimų priimame, remdamiesi prielaida apie priežasties ir pasekmės priklausomybę. Vyriausybė nusprendžia sumažinti išlaidas, nes išlaidų sumažinimas sumažina valstybinius įsiskolinimus. Rūkorius meta rūkyti, nes gydytojai tvirtina, kad priešingu atveju jis susirgs plaučių vėžiu. O COVID-19 pandemijos metu išmokome laikytis vienas nuo kito pusantro metro atstumu, nes vyriausybė ir PSO sako mums, kad tai trukdo virusui plisti.
Idėja yra ta, kad jei žinome, kas sukelia vieną ar kitą reiškinį, tada galime jį veikti. Tačiau nedera koreliacijos painioti su priežastingumu. Jau matėme tokią klaidą, kai politikai tvirtino, kad žmogaus odos spalva lemia jo IQ lygį. O taip pat, kai psichologė Amy Cuddy tvirtino, kad kai kurios pozos daro įtaką hormonų lygiui.
Tačiau dažniausiai klaidingos išvados apie priežasties ir pasekmės ryšį pasitaiko naujienose apie mediciną. Džinas su toniku palengvina šienligės simptomus, tikimybė užsikrėsti venerinėmis ligomis, jei gaktos plaukai nuskusti, o juodas šokoladas naudingas širdžiai — tik maža dalis kasdien mus užplūstančių pranešimų pavyzdžių.
Tokie tvirtinimai dažnai būna perdėti. Ir čia kalta ne tik išpūstus pranešimus mėgstanti publikuoti žiniasklaida; iš tiesų problemos šaknys dažnai slypi informaciją apie medicinos tyrimus platinančių universitetų spaudos tarnybose.
Tyrėjas Petrocas Sumneris su kolegomis peržiūrėjo 2011 metais paskelbtus dvidešimties Britanijos universitetų pranešimus spaudai biologijos, medicinos ir sveikatos srityje. Paaiškėjo, kad maždaug trečdalyje šių pranešimų buvo perdėti pareiškimai apie priežasties–pasekmės ryšius, o apie 80 procentų naujienų pranešimų šie perdėjimai pakartoti.
Bet jeigu mes, naujienų vartotojai, nebegalime visiškai pasitikėti žurnalistais ir mokslininkais, kaip gi atskirti faktus nuo pramanų? Kaip sužinoti, ar rūkymas sukelia plaučių vėžį? Knygoje „Kaip meluoti, pasinaudojant statistika“ yra patarimų šia tema. Huffas joje aprašo tris tipus to, ką vadinu „išpuikusiomis koreliacijomis“, — koreliacijas, besidedančias kažkuo didesniu, nei iš tiesų yra: priežasties ir pasekmės priklausomybe.
1. Sutapimas
Receptų knyga. Būtent daugiausiai iš jos daktaras Jonathanas D. Schoenfeldas ir Johnas P.A. Ioannidis sėmėsi žinių, atlikdami vėžio tyrimo analizę. Jie atsitiktinai pasirinko kelis receptus iš „Bostono virėjų mokyklos receptų knygos“ (The Boston Cooking School Cook Book) ir surašė 50 pirmų šiuose receptuose aptiktų ingredientų. Apsiginklavę šiuo sąrašu, jie apsilankė medicininių tyrimų archyvo svetainę PubMed.
Pirmasis rezultatas pasirodė gan įdomus: 40 iš 50 ingredientų bent viename tyrime buvo įvardinami kaip sukeliantys vėžį. „Negi iš tiesų viskas, ką valgome, susiję su vėžiu?“ — susimąstė tyrėjai.
Kitas rezultatas pasirodė dar keistesnis. Daugelio ingredientų atveju buvo tvirtinama, kad jie tiek didina, tiek ir mažina vėžinių susirgimų riziką. Pavyzdžiui, jei viename tyrime buvo tvirtinama, kad vynas naudingas sveikatai, tai nesunku buvo rasti ir kitą publikaciją, kurioje tvirtinama, kad geriau nė nepaliesti prieš jus stovinčios taurės.
Koreliacija tarp įvairių maisto produktų ir gėrimų vartojimo ir susirgimų vėžiu
Schoenfeldas ir Ioannidis nusprendė savo tyrimą apriboti 20 ingredientų, apie kuriuos buvo publikuota po ne mažiau nei dešimt studijų. Apie 17 iš tų dvidešimties ingredientų, nuo pomidorų iki arbatos, nuo kavos iki jautienos, jie rado viena kitai prieštaraujančių išvadų. Visi šie rezultatai negali būti teisingi tuo pačiu metu, tačiau kaip konkrečiai šių tyrimų autoriai priėjo prie šių išvadų? Galimą paaiškinimą suteikia pirma Huffo aprašyta „išpuikusi koreliacija“: paprastas sutapimas.
Kas nutinka, kai sutampa atsitiktinumas ir koreliacija, rodo aštuonkojo orakulo istorija. 2010 metais aštuonkojis Paulis numatė aštuonių futbolo pasaulio čempionato rungtynių rezultatus. Jis vėl ir vėl čiuptuvais atverdavo teisingą dėžutę su maistu — ant dėžutės būdavo kitose rungtynėse laimėjusios komandos vėliava. O žurnalistų ordos vėl ir vėl sujaudinti laukė jo prognozių. Kai Nyderlandai išėjo į finalą ir turėjo žaisti su Ispanija, Paulis prognozavo Nyderlandų rinktinės pralaimėjimą. Aštuonkojis išgarsėjo: jis tapo Ispanijos miesto Carballiño garbės piliečiu, buvo paskirtas Anglijos paraiškos rengti 2018 metų pasaulio čempionatą pasiuntiniu, o Irano prezidentas Machmudas Achmadinedžadas pavadino jį „Vakarų irimo ir puvimo simboliu“.
O ką, jei Pauliui tiesiog sekėsi? Tikimybė grynai atsitiktinai atspėti aštuonių rungtynių rezultatus lygi tikimybei, kad metant monetą, aštuonis kartus iš eilės iškris herbas: vienas iš 256, tai yra, 0,4%. Tikimybė nedidelė, tačiau laimėti [Britanijos nacionalinę] loteriją Lotto tikimybė beveik 200 000 menkesnė — vienas iš 45 milijonų.
Ši istorija stebina dar mažiau, kai sužinai, kad į pasaulio čempionato vaidmenį pretendavo ir kiti gyvūnai. Kaip jums dygliatriušis Leonas, mažasis begemotas Peti ar tamarinas Antonas? Jie irgi prognozavo čempionato rungtynių rezultatus, tačiau jiems sekėsi mažiau, nei kolegai Pauliui. Surinkus pakankamai gyvūnų, kurie prognozuotų rungtynių rezultatus, visuomet rastis atspėjęs teisingai. Tas patas pasakytina ir apie koreliaciją. Pakankamai ilgai ieškant, visuomet galima rasti ryšį.
Niekas to neiliustruoja geriau, nei analitikas Tyleris Vigenas. Jį išgarsino keistos koreliacijos, apie kurias jis rašė savo svetainėje Spurious Correlations („Abejotinos koreliacijos“). Pavyzdžiui, jis aptiko, kad kasmet į baseiną įkrintančių ir nuskęstančių žmonių skaičiaus didėjimas, beveik tiksliai lygus filmų, kuriuose vaidina Nicolas Cage'as skaičiui. O sūrio vartojimo dinamika bauginamai panaši į patalynėje susipainiojusių ir žuvusių žmonių skaičių. Vigeno koreliacijos pabrėžtinai beprasmės, dėl to ir tokios linksmos. Gerokai liūdniau yra tai, kad koreliacija medicinos tyrimuose lygiai taip paprastai gali kilti atsitiktinai.
Likusioje skyriaus dalyje knygos autorius nagrinėja dar dvi „išpuikusias koreliacijas“ — kokio nors faktoriaus nebuvimą ir atvirkštinį priežasties ir pasekmės ryšį.
The Number Bias: How Numbers Lead and Mislead Us, Sanne Blauw [liko 3 vnt.]
https://azbooka.ru/books/vo-vlasti-tsifr-kak-chisla-upravlyayut-nashey-zhiznyu-i-vvodyat-v-zabluzhdenie▲