Súlyos válságát éli a pszichológia tudománya

A közelmúltban két világhírű, de sokat vitatott klasszikus pszichológiai kísérlettel, a stanfordi börtönkísérlettel és a Milgram-kísérlettel szemben is komoly kritikák merültek fel.
Ennek ellenére nem kell kidobni ezeket a kísérleteket, de érdemes a helyükön és a valódi jelentőségüknek megfelelően kezelni őket.
Ugyanakkor sok újabb, a maga idejében szenzációsnak hangzó pszichológiai kísérlet megbízhatósága is megkérdőjeleződött, ami a tudomány rendszerszintű problémáira mutat rá.
A problémákat egy csaló tudós botránya hozta felszínre, de az okai mélyebben gyökereznek.
Az utóbbi években kibontakozó válság több tudományterületre kihat, de a (szociál)pszichológiát érinti legérzékenyebben, ezért a szembenézés is itt kezdődött el.

Ahogy arról mi is részletesen beszámoltunk, a szociálpszichológia két, talán leghíresebb kísérletét is támadások érték az elmúlt hetekben-hónapokban. Röviden felidézzük a két ügyet, majd néhány újabb problémás sztárkísérletet is bemutatunk, hogy aztán szakértők segítségévél körbejárjuk, mi is a valódi probléma, amelyre ezek az esetek rávilágítanak.

Az egyik, közelmúltban újra előkerült klasszikus kísérlet a neves pszichológus, Philip Zimbardo 1971-es stanfordi börtönkísérlete, amelyet már a maga idejében is sok szakmai kritika ért, és ma is ellentmondásos a megítélése. A kutatók egy börtönhelyzetet próbáltak modellezni vele, amelyben a résztvevőket rabokra és őrökre osztották fel, de a kéthetesre tervezett szimulációt hat nap után lefújták, mert az őrök embertelenül kezdtek bánni a rabokkal, utóbbiak pedig ezt rendkívül rosszul viselték. A kísérlet azt volt hivatott demonstrálni, hogy egy adott szituáció bárkinek a viselkedését képes megváltoztatni, bizonyos körülmények között mindenkiből ki lehet hozni a legrosszabbat, a hatalmi alá-fölérendeltség mindenki lelkét megmérgezi. A kritikusok szerint azonban a kísérlet módszertanilag tudománytalan, a résztvevők viselkedése pedig irányított volt.

A másik Stanley Milgram 1963-as elektrosokk-kísérlete, amely a hatalommal szembeni engedelmességet, illetve a parancsszóra szadistává válást demonstrálta. Az alanyoknak azt mondták, egy memóriakutatásban vesznek részt: tanárként szavakat kell felolvasniuk, amelyeket a szomszéd szobában egy tanulónak fel kell idéznie. Ha utóbbi hibázott, a kísérletvezető arra utasította a tanárt, hogy áramütéssel büntesse a diákot (aki színész volt, és valójában persze nem kapott áramütést). Milgram szerint a résztvevők 65 százaléka parancsra akár halálos(nak feltételezett) áramütést is hajlandó volt leadni. A jóval később nyilvánosságra került jegyzőkönyvekből azonban kiderült, hogy a kutatás több felvonásból állt, és összességében jóval kisebb volt az engedelmeskedők aránya, de a képből kilógó kísérletek kimaradtak a tanulmányból. Ahogy az is, hogy az alanyok nagy része tiltakozott a parancs ellen, és a többségük rájött, hogy megtévesztik, ezért ment csak bele a játékba; ráadásul a kísérletvezetők erőteljesen befolyásolták a kísérlet lefolyását.

Mindkét kísérlet mai alternatív értelmezése azt mondja, hogy a résztvevők valójában nem a hatalmi pozíció, illetve a parancs hatására éltek vissza a helyzetükkel, hanem mert azonosultak a kutatók céljaival, így valójában nem a puszta helyzet hatására cselekedtek.

Van ma is érvényes üzenetük

A korábbi cikkünkben említettük, hogy a fenti kritikákból az amerikai tankönyvek nagy részében nem sok jelenik meg. Vajda Zsuzsanna pszichológus, aki a Károli Gáspár Református Egyetemen tartott pszichológiatörténet kurzusán Zimbardóval és Milgrammel is foglalkozik, úgy látja, hogy Magyarországon is hasonló a helyzet, gyakran kritikátlanul kerülnek elő ezek a témák. “A kísérletek korabeli elfogadottságához hozzájárult, hogy mindkettő elég jól illeszkedett a behaviorista, vagyis viselkedésköpzontú amerikai pszichológiai gondolkodásmódba, aminek az a lényege, hogy a környezetünk határoz meg minket. Az amerikai egyetemeknek pedig elképesztő súlya van, ha ott születik egy eredmény, azt nagyon nehéz megcáfolni. Ehhez hozzájárul, hogy a világon minden pszichológiaszakon amerikai tankönyvekből tanítanak, amelyek nagyon hasonlítanak egymásra, ezért bekövetkezett egy nagyfokú homogenizálódás, amivel nehéz szembeszállni.”

Kende Anna szociálpszichológus, az ELTE PPK Szociálpszichológia Tanszék vezetőjének némileg eltérő a tapasztalata, ő azt a bevezető tankönyvet használta, amelynek a szerzője tudatosan kihagyta Zimbardo kísérletét, a 2016-ban magyarra fordított szociálpszichológiai tankönyvük pedig inkább meghaladott irányzatként tálalja ezeket az elképzeléseket.

A Zimbardo és Milgram kísérleteit ért etikai és módszertani kritikák szerinte is jogosak, de a megállapításaik egy bizonyos aspektusát ezzel együtt ma is érvényesnek tartja: “Az nem elvitatható – és lehet, hogy ennek a jelentőségét mai fejjel nem is fogjuk föl –, hogy akkoriban az volt az elterjedt nézet, hogy a náci ideológia követői valamilyen patológiás személyiséggel rendelkeztek. Amire ezek a kísérletek rávilágítottak, hogy egyszerű, hétköznapi emberek viszonylag kicsi behatással is ilyen irányba terelhetők. Csak ennek a mechanizmusát sokkal individualistább felfogásban értelmezték, ami egyébként jellemző az amerikai szociálpszichológiára: a szituáció hat az egyénre, és ettől az egyén úgy viselkedik, ahogy. Az európai szociálpszichológusok hozták be azt, hogy itt társadalmi normákról van szó, a csoport hatásáról, hogy motiváltak vagyunk arra, hogy kifejezzük az identitásunkat, az értékeinket. Ezt Zimbardóék és Milgramék kihagyták az értelmezésből.”

Kende Anna szerint a Zimbardóhoz hasonló sztárok, akik elsősorban nem a tudományos munkásságuk miatt ismertek, nagy szolgálatot tesznek a tudománynak, mert segítik a népszerűsítését.

Zimbardo börtönkísérlete a pszichológiát nem rengette meg, mert amit ő ott illusztrált, azt mások már előtte megtették, csak nem ilyen módon, nem ennyire drámaian. Ő arra alkalmas, hogy tömegeket szólítson meg, és elvigye hozzájuk a szociálpszichológiát.

Hogy is volt ez?

A börtön- és az elektrosokk-kísérlet esete messze nem egyedülálló. Hasonló klasszikus kísérletből is akad még olyan, amely mai szemmel megkérdőjelezhető körülmények között született. Ilyen például az 1954-es Rablóbarlang-kísérlet, amelyben Muzafer Sherif egymással versengő gyerekcsoportokkal demonstrálta a csoportközi konfliktusok dinamikáját – csakhogy mint később kiderült, az első kísérletet, amely nem igazolta az elképzeléseit, nem hozta nyilvánosságra, és a másodikban is manipulálta a csoportok közötti interakciókat.

Mindez azonban ma már inkább történelmi érdekesség. Sokkal fontosabbak azok a kísérletek, amelyek a közelebbi múltban születtek, és meglepő vagy sok későbbi kutatást meghatározó eredményre jutottak, az utóbbi években mégis kételyek merültek fel a megbízhatóságukkal kapcsolatban.

A mályvacukorteszt. Stanfordi kutatók a hatvanas években ötéves gyerekekkel végeztek kísérletet: választhattak egy édességet azonnal, vagy ha türelmesen vártak, kettőt később. A nyolcvanas és kilencvenes években aztán újra tesztelték a korábbi résztvevőket, és megállapították, hogy akik annak idején képesek voltak kivárni, később jobb eredményt értek el az iskolában, és kevesebb viselkedésbeli probléma volt velük. 2018-ban egy kutatócsoport az eredetinél jóval több gyerek adatával megpróbálta replikálni a kutatást, de teljesen más eredményre jutottak: amikor a családi háttér különbségeivel is számoltak, a korai önmegtartóztatás és a későbbi teljesítmény összefüggése elenyésző volt.

Social priming vagy előfeszítés. Az a jelenség, amikor valamilyen előzetes hatás akár tudtunkon kívül hatással van az azt követő viselkedésünkre. A leghíresebb egy 1996-os kísérlet, amelyben az idős korhoz kapcsolódó kifejezéseket hallgató alanyok ezután nagyobb eséllyel sétáltak lassabban, mint a másik csoport, akiknek nem játszottak le ilyen szavakat. 2012-ben ugyanezt a kísérletet próbálták nagyobb mintán megismételni, sikertelenül.

Egokimerülés. Egy 1998-as kísérlet szerint az akaraterő véges erőforrás, ha megdolgoztatjuk, elfáradhat, és később rosszabb döntéseket hozhatunk. 2016-ban sokkal nagyobb mintán megismételték a kísérletet, és gyakorlatilag semmi ilyesmire utaló jelet nem találtak.

Arc visszajelzés-elmélet. Eszerint az elképzelés szerint az arckifejezésünk nemcsak tükrözi az érzelmeinket, de generálhatja is azokat. A legismertebb ilyen kísérlet 1988-as: rajzfilmet nézettek két csoporttal, miközben az egyikben a résztvevőknek a fogaik, a másikban az ajkaik között kellett tartani egy tollat. Az előbbiek kénytelenek voltak mosolyra húzni a szájukat, míg utóbbiak erre képtelenek voltak. Utólag az első csoport viccesebbnek találta a rajzfilmet. 2016-ban ezt több résztvevővel megismételték, és nem találták igazoltnak.

Power posing. 2010-ben három kutató azzal állt elő, hogy ha erőteljes, magabiztos kiállást sugárzó testtartást veszünk fel, az olyan hormonális folyamatokat indít el a testünkben, amelyek hatására valóban magabiztosabbnak is érezzük magunkat. Ez az elképzelés nagyon gyorsan népszerű lett, az erről szóló TED-előadás most 47,6 millió megtekintésnél jár. De a mindössze 42 résztvevővel végzett kísérletet a következő években egymás után cáfolták meg, 2017-ben például rögtön 11 kísérlettel.

És lehetne még sorolni a példákat bőven.

Úgy érzem, hogy fordulóponthoz érkezett ez a tudomány. Rengeteg csalás és szélhámosság van forgalomban, ezekkel szembe kell nézni, és meg kell tisztítani a szakmát, mert rontják a hitelét

– mondta Vajda Zsuzsanna.

Túl nagyot akartak mondani

Mégis hogyan fordulhat elő, hogy ennyi népszerű eredményről derül ki, hogy alaptalan vagy legalábbis megkérdőjeleződik, hogy valóban létező jelenségről van-e szó?

Tény, hogy a szociálpszichológiának volt egy hajlandósága arra, hogy nagy problémákra frappáns válaszokat próbáljon kínálni. Csupa olyan kísérlet cáfolódott meg, ami túl komplex kérdésre túl egyszerű választ adott. Szerintem egy picit zsákutcába tévedt a szociálpszichológia, amikor túlságosan ráhajtott ezekre a szenzációs eredményekre. Nekünk alapvetően nem ez a feladatunk

– mondja Kende Anna.

A necces kutatások felé ugyanakkor a rendszerbe épített ösztönzők is terelgetik a kutatókat. A szakma csak az utóbbi időszakban kezdett el módszeresebben foglalkozni azzal a problémával, hogy a tudományos intézményrendszer a felépítéséből adódóan támogat bizonyos torzító hatásokat.

Azok a kutatások, amelyek valamilyen újdonságot vagy a kutatók feltevéseit igazoló eredményt hoznak ki, nagyobb valószínűséggel kötnek ki tudományos folyóiratokban, míg azok, amelyek eredménytelennek bizonyulnak, leginkább a fiókban végzik. Ez nemcsak a negatív eredmények elhallgatását, de a fals pozitív eredmények elfogadását is bátorítja.

Ezzel összefüggő probléma a p-hekkelés, amikor a kutatók statisztikai ügyeskedéssel tüntetik fel szignifikánsabbnak az eredményeiket, mint amilyenek azok valójában – leegyszerűsítve például úgy, hogy csak addig folytatják a kísérletet, amíg kellő többségbe nem kerülnek a nekik tetsző adatok, majd rögtön be is szüntetik. Ez gyakran vezet kis létszámú kísérletekhez, márpedig minél kisebb a kutatásban használt minta, annál kevésbé megbízható az eredménye.

Az ilyen trükközések egy 2012-es felmérés szerint meglepően gyakoriak: a megkérdezett több mint kétezer pszichológus fele vallotta be, hogy csak olyan kutatásokat jelentetett meg, amelyek az elvárt eredményt hozták; 43 százalék hagyott már ki adatokat azért, mert azok nem kívánatos irányba befolyásolták volna az eredményt; és 35 százalék tálalt úgy váratlan eredményt, mintha mindig is erre számított volna. (Csak a megkérdezettek 1,7 százaléka ismerte be, hogy hamisított is már meg adatokat.)

Az a követelmény, hogy legyenek látványos eredmények, oda vezetett, hogy nagyon nehézzé vált olyan eredményeket közölni, amiből az jött ki, hogy valami nem úgy van, ahogy feltételeztük. Emögött többnyire nem csalási szándék áll. Ha nem az jön ki, amire az ember számít, azt gondolhatja, hogy biztos valamilyen módszertani hiba áll a háttérben. Ugyanígy sokkal kritikusabbak a folyóiratok bírálói is. És miután egy kutató teljesítményét a publikációk száma és minősége adja meg, ez abba az irányba terelte a kutatókat, hogy a feltevésüket várhatóan megerősítő kísérleteket végezzenek, illetve ami nem ilyen, azt hallgassák el. Ez az a probléma, amivel a szociálpszichológiának szembe kell néznie, és azt hiszem, hogy egyre jobban szembe is néz

– mondja Kende Anna.

Bár a kifejezett csalás extrém eset, a fenti problémákra mégis egy ilyen botrány irányította rá a figyelmet: egy Diederik Stapel nevű holland szociálpszichológusról 2011-ben kiderült, hogy évek óta minden kutatása adatait manipulálta vagy meghamisította. Eleinte csak belenyúlt az adatokba, később már le se folytatta a kísérleteket, csak általa kitalált “eredményeket” továbbított elemzésre a (mit sem sejtő) kollégáinak. A csalásait feltáró 2012-es jelentés szerint a visszaéléseket az tette lehetővé, hogy a tudományos közösség kritikátlanul fogadta el kollégája eredményeit. Stapel egyik első visszavont cikke egyébként a Science-ben jelent meg arról, hogy a fizikai környezet hogyan hat a sztereotípiákra és a diszkriminációra; végül összesen 58 cikkét vonták vissza.

Újratervezés

A tudomány alapvetően nem úgy működik, hogy valaki elhatározza, hogy megold egy problémát, és onnantól az a probléma meg van oldva, lehet továbblépni a következőre. A kutatások fokozatosan épülnek egymásra, olykor megerősítve korábbi eredményeket, máskor ellentmondva nekik. Ezért a tudományosság fontos kritériuma a megismételhetőség: ha egy replikált kísérlet eredménye egybevág az eredetivel, hitelesíti azt, ha nem, akkor valamilyen hiányosságára mutathat rá.

Stapel esete önvizsgálatra késztette a szociálpszichológia kutatóit. A megtisztulási folyamat egyik irányaként megszaporodtak a replikációs kutatások – és az ismétlési kísérletek tömegesen bizonyultak sikertelennek. Ezt a jelenséget szokás megismételhetőségi vagy replikációs válságnak nevezni.

A replikációs láz 2015-ben tetőzött, amikor a tudományos kutatások átláthatóságát célzó csoport, az Open Science Collaboration 270 pszichológusa publikált egy nagy tanulmányt a Science folyóiratban. Ebben 100 olyan pszichológiai kísérletet ismételtek meg, amelyek három vezető szaklapban jelentek meg 2008-ban. Mindössze a kutatások 39 százalékának az eredményét sikerült replikálniuk, de ezeknél is jellemzően az eredetinél gyengébb összefüggést mutattak ki.

Egyébként messze nem a pszichológia sajátos problémájáról van szó: csak az utóbbi néhány évben egy AIDS-kutató, majd egy őssejttudós szenzációsan hangzó eredményeit vonták vissza, mert nem sikerült azokat megismételni, és a replikációs próbálkozások során derült ki, hogy meghamisították az adataikat. Szintén így bizonyosodott be, hogy csak egy meghibásodás miatt mértek a fénysebességnél gyorsabb neutrínókat a CERN-ben. Egy kutatócsoport pedig 2014-ben előbb bejelentette, hogy gravitációs hullámok nyomára akadt, majd egy évvel később maguk az eredeti bejelentést tevő kutatók cáfolták a korábbi eredményüket újabb mérések után. De a rákkutatásban is több alapvető eredmény lehet megbízhatatlan; gyakori betegségek genetikai háttere is bizonytalanná vált; és a mesterséges intelligencia területén se sikerült sok kutatást replikálni. Viszont a pszichológiai kísérletek a témájuknál és jellegüknél fogva nehezebben replikálhatók, mert a vizsgált jelenségek általában nem figyelhetők meg közvetlenül, így az eredmények erősen ki vannak téve a kutatási körülményeknek.

A replikációs kutatások presztízse és támogatottsága viszont hagyományosan elmarad az eredeti kutatásokétól. Egy 2012-es felmérés szerint a top 100 pszichológiai folyóirat 1900 óta megjelent cikkeinek alig 1 százaléka volt korábbi eredmények megismétlésére tett kísérlet. Több nagy presztízsű szaklap sokáig kifejezetten el is utasította az ilyen tanulmányokat. Mivel a kutatóknak fontos fegyvertény a publikáció, és a rendszer inkább az eredeti kutatásokat jutalmazza, értelemszerűen nem sok minden ösztönzi őket arra, hogy már publikált eredményeket ismételgessenek.

Kende Anna szerint ma már megvannak a replikációk közlésének is a maga fórumai, az ő tanszékükön is volt nemrég egy ilyen kutatás, ami egyébként nem erősítette meg a korábbi eredményeket. Szerinte azért is kevés az ilyen kutatás, mert a legtöbb kutatót egyszerűen nem motiválja az ilyesmi, belső indíttatásból is inkább új felfedezések iránt érdeklődik.

A megszaporodó replikációk mellett egy másik szakmai kezdeményezés a publikációk kigyomlálására a kutatási tervek előregisztrációja. Ennek az a lényege, hogy a módszertant már előre el kell fogadtatni, így kevésbé lehet menet közben statisztikai bűvészkedésbe bonyolódni, és az egész folyamat átláthatóbb. Kende Anna szerint ez nagyon fontos lépés, de azért nem szabad átesni a ló túloldalára sem, mert ha minden egyes kutatást előregisztrálnának, nem maradna tere a tudományos kreativitásnak. Amit viszont minden esetben fontosnak tart, hogy sokkal nagyobb elemszámú kutatásokat kell végezni, mert minél kisebb a minta, annál nagyobb a fals pozitív eredmények esélye, míg a nagyobb mintával dolgozó, statisztikailag erősebb kutatások nagyobb valószínűséggel állják ki a tudományosság próbáját.

Mindenki feszült

A szigorúbb feltételek és a módszertani kötözködés nem minden kutatónak tetszik, ezek a kezdeményezések elég sok ellentétet és frusztrációt szültek, és nem egyszer személyeskedésbe is torkollottak az indulatok az átláthatóbb kutatásokat sürgető, illetve az egész felvetést a probléma túllihegésének tartó, “replikációs rendőrséget” kiáltó kutatók között.

Tanulságos eset volt, amikor a Social Psychology folyóirat 2014-ben különszámot szentelt a problémának. A szerzők 27 fontosnak ítélt szociálpszichológiai eredményt próbáltak megismételni, legalább 10-et sikertelenül. A különszám körül éles vita alakult ki.

Az egyik megismételt kutatás egy 2008-as tanulmányt vett elő újra. Az eredeti kutatásban a Cambridge Egyetem tudósa, Simone Schnall és kollégái két kísérletet végeztek el. Az elsőben 40 hallgatóval szójátékokat végeztettek, az egyik felüknek tisztasággal kapcsolatos, a másikuknak semleges szavakat adtak. A másodikban 43 hallgatóval megnézették a Trainspotting vécéjelenetét, majd az egyik csoporttal kezet mosattak, a másikkal nem. Végül mindkét felvonásban minden résztvevőnek erkölcsileg necces helyzeteket kellett értékelniük. Akiket tisztaságról szóló szavakkal vagy kézmosással előfeszítettek, kevésbé ítélték el a mocskos erkölcsűeket. A kutatók levonták a következtetést: a tisztaságérzet jelentős hatással van az erkölcsi tisztaság megítélésére, akik magukat tisztának érzik, öntudatlanul is kevésbé akadnak fenn mások tisztátalanságán. A kísérleteket megismétlő kutatók viszont semmi ilyen összefüggésnek nem találták nyomát, pedig az eredetinél négyszer több alannyal dolgoztak.

Schnall eleinte együttműködött a Michigani Egyetem kutatóival, minden adatot átadott nekik, és jóvá is hagyta a kutatási tervüket, ezután viszont nehezményezte, hogy a kutatás értékeléséből már kihagyták, és a szerinte hibás tanulmányra adott válaszát se akarták lehozni ugyanabban a számban. (Erre végül a következő számban kapott lehetőséget.) Mint mondta, végig úgy érezte magát, mintha a vádlottak padjára került volna, de a bíróság még csak védekezésre se adna lehetőséget. A vita elmérgesedett, az erősödő replikációs törekvéseket idegenkedve figyelő kutatók tudományos bullyingot kiáltottak és önjelölt seriffekről beszéltek, míg mások arra utaltak, hogy talán nem kellett volna megkérdőjelezhető módszerekkel kutatásokat végezni, hogy aztán szexi szalagcímekkel lehessen eladni a szenzációs eredményeket – de ugyanezt az ismétlést végző kutatók is megkapták, miután az egyikőjük például az epic fail címszóval tálalta, hogy ők más eredményt kaptak, mint az első kutatás. (Ezért aztán bocsánatot is kért.)

Kende Anna szerint valóban sok olyan kutató van, aki nem igazán tud mit kezdeni azzal, hogy az ő kutatását nem sikerült replikálni.

A tudományosságnak a replikálhatóság a kritériuma, önmagában azt, hogy az én kutatásom eredményét nem sikerül replikálni, azért valahogy nagyobb méltósággal kellene elfogadni. Föl lehet vetni, hogy mi lehet az oka, hogy öt évvel ezelőtt más jött ki, mint most. Lehet konstruktív vitákat kezdeményezni. Volt, aki nagyon jól állt ehhez, segítette a replikációs folyamatot, de volt, aki személyes sértésnek vette. Szigorúbb elvárások vannak, ettől mindenki valószínűleg ideges egy kicsit, mert közben nagy a nyomás a publikálásra

– mondta, hozzátéve, hogy azért Magyarországon a nyomás is kisebb, így az ilyen indulat is kevesebb.

Borítókép: a stanfordi börtönkísérlet.

Index Vakbarát Hírportál