P-Hacking

p-Hacking, auch als specification searching bekannt, bezeichnet die Verzerrung und Manipulation von Forschungsresultaten, deren Ziel es ist, den p-Wert (d. h. die statistische Signifikanz) durch nachträgliche Anpassung der Testparameter unter eine bestimmte Grenze zu reduzieren.

P-Hacking
Beispiel einer Scheinkorrelation, welche mit p-Hacking gefunden wurde. Die Datenreihe sind a) die Zahl der Buchstaben in dem Gewinnerwort des Wettbewerbes „Scripps National Spelling Bee“ (rot) und die Zahl der in den USA von Giftspinnen getöteten Menschen (schwarz).

Der -Wert wird „gehackt“, also künstlich unter die 5-%-Grenze gedrückt. Auf diese Weise wird eine vermeintliche statistische Signifikanz der Ergebnisse erzeugt. Die häufige Fehlinterpretation von -Werten sowie die Anwendung von -Hacking haben zu unzähligen falschen Forschungsergebnissen geführt, die der Wissenschaft geschadet haben. -Hacking kann als Reaktion wissenschaftlicher Autoren auf die Tatsache angesehen werden, dass Studien mit signifikanten Ergebnissen für die Publikation präferiert werden und Analysen, die nicht signifikante Resultate aufweisen, unveröffentlicht bleiben (File-Drawer-Problem). Mithilfe von Metaanalysen ist es möglich, -Hacking aufzudecken.

Statistische Signifikanz durch Zufall

Beim Prozess des Data-Minings in einem einzigen Datensatz werden durch automatisiertes Suchen von Variablenkombinationen, die eine Korrelation aufweisen könnten, eine große Anzahl an Hypothesen getestet. Dieses Vorgehen kann jedoch das Problem der Alphafehler-Kumulierung mit sich bringen: Konventionelle Signifikanztests legen a priori eine Fehlerwahrscheinlichkeit (größer als Null) für einen Fehler 1. Art fest. Es muss also das Risiko akzeptiert werden, mit der Wahrscheinlichkeit P-Hacking  ein falsch positives Testergebnis zu erhalten (d. h. ein positives Ergebnis, obwohl tatsächlich die Nullhypothese gilt). Wenn eine Vielzahl von statistischen Tests (wie beispielsweise bei genomweiten Assoziationsstudien) durchgeführt wird, dann produzieren einige der Tests per Konstruktion durch Zufall falsch positive (scheinbar signifikante) Ergebnisse. Somit stellt sich heraus, dass 5 % der zufällig ausgewählten Hypothesen nur durch Zufall signifikant auf dem 5-%-Level sind, 1 % auf dem 1-%-Level usw. Wenn ausreichend viele Hypothesen getestet wurden, ist es praktisch sicher, dass manche Hypothesen fälschlicherweise als statistisch signifikant erscheinen.

Beispiel: Schokoladendiät

In einer satirisch angelegten Studie behauptete John Bohannon 2015, dass Bitterschokolade als Teil einer Diät zu Gewichtsreduktion führen könne.

Um diese Behauptung mit einer Irrtumswahrscheinlichkeit kleiner 5 % zu veröffentlichen (also P-Hacking ), dachte er sich im Vorfeld 18 unterschiedliche Kriterien aus, auf die Bitterschokolade eine Wirkung haben könnte, beispielsweise Gewicht, Cholesterol-Wert, Blutdruck, Schlafqualität etc. Einzeln für sich war es sehr unwahrscheinlich, dass Bitterschokolade eines dieser Kriterien statistisch signifikant beeinflusst. Aber dadurch, dass es so viele Kriterien waren, war von Anfang an die Wahrscheinlichkeit hoch, dass irgendeine von ihnen (zufälligerweise) signifikant mit dem Konsum von Bitterschokolade korrelieren würde. In dieser Studie ergab sich, dass die Behauptung mit der Gewichtsreduktion „statistisch signifikant“ war.

Die Studie wies absichtlich zahlreiche andere methodische Fehler auf und wollte dadurch auf genau diese Missstände hinweisen.

Weitere Praktiken

Eine Variante des P-Hacking -Hacking liegt vor, wenn während einer Studie die statistische Relevanz der Daten geprüft wird, um vom Ergebnis dieser Prüfung abhängig zu machen, ob weitere zusätzliche Daten erhoben werden. Desgleichen, wenn die Erhebung von Daten nach einer solchen Zwischenprüfung vorzeitig beendet wird. Stattdessen sollte vorab festgelegt werden, welche Datenmenge untersucht wird. Auch das nachträgliche Ausschließen, Kombinieren oder Aufteilen von Beobachtungsgruppen weist auf versuchtes P-Hacking -Hacking hin.

Wenn zur Messung eines Effektes Störfaktoren herausgerechnet werden müssen, die Auswahl der zu berücksichtigenden Störfaktoren aber von der sich jeweils ergebenden Größe des gemessenen Effekts abhängig gemacht wird, ist dies ebenfalls P-Hacking -Hacking. Eine weitere Variante ist das Abrunden eines P-Hacking -Wertes, der die vorgegebene Schwelle in nicht angegebenen Nachkommastellen überschreitet.

Gegenmaßnahmen

Untersuchungen können alternativ mit dem Kreuzvalidierungsverfahren und einem separaten Validierungsdatensatz oder der Bonferroni-Korrektur durchgeführt werden, um das Problem des p-Hacking zu verringern.

In einigen Fachzeitschriften geht man mittlerweile zum Format des registrierten Berichts über (in dem nicht wie bisher nur positive Befunde berichtet werden können, sondern auch negative Befunde). Ziel ist es, Publikationsbias wie P-Hacking -Hacking und HARKing entgegenzutreten.

Power-Analysen sollten verwendet werden, um Tests mit der nötigen Power zu designen, damit die Stichprobengröße nicht im Nachhinein so lange angepasst wird, bis ein signifikantes Ergebnis erhalten wird (was p-Hacking wäre).

Literatur

Einzelnachweise

Tags:

P-Hacking Statistische Signifikanz durch ZufallP-Hacking Weitere PraktikenP-Hacking GegenmaßnahmenP-Hacking LiteraturP-Hacking WeblinksP-Hacking EinzelnachweiseP-Hacking

🔥 Trending searches on Wiki Deutsch:

IndonesienSüdafrikaWillis ReedAramäer (Gegenwart)Oberbürgermeisterwahl in Frankfurt am Main 2023Alexander der GroßeBerlinArteTierkreiszeichenRosanna ArquetteTom HardyNiedersachsenDer SchwarmÖlkäferSusanne DaubnerMadeiraBayernJürgen KloppFibonacci-FolgeNiederlandeHeinrich VIII. (England)Game of ThronesKitchen Impossible/Staffel 8Robin WilliamsKarl Rudolf von StrauchErster WeltkriegGTK BoxerDana GolombekMartin GoreKill Bill – Volume 1Elvis PresleyPortrait of a LadyDjango UnchainedRussischer Überfall auf die Ukraine 2022D. B. WoodsideManson FamilyAlbert SpeerMaria RasputinAna de ArmasMesut ÖzilIris ApfelMarc MárquezDer dritte MannThe OrvilleOliver KahnCarnival RowReservoir Dogs – Wilde HundeJim BridgerSteven SeagalResident Evil 4SchneekoppeFrédéric ChopinRebecca Ferguson (Schauspielerin)OpenAIArtefucktLuden (Fernsehserie)Donnie YenDietmar BärLand (Deutschland)Christopher WalkenDschingis KhanKlitorisChristian Deutsch (Politiker)Liste der Bundesstaaten der Vereinigten StaatenZweiter WeltkriegJavelin Medium Antiarmor Weapon SystemLinkin ParkChristian BaleDonald SutherlandSchlacht um IlowajskTil SchweigerStellantisLana Del ReySina TkotschPedro PascalAndreas BrehmeMatthew MacfadyenLautertalbahn🡆 More