Journal nur null hypothesen psychologie

Die Unsicherheit und Ungenauigkeit solcher Schätzungen wird dabei durch Konfidenzintervalle vermittelt [ 10 ] [ 14 ]. Konfidenzintervalle werden häufig im Zusammenhang mit Behandlungseffekten in klinischen Studien diskutiert [ 18 ] [ 19 ]. Es ist aber möglich, ein Konfidenzintervall um jede Statistik zu konstruieren, unabhängig von ihrer Verwendung. Dazu gehören:.

Um die Schätzung sinnvoll einzusetzen, reicht es nicht aus, lediglich Konfidenzintervalle zu berichten. Forschende müssen auch die Relevanz der durch die Konfidenzintervalle dargestellten Informationen interpretieren und deren Implikationen bedenken. Die Interpretation der berechneten Konfidenzintervalle ist jedoch unerlässlich.

Ein prominentes Beispiel ist das folgende Zitat aus dem Editorial einer Sonderausgabe der Fachzeitschrift The American Statistician [ 13 ] zum Thema statistische Inferenz:. Wir gehen hier diesen Schritt. Dieser Anspruch mag radikal und undurchführbar für Forschende erscheinen, die seit langem gewohnt sind, mit statistischen Nullhypothesentests zu arbeiten, aber viele ihrer Bedenken können zerstreut werden.

Erstens würde ein solches Verbot die Forschungsergebnisse, die in den letzten Jahrzehnten unter Verwendung von statistischen Nullhypothesen berichtet wurden, nicht verwerfen. Die Daten, die in solchen Studien generiert wurden, bleiben valide — und sie wurden oft hinreichend detailliert berichtet, um Konfidenzintervalle berechnen zu können.

Oder statt bestimmen zu wollen, ob ein prognostisches Modell prädikativ ist, wäre nun das Ziel zu schätzen, wie gut die Vorhersage durch das Modell ist. Drittens kann die statistische Ungenauigkeit solcher Schätzungen leicht berechnet werden. Es gibt bereits Statistik-Software, die Konfidenzintervalle berechnet, darunter auch kostenfreie Software wie R [ 21 ] [ 22 ].

Ergebnisse, deren Konfidenzintervalle den kleinsten lohnenswerten Effekt überspannen, deuten darauf hin, dass es einen Effekt gibt, dessen Relevanz unsicher ist. Ergebnisse mit einem engen Konfidenzintervall, das den Nulleffekt[ 3 ] beinhaltet, deuten darauf hin, dass der Effekt der Behandlung vernachlässigbar ist. Ergebnisse mit einem breiten Konfidenzintervall, die den Nulleffekt beinhalten, deuten hingegen darauf hin, dass der Effekt der Behandlung unsicher ist.

Eine Interpretation von Schätzungen zu Behandlungseffekten und ihren Konfidenzintervallen baut darauf auf, dass der kleinste lohnenswerte Effekt auch als minimaler klinisch relevanter Unterschied bezeichnet bekannt ist [ 23 ]. Für manche Forschungsfragen wurde ein solcher Schwellenwert bislang noch gar nicht oder nur unter Verwendung ungeeigneter Methoden festgelegt.

In solchen Fällen sollten Forschende erwägen, eine Studie durchzuführen, um den Schwellenwert zu bestimmen oder diesen zumindest prospektiv benennen. Um ein Konfidenzintervall zu interpretieren, beschreiben wir einfach die praktischen Implikationen sämtlicher Werte innerhalb des Intervalls [ 24 ]. In einer Studie zur Güte eines diagnostischen Tests zeigt uns zum Beispiel die Likelihood Ratio LR — bei vorliegendem positivem Test — das Verhältnis an, um wieviel wahrscheinlicher es ist, dass Personen mit der Krankheit positiv getestet werden, als Personen, bei denen die betroffene Krankheit nicht vorliegt, also das Verhältnis der richtig-positiv- zur falsch-positiv-Rate.

Der Vorstand der ISPJE empfiehlt seinen Mitgliedern dringend, darauf hinzuwirken, dass in den Artikeln, die in den von ihnen herausgegebenen Fachzeitschriften publiziert werden, Punkt- und Intervallschätzungen verwendet werden. Nur so gibt es einen sich selbst korrigierenden Prozess, der neues Wissen entstehen lässt. Negativen Ergebnissen kommt in diesem System eine Art Kontrollfunktion zu.

Wie im Fall der STAP-Zellen. Sie verhindern, dass sich unwahre Behauptungen etablieren und zu Fakten werden. Wettstreit um die wissenschaftliche Wahrheit. Silas Boye Nissen, der am Niels-Bohr-Institut in Kopenhagen arbeitet, hat ein Modell entwickelt, das die Bedeutung von negativen Ergebnissen für diesen Prozess beschreibt. Dann müssen erstmal ein paar Artikel erscheinen, die das echte negative Ergebnis enthalten.

Sie können den Glauben an das positive Ergebnis herabsetzen, bis der unter einen bestimmten Grenzwert sinkt und es niemand mehr für wahr hält. Die Mittellinie markiert eine Grenze. Bleibt der Ball am Ende des Spiels auf der einen Seite liegen, ist das Ergebnis tatsächlich wahr, landet er auf der anderen Seite, ist es falsch. Beide Mannschaften sollten in diesem Spiel in annähernd gleicher Mannschaftsstärke antreten, nur dann ist es fair.

Mindest-Anteil negativer Ergebnisse sollte publiziert werden. Deswegen fordern wir Herausgeber und Gutachter und die Autoren der Paper auf, solche Debatten aufrecht zu erhalten. Oder um im Bild zu bleiben, den Ball etwas länger im Spiel zu lassen. Es wäre also gar nicht nötig, alle negativen Ergebnisse zu veröffentlichen, sagt Silas Boye Nissen, denn das würde die wissenschaftliche Literatur stark verändern und deutlich weniger attraktiv machen.

Auch Daniele Fanelli hält eine solche Veröffentlichungspraxis für den falschen Ansatz. Stattdessen ist die wahrscheinlich frustrierende Antwort, dass es schlicht darauf ankommt. In der Klinischen Forschung zum Beispiel ist es ohne Frage ein Problem, wenn es eine Publikationsverzerrung gibt. Wenn nicht alle Ergebnisse veröffentlicht werden, weil finanzielle Interessen dahinterstecken, ist das ein Grund zur Sorge.

Hier ist das Problem also gut verstanden und unbestritten. Alles veröffentlichen führt zu Informations-Overkill. Schon länger gibt es Datenbanken, in die klinische Studien vorab eingetragen werden müssen. So lassen sich die Ergebnisse später nachvollziehen. In der Biologie oder Physik dagegen setzt Daniele Fanelli auf weniger formale Vorgaben.

Sie sind die Experten. Und sie besitzen die Intuition, um zu entscheiden, ob ein Ergebnis etwas ist, was den Fachkollegen mitgeteilt werden sollte oder nicht. Denn es gibt nicht nur einen Nutzen, wenn negative Ergebnisse veröffentlicht werden, sondern auch Kosten. Denn wenn in meinem Büro so viele Ergebnisse herumliegen, egal ob in einer Schublade oder nicht, übersehe ich die wirklich informativen Studien.

Es muss also für das jeweilige Forschungsgebiet eine Abwägung getroffen werden, welche Art von Nullergebnissen besser nicht veröffentlicht wird. Dadurch verlieren wir sicher Information, aber wir gewinnen mehr Ordnung und haben weniger Rauschen in der Literatur. Eigene Fachzeitschriften für Null-Resultate? Ob es nicht doch von Vorteil wäre, sämtliche Ergebnisse zu veröffentlichen, ist in der sogenannten Meta-Wissenschaft Gegenstand einiger Diskussionen.

Einigkeit herrscht dagegen darüber, dass auch Negativergebnisse die Qualitätsstandards erfüllen müssen. Wie aber lässt sich erreichen, dass eine ausreichende Menge derartiger Negativergebnisse bekannt wird? Eine Idee, die immer wieder auftaucht, sind eigene Fachzeitschriften für Nullresultate. Doch das Konzept ging bisher nicht auf, und die meisten derartigen Journale verschwanden innerhalb weniger Jahre wieder aus den Regalen.

Devang Mehta:. Das wäre nicht gut für meine Karriere. Niemand will, dass in seinem Lebenslauf eine Liste von Artikeln steht, die in einem solchen Journal erschienen sind. Und ich glaube, das erklärt ganz gut, warum solche Zeitschriften keinen Erfolg haben. Ich halte es für wichtiger, die Herausgeber der aktuell führenden Journale davon zu überzeugen, dass negative Ergebnisse in der Forschung einfach dauernd vorkommen und dass es wichtig ist, dass sie sie in ihren Zeitschriften veröffentlichen.

Alternative Kostenmodelle für mehr Publikationsfreiheit. Wie bei dem Journal, in dem Stephen Curry sein Negativergebnis veröffentlicht hat. Deren redaktionelles Modell ist es, Fachartikel anzunehmen, die neue und originelle Erkenntnisse enthalten. Die Gutachter bewerten nicht den wissenschaftlichen Einfluss, der ja bei negativen Ergebnissen, auch wenn sie wichtig sind, ganz klar geringer ist als bei positiven Ergebnissen, die etwas Neues zeigen.

Thieme E-Journals: physioscience / Full Text

Bei diesem Modell bezahlen nicht die Leser, die das Journal abonnieren oder einen einzelnen Artikel kaufen wollen. Ein Flop, der für andere Wissenschaftler wertvoll sein könnte. Diese Enzyme sind manchmal gute Angriffspunkte für antivirale Medikamente. Deshalb dachten wir, dass das auch beim Norovirus funktionieren kann. Aber dafür muss man auch verstehen, wie diese Protease mit anderen Molekülen zusammenwirkt.

Nur so kann man eine Substanz designen, die diese Verbindung stören kann. Eine Speicherung Ihrer IP-Adresse findet nicht statt. Link zu erzeugen. Falls Ihr Rechner sich im Netzwerk einer bei uns registrierten Einrichtung befindet und der Zeitschriftentitel des gewählten Artikel-Nachweises durch die EZB erfasst ist, bekommen Sie einen Link angeboten, der Sie zum entsprechenden Eintrag leitet.

Dort bekommen Sie weitere Hinweise zur Verfügbarkeit. Die Anzeige der Links ist abhängig vom Dokumenttyp: Zeitschriftenartikel sind, sofern verfügbar, mit einem Link auf den passenden Eintrag des Zeitschriftentitels in der Zeitschriftendatenbank ZDB der Staatsbibliothek Berlin versehen. Dort kann man sich über die Einrichtungen informieren, die die jeweilige Zeitschrift lizensiert haben.

Der Link auf das Bestellformular von Subito überträgt die Daten direkt in das Bestellformular. Die Bestellung einer Artikelkopie setzt ein Konto dort voraus. Die Bestellung ist kostenpflichtig. Publikationen in Buchform erzeugen einen Link auf die ISBN-Suchseite der Wikipedia. Von dort aus haben Sie die Möglichkeit die Verfügbarkeit in einer Vielzahl von Katalogen zu prüfen.

Markieren Sie in der Trefferlisteliste die Einträge, deren Nachweise Sie exportieren wollen. Wollen Sie die gewählten Nachweise direkt in Ihre Literaturverwaltung importieren, so wählen Sie das entsprechende System aus und drücken den Schalter "exportieren". Die weiteren Schritte sind abhängig von der installierten Software. Eine detaillierte Beschreibung finden Sie, zusammen mit den einzelnen Formatbeschreibungen auf unserer Hilfeseite.

Alle Formate können zusätzlich auch als Datei an eine beliebige E-Mailadresse versendet werden. Man braucht kein Wissenschaftstheoretiker zu sein, um zu sehen, dass Publikationsbias ein Problem ist, aber zumindest US Amerikanische Sozialpsychologen haben sich eingeredet, dass die Selektion von signifikanten Ergebnissen kein Problem ist.

Replicability-Index

Bem , S. Ironischerweise kann die öffentliche Reaktion von einigen Sozialpsychologen auf die Ergebnisse des Replikationsprojekts gut mit psychologischen Theorien der Verdrängung erklärt werden siehe Abbildung 1. Die unangenehme Wahrheit, dass die Glaubwürdigkeit vieler Befunde in Frage steht scheint zu bedrohlich zu sein, um offen damit umzugehen. Dies ist jedoch notwendig, damit die nächste Generation von Sozialpsychologen nicht die Fehler ihrer Doktorväter und Doktormütter wiederholt.

In einer Reihe von Fallstudien zeigen wir die Fehler in Argumenten von Sozialpsychologen auf, die Selektionsbias offenbar nicht wahrhaben wollen. Ihr Hauptargument ist, dass es nicht klar ist wie viele erfolgreiche Replikationen man hätte erwarten können. Und in diesem Fall stimmt die tatsächliche Erfolgsrate mit der erwarteten Erfolgsrate perfekt überein; ein hundert prozentiger Erfolg.

Das wäre doch noch besser. Es ist ja eine alte Weisheit, dass niedrige Erwartungen das Glück erhöhen. Es macht daher Sinn für das Wohlbefinden der Sozialpsycholgen die Erwartungen herunterzuschrauben. Jedoch ist diese niedrige Erwartung nicht mit der nahezu perfekten Erfolgsquote in den Zeitschriften vereinbar. Alison Ledgerwood ignoriert die Diskrepanz zwischen der öffentlichen Erfolgsrate und der impliziten wahren Erfolgsrate in sozialpsychologischen Laboren.

Ledgerwood behauptet weiterhin, dass die Replikationsstudien niedrige Power hatten und man daher keine hohe Erfolgsquote erwarten könnte. Es bleibt daher unklar, wie die Originalstudien mit weniger Power eine wesentlich höhere Erfolgsquote erreichen konnten. In einem Kommentar in der New York Times schrieb Lisa Feldmann Barrett, dass es normal sei, wenn eine Replikationsstudie einen originalen Befund nicht repliziert.

Die Ergebnisse des Replikationsprojekts zeigen daher nur, dass die Sozialpsychologie die Glaubwürdigkeit ihrer Ergebnisse prüft und Fehler korrigiert. Dieses Argument ignoriert die Tatsache, dass selektives Publizieren von signifikanten Ergebnissen die Fehlerrate erhöht. In Statistikkursen wird gelehrt, dass Forscher Studien so planen sollen, dass mit einer 80 prozentigen Wahrscheinlichkeit ein signifikanten Effekt beobachtet wird, wenn die Alternativhypothese gilt.

Gleichzeitig heben sie hervor, dass es möglich ist, eine Metaanalyse der Originalstudien und der Replikationsstudien durchzuführen. Die Replikationsstudien haben keinen Selektionsbias da sie durchgeführt wurden um die Replizierbarkeit von Originalstudien in der Psychologie zu untersuchen. Daher kann die Replikationsrate der Replikationsstudien direkt zur Schätzung der Replizierbarkeit interpretiert werden.

Fallstudie 4: Die Ergebnisse des Replikationsprojekts zeigen nicht das Sozialpsychologie nicht vertrauenswürdig ist Offizielle Stellungnahme der DGPs. Offenbar in Reaktion auf kritische Artikel in den Medien sahen sich die DGPs Vorstandsmitglieder veranlasst eine offizielle Stellungnahme zu veröffentlichen. Diese Stellungnahme wurde von einigen Mitgliedern der DGPs kritisiert, was zu einer öffentlichen, moderierten Diskussion führte.

Dies wird auch von den Autorinnen und Autoren des SCIENCE Artikels betont. Es ist in der Tat wichtig zwischen zwei Interpretationen einer Replikationsstudie mit einem nicht-signifikanten Ergebnisse zu unterscheiden. Eine Interpretation ist, dass die Replikationsstudie zeigt, dass ein Effekt nicht existiert. Eine andere Interpretation ist, dass die Replikationsstudie zeigt, dass die Originalstudie keine oder nicht genug Evidenz für einen Effekt bietet, selbst wenn dieser Effekt existiert.

Diese Interpretation ist falsch, da es unmöglich ist zu zeigen, dass ein Effekt nicht existiert. Beispielsweise ist der Stichprobenfehler für den Vergleich von zwei Mittelwerten mit Probanden. Dies bedeutet jedoch nicht, dass die Ergebnisse in Originalstudien glaubwürdig oder vertrauenswürdig sind. Da viele Ergebnisse nicht repliziert wurden, bleibt unklar ob diese Effekte existieren.

Fallstudie 5: Die Reduktion der Erfolgsquote ist ein normales statistisches Phänomen Klaus Fiedler. Im Diskussionsforum der DGPs bot Klaus Fiedler eine weitere Erklärung für die niedrige Replikationsrate. Klaus Fiedler behauptet, dass dies kein empirisches Phänomen sei, sondern nur ein bekanntes statistisches Phänomen der Regression zur Mitte wiederspiegelt On a-priori-grounds, to the extent that the reliability of the original results is less than perfect, it can be expected that replication studies regress toward weaker effect sizes.

This is very common knowledge. The only necessary and sufficient condition for regression to the mean or toward less pronounced values is a correlation less than zero [Fiedler probably meant to write less than one]. This was nicely explained and proven by Furby Wir waren überrascht zu lesen, dass Regression zur Mitte auch ohne Selektion auftreten kann.

Dies würde bedeuten, dass wir bspw. Wir haben Klaus Fiedlers Quelle nachgelesen und fanden, dass Furbys Beispiel und Beweis explizit eine Selektion voraussetzte Furby, , S. Furby zeigt also genau das Gegenteil von dem, was Hr. Fiedler als Beleg für die Erklärung der Ergebnisse alleine durch die Regression zur Mitte heranzog. Halten wir uns zunächst an die Definition der Regression zur Mitte nach bspw.

Shepard und Finison aber siehe auch Maraun, für eine umfassende Darstellung. Siehe hierzu Shepard und Finison , S. Fiedler schrieb? Die Aussagenlogik lehrt uns die folgenden Definitionen:. Falls r nicht kleiner als 1 ist, tritt die Regression zur Mitte nicht auf. Diese Aussage ist wahr, wie man anhand der Formel oben sehen kann. Falls r kleiner als 1 ist, tritt die Regression zur Mitte auf.

Diese Aussage ist falsch wie man wiederum an der Formel oben sehen kann. Fiedlers Regressionsargument ist daher in perfekter Übereinstimmung mit unserer Erklärung der niedrigen Erfolgsquote im Replikationsprojekt. Die hohe Erfolgsquote in den Originalstudien beruht auf einer Selektion signifikanter Ergebnisse, welche mit Hilfe von Zufallsfehler signifikant wurden.

Erstaunlich und beunruhigend ist nur wie stark der Selektionseffekt und wie niedrig die wahre Erfolgsquote in der Sozialpsychologie ist. Gilbert et al. Das erste Argument ist, dass die Autoren die Daten falsch ausgewertet haben. Dies Argument ist aus zwei Gründen nicht stichhaltig. Erstens vermeiden es Gilbert et al.