In einer Studien- oder Bachelorarbeit haben Sie folgende Fragestellung bearbeitet:
Mit physiotherapeutischer Behandlung soll die Kraft im Armmuskel wiederhergestellt werden. Dazu wird bei bei der Eingangsvisite (Visite 0) die Hebekraft mit einer Federwaage gemessen; nach drei Wochen Behandlung wird bei Visite 1 die Kraft noch einmal gemessen. Die 20 Patienten sind randomisiert auf zwei Behandlungsgruppen verteilt, die mit den alternativen Methoden (treatment) a und b behandelt werden.
An diesem Beispiel wird gezeigt, wie Sie die Daten auswerten und das Ergebnis beschreiben können. Sie können die Methode analog in vielen anderen Studien verwenden, bei denen die Änderung eines Messwertes durch Behandlung ermittelt wird, und zwei Methoden oder Placebo/Verum zur Anwendung kommen.
Eine Anleitung zur Dateneingabe mit Excel finden Sie hier. Auf dem Arbeitsblatt mit den Daten haben Sie sicherlich viele Messwerte von anderen Muskeln oder von weiteren Visiten zusammegestellt; das ist sinnvoll, alle Primärdaten sollten auf einer Seite stehen. Zur Auswertung sollten Sie aber die Spalten, die Sie benötigen, auf eine eigene Seite kopieren; oder noch besser durch einen Link mit der Hauptseite verknüpfen.
Auf einem neuen Excel-Arbeitsblatt, dem Sie einen aussagekräftigen Namen geben (nicht Tabelle1), legen Sie Verknüpfungen zu folgenden Daten an. Beachten Sie dabei, dass die Überschriften auch verknüpft werden und dass diese in Zeile 1 stehen.
patid
: Patienten-IDtreatment
: a oder b; diese müssen nicht sortiert sein, sondern können in beliebiger Reihenfolge auftretenforce_0
: Die Kraft bei der Eingangsuntersuchungforce_1
: Die Kraft nach dem ersten Behandlungsabschnitforce_diff
: Die Differenz zwischen force_1 - force_0
; ein positiver Wert bedeutet also, dass sich die Hebekraft durch die Behandlung erhöht hat. Die Daten in dieser Spalte werden nicht von der Datenseite gelinkt, sondern mit einer Formel erzeugt, etwa = d1-c1
.Wandeln Sie jetzt den Datenbereich in eine echte Tabelle um; wählen Sie dazu die Daten an, und danach "als Tabelle formatieren" im Menü. Dieser Schritt ist nicht nötig, erspart Ihnen aber viel Ärger.
Gehen Sie jetzt mit dem Cursor auf die Überschrift treatment
und klicken Sie auf Sortieren/Von A bis Z sortieren; das funktioniert nur dann so einfach, wenn Sie den Bereich als echte Tabelle formatiert haben, wenn Sie das vergessen haben, müssen Sie sich noch einige weitere Fragen gefallen lassen, und können Fehler machen.
Jetzt sind alle Behandlungen a oben und alle b unten angeordnet, die Daten sollten also so aussehen.
Im blauen Rahmen sind die Daten, sortiert nach Behandlung, und in Spalte E die mit Formel erzeugte Differenz. Sie können das auch live auf Seite vn in der Exceldatei anschauen. Es kann sein, dass Ihre Tabelle andere Farben hat, das macht nichts, Farben können Sie bei der Umwandlung in eine Tabelle beliebig auswählen.
Bei dieser Studie waren 10 Patienten je Behandlungsgruppe geplant, aber einer der Gruppe b (P20) ist als ausgefallen simuliert, drum sind es insgesamt nur 19 Patienten.
Von allen Ihren Daten sollten Sie eine Grafik erstellen; Fehler erkennt man daran am leichtesten, und wichtige Grafiken können Sie in die Arbeit übernehmen - das schindet Seiten. Bei vorher-nachher Vergleichen ist ein Punktdiagramm (Scatterplot) sinnvoll. Auf der x-Achse tragen Sie dazu die Werte von Visite 0 (= vorher) auf, auf der y-Achse die Werte von Visite 1, und Farben verwenden Sie, um die beiden Gruppen zu unterscheiden. Das sieht im Ergebnis so aus:
Es ist nicht ganz einfach, die Graphik in Excel zu erzeugen, und leider verhält sich jeder Excel-Version etwas anders. Suchen Sie im Internet nach "scatterplot excel", oder verwenden Sie die Excel-Hilfe. Beachten Sie folgendes:
Aus diesem Plot kann man lesen:
Folgende Fragestellungen können Sie versuchen zu beantworten:
Sind Sie bei letzten Satz ausgestiegen? Vielleicht wird es bei der praktischen Durchführung klarer.
Die Fragestellungen 1. und 2. werden dabei jeweils innerhalb eines Patienten bestimmt ("within-patient"); die Kraft bei jedem Patienten wird zweimal gemessen. Dies bedeutet, dass Sie einen gepaarten Test verwenden. Bei der Fragestellung 3 werden zwar die vorher-nacher Differenzen innerhalb eines Patienten als Ausgangsmaterial verwendet, der eigentliche Vergleich wird aber zwischen verschiedenen Patienten vorgenommen ("between-patient"). Sie werden dazu also einen ungepaarten Test verwenden.
Reverend Bayes legt Einspruch ein, drum muss ich mich korrigieren:
Sie werden häufig lesen, dass das 95%-Vertrauensintervall ("confidence interval", CI) den Bereich angibt, in dem die Verbesserung mit 95% Wahrscheinlichkeit liegt. Diese Aussage stimmt leider nicht ganz, auch wenn sie so in vielen Büchern zu finden ist, und auch in der Microsoft-Dokumentation der hier verwendeten Funktionen. Bayessche Statistik erklärt die richtige Interpretation; der Bereich, in dem der Mittelwerte mit 95% Wahrscheinlichkeit liegt, ist das "credible interval" - eine deutsche Übersetzung hat sich nicht durchgesetzt. In der englischen Wikipedia gibt es eine Beschreibung des "credible interval", in der deutschen nicht.
Für randomisierte geplante Studien wie der hier beschriebenen ist die Aussage aber näherungsweise richtig:
Der der Mittelwert liegt mit 95% Wahrscheinlichkeit innerhalb der Vertrauensbereiches.
Welches ist die wichtigere Fragestellung? 1 und 2, oder 3? Für den einzelnen Patienten steht die Verbesserung bei sich selbst im Vordergrund. In der Medizin muss man solchen Verbesserungen misstrauen, sie könnten auch ein ein Placebo-Effekt sein, bedingt dadurch, dass sich überhaupt jemand um den Patienten kümmert. Vielleicht hätte auch eine Gesprächstherapie, ein Kaffeekränzchen oder die Behandlung des falschen Arms geholfen? Deshalb wird die Antwort auf die Frage 3 höher bewertet, weil der Placebo-Anteil in beiden Fällen ähnlich ist. In der Königsklasse der Studien würde man die eigentliche Behandlung noch verblinden - das geht aber beim physiotherapeutischen Interventionen nicht, ohne den Patienten und Physiotherapeuten einer Gehirnwäsche zu unterziehen.
Die Antworten auf Frage 3 sind wichtig, um vergleichende Aussagen über Behandlungen zu erzielen. Gönnen Sie also in Ihrer Arbeit der Antwort auf Frage 3 mehr Platz; meist ist der "primary Endpoint" einer Studie vom Typ Frage 3.
Später hinzugefügt: Falls Sie Ihre Daten in Excel haben, aber keine Lust, umständlich zu rechnen, können Sie es mit meiner Online-App versuchen. Sie berechnet und erstellt Graphiken von Vertrauensintervallen, und macht das Leben besonders dann etwas leichter, wenn Sie mehrere Behandlungsgruppen oder nicht-normalverteilte Daten haben.
Die App hat ein Manko, das aber ein diabolisches Feature ist: obwohl p-Werte leicht zu berechnen wären, werden diese nicht ausgegeben. Wenn also Ihr Boss oder Betreuer der Arbeit auf p-Werten besteht, muss er umdenken oder ein anderes Tool zur Verfügung stellen.
Wenn bei Ihnen in Excel die Schaltfläche Datenanalyse auf dem Reiter Daten auftaucht, oder wenn sie diese wie hier beschrieben aktiviert haben, können Sie die dort vorhandenen rudimentären Statistik-Funktionen verwenden.
Leider gucken Apple-Benutzer dabei in die Röhre, ich konnte die Statistikfunktionen dort bisher nicht finden. Die hier beschriebene Methode ist zunächst etwas umständlicher, eignet sich aber sehr gut, wenn Sie viele Tests durchführen wollen, weil das Schema leicht kopiert werden kann und nur die Daten geändert werden. Und gleichzeitig lernen Sie etwas über Pivot-Tabellen, die für Sie auch zur Erstellung von anderer Tabellen sehr nützlich sind.
Für die Beschreibung Ihrer Ergebnisse und für die Tests benötigen Sie Mittelwerte, Standardabweichungen und die Anzahl der Daten, getrennt für die beiden Behandlungsgruppen a und b.
Das hier verwendeten Bilder beziehen sich auf Excel 2013; auch ältere Versionen können Pivot-Tabellen erzeugen, eventuell sieht das aber etwas anders aus, und Sie müssen im Internet Nachhilfe suchen.
G1
.
Rechts erscheint jetzt die Auswahlliste PivotTable-Felder. Ziehen Sie mit der Maus treatment in das Feld Spalten, Werte in das Feld Zeilen, und _force0 in das Feld Werte unten rechts.
Wie diese Daten in die Arbeit übernommen werden, steht weiter unten. Jetzt kommt zunächst die Statistik dran; leider müssen wir uns dazu von Pivot-Tabelle verabschieden, und zur Handarbeit greifen.
Wie die Tests und die Konfidenzintervalle berechnet werden, wird an Hand von Abbildungen der Formeln gezeigt.
Je nach Einstellung Ihres Rechners müssen Sie anstelle des Kommas in den Formeln ein Semikolon verwenden.
Für die Breite des Konfidenzintervalls benötigen Sie:
force_diff
in der blauen und der roten Gruppe arbeitet. Dass ein ungepaarter Test verwendet wird, zeigt der letzte Parameter (2) in der Formel an; verwenden Sie nicht die 3, deren Beschreibung auf den ersten Blick zutreffender klingt. Hier ein Vorschlag, wie Sie dies in der Arbeit formulieren könnten. Einiges könnten Sie auch in der Tabelle lassen, aber manchmal ist ein ausformulierter Text einprägsamer. Schreiben Sie erst die Fakten, dann eine Interpretation. Sie dürfen in diesem Teil gerne Wiederholungen der Formulierungen bringen. Verzichten Sie in diesem Teil auf Wertungen, die kommen in der Diskussion, und dort sollten Sie etwas mehr literarische Ambitionen bei der Lesbarkeit entwickeln. Worte wie "leider", "glücklicherweise nicht" sollten Sie aber nirgendwo verwenden.
Punktediagramm der Kraft bei Visite 1 gegen die Kraft bei der Eingangsvisite (Visite 0). Die beiden Behandlungsgruppen werden durch Farben unterschieden. Je weiter ein Punkt von der Winkelhalbierenden entfernt ist, desto größer ist die Verbesserung durch die Behandlung.
xxx
bis yyy
kp, p = 0.054).Der letzte Satz sollte ihnen sauer aufstoßen; ich habe die Daten absichtlich so gewählt, dass dieses Ergebnis herauskommt. Wenn sich bei Methode a ein signifikanter Effekt ergibt, also eine von Null verschiedene Verbesserung, bei Methode aber b nicht, dann muss doch ein signifikanter Unterschied zwischen den Methoden bestehen. Nein! Bei den vorher/nachher Vergleichen testen wir nämlich gegen Null, und das ist eine feste Zahl ohne Schwankung. Bei Frage 3, dem Vergleich zwischen zwei Methoden, testen wir zwei mit Fehler behaftete Größen gegeneinander. Der Mittelwert von a könnte kleiner sein, der von b größer - wir wissen es nicht. Merksatz, mit dem Sie bei der nächsten Party angeben können: Der Unterschied zwischen signifikant und nicht signifikant ist nicht signifikant.
Vielleicht ist Ihnen auch xxx
und yyy
aufgefallen? Das war keine Vergesslichkeit, sondern meine Kapitulation vor Excel. Der p-Wert beim ungepaarten t-Test lässt sich mit Excel einfach berechnen, das Konfidenzintervall dagegen nicht. Ich wollte Ihnen die riesige Formel ersparen. Sie können die Spalten B und E in das die Zwischenablage legen, diese dann in mein Web-basiertes Programm einfügen und erhalten dann für xxx = -0.05
und yyy = 3.56
. Die Methode ist nicht perfekt, weil die Webseite den Wilcoxon-Test verwendet, die Excel-Methode dagegen den t-Test. Aber good enough for your professor.
Wenn Sie es bis hierhin geschafft haben, Gratulation. Trotzdem wette ich, dass Sie zu faul waren, Kommastellen auszublenden, und dass Sie Zahlen wie 3.141589383 auf dem Bildschirm sehen. Es geht doch auch so... Nein, Sie lernen nie, wie man Zahlen durch anschauen bewerten kann, wenn Sie den üblichen Salat vor sich haben.
Wer ohne dies zu lesen die Kommastellen von vorneherein ausgeblendet hat und das glaubhaft beschwört, bekommt von mir beim nächsten Meeting eine Tafel Quadratisch-Gut.