Prinzipien der Epidemiologie

  • Schritt 2. Subtrahieren Sie das Minimum vom Maximalwert. Bereich = 31–15 = 16 Tage
  • Für ein epidemiologisches oder Laienpublikum könnten Sie berichten, dass „die Inkubationszeiten zwischen 15 und 31 Tagen lagen“. Statistisch gesehen beträgt dieser Bereich 16 Tage.

    Perzentile

    Perzentile teilen die Daten in einer Verteilung in 100 gleiche Teile. Das P-te Perzentil (P im Bereich von 0 bis 100) ist der Wert, bei dem P Prozent der Beobachtungen darauf oder darunter fallen. Mit anderen Worten, das 90. Perzentil enthält 90% der Beobachtungen. Der Median, der halbe Punkt der Verteilung, ist das 50. Perzentil. Der Maximalwert ist das 100. Perzentil, da alle Werte auf oder unter das Maximum fallen.

    Quartile

    Manchmal gruppieren Epidemiologen Daten in vier gleiche Teile oder Quartile. Jedes Quartil enthält 25% der Daten. Der Grenzwert für das erste Quartil ist das 25. Perzentil. Der Grenzwert für das zweite Quartil ist das 50. Perzentil, das der Median ist. Der Grenzwert für das dritte Quartil ist das 75. Perzentil. Und der Grenzwert für das vierte Quartil ist das 100. Perzentil, was das Maximum ist.

    Interquartilbereich

    Der Interquartilbereich ist ein Maß für die Streuung, das am häufigsten mit dem Median verwendet wird. Es stellt den zentralen Teil der Verteilung dar, vom 25. bis zum 75. Perzentil. Mit anderen Worten umfasst der Interquartilbereich das zweite und dritte Quartil einer Verteilung. Der Interquartilbereich umfasst somit ungefähr die Hälfte der Beobachtungen in der Menge, wobei ein Viertel der Beobachtungen auf jeder Seite verbleibt.

    Methode zur Bestimmung des Interquartilbereichs

    1. Schritt 1. Ordnen Sie die Beobachtungen in aufsteigender Reihenfolge an.
    2. Schritt 2. Finden Sie die Position des 1. und 3. Quartils mit den folgenden Formeln. Teilen Sie die Summe durch die Anzahl der Beobachtungen. Position des 1. Quartils (Q1) = 25. Perzentil = (n + 1) ⁄ 4
      Position des 3. Quartils (Q3) = 75. Perzentil = 3 (n + 1) ⁄ 4 = 3 × Q1
    3. Schritt 3. Identifizieren Sie den Wert des 1. und 3. Quartils.
      1. Wenn ein Quartil auf einer Beobachtung liegt (d. H. Wenn seine Position eine ganze Zahl ist), ist der Wert des Quartils der Wert dieser Beobachtung. Wenn beispielsweise die Position eines Quartils 20 beträgt, ist sein Wert der Wert der 20. Beobachtung.
      2. Wenn ein Quartil zwischen Beobachtungen liegt, ist der Wert des Quartils der Wert der unteren Beobachtung plus dem angegebenen Bruchteil der Differenz zwischen den Beobachtungen. Wenn beispielsweise die Position eines Quartils 20¼ beträgt, liegt es zwischen der 20. und 21. Beobachtung, und sein Wert ist der Wert der 20. Beobachtung plus ¼ der Differenz zwischen dem Wert der 20. und 21. Beobachtung.
    4. Schritt 4. Epidemiologisch die Werte bei Q1 und Q3 angeben. Berechnen Sie statistisch den Interquartilbereich als Q3 minus Q1.

    Abbildung 2.7 Die mittlere Hälfte der Beobachtungen in einer Häufigkeitsverteilung liegt im Interquartilbereich

    Bildbeschreibung

    BEISPIEL: Ermitteln des Interquartilbereichs

    Den Interquartilbereich für die Daten zur Aufenthaltsdauer finden Sie in Tabelle 2.8.

    1. Schritt 1. Ordnen Sie die Beobachtungen in aufsteigender Reihenfolge an.
       0, 2, 3, 4, 5, 5, 6, 7, 8, 9, 9, 9, 10, 10, 10, 10, 10, 11, 12, 12, 12, 13, 14, 16, 18, 18, 19, 22, 27, 49 
    2. Schritt 2. Finden Sie die Position des 1. und 3. Quartils. Beachten Sie, dass die Verteilung 30 Beobachtungen enthält. Position von Q1 = (n + 1) ⁄ 4 = (30 + 1) ⁄ 4 = 7,75 Position von Q3 = 3 (n + 1) ⁄ 4 = 3 (30 + 1) ⁄ 4 = 23,25 Somit liegt Q1 ¾ von Der Weg zwischen der 7. und 8. Beobachtung und Q3 liegt ¼ des Weges zwischen der 23. und 24. Beobachtung.
    3. Schritt 3. Identifizieren Sie den Wert des 1. und 3. Quartils (Q1 und Q3). Wert von Q1: Die Position von Q1 ist 7¾; Daher ist der Wert von Q1 gleich dem Wert der 7. Beobachtung plus ¾ der Differenz zwischen den Werten der 7. und 8. Beobachtung: Wert der 7. Beobachtung: 6
      Wert der 8. Beobachtung: 7 Q1 = 6 + ¾ (7−6) = 6 + ¾ (1) = 6,75 Wert von Q3: Die Position von Q3 betrug 23¼; Somit ist der Wert von Q3 gleich dem Wert der 23. Beobachtung plus ¼ der Differenz zwischen dem Wert der 23. und 24. Beobachtung: Wert der 23. Beobachtung: 14
      Wert der 24. Beobachtung: 16 Q3 = 14 + ¼ (16-14) = 14 + ¼ (2) = 14 + (2 ⁄ 4) = 14,5
    4. Schritt 4: Berechnen Sie den Interquartilbereich als Q3 minus Q1. Q3 = 14,5
      Q1 = 6,75
      Interquartilbereich = 14,5 - 6,75 = 7,75

    Wie oben angegeben, beträgt der Median für die Daten zur Aufenthaltsdauer 10. Beachten Sie, dass der Abstand zwischen Q1 und dem Median 10 - 6,75 = 3,25 beträgt. Der Abstand zwischen Q3 und dem Median beträgt 14,5 - 10 = 4,5. Dies zeigt an, dass die Daten zur Aufenthaltsdauer leicht nach rechts verschoben sind (zu den längeren Aufenthaltsdauern).

    Epi Info Demonstration: Ermitteln des Interquartilbereichs

    Frage:

    Was ist im Datensatz SMOKE der Interquartilbereich für das Gewicht der Teilnehmer?

    Antwort: In Epi Info: Wählen Sie Daten analysieren. Wählen Sie Lesen (Importieren). Der Standarddatensatz sollte Sample.mdb sein. Scrollen Sie unter Ansichten nach unten, um SMOKE anzuzeigen, und doppelklicken Sie oder klicken Sie einmal und dann auf OK. Klicken Sie auf Auswählen. Dann tippen Sie ein Gewicht <770oder wählen Sie das Gewicht aus den verfügbaren Werten aus, geben Sie <770 ein und klicken Sie auf OK. Wählen Sie Mittel. Klicken Sie dann auf den Abwärtspfeil unter Mittel von, scrollen Sie nach unten und wählen Sie GEWICHT aus. Klicken Sie dann auf OK. Scrollen Sie zum Ende der Ausgabe, um das erste Quartil (25% = 130) und das dritte Quartil (75% = 180) zu finden. Der Interquartilbereich reicht also von 130 bis 180 Pfund für einen Bereich von 50 Pfund. Du bist dran:

    Was ist der Interquartil-Höhenbereich der Studienteilnehmer? [Antwort: 506 bis 777]

    Eigenschaften und Verwendungen des Interquartilbereichs

    • Der Interquartilbereich wird im Allgemeinen in Verbindung mit dem Median verwendet. Zusammen sind sie nützlich, um den zentralen Ort und die Ausbreitung einer Häufigkeitsverteilung zu charakterisieren, insbesondere aber solche, die schief sind.
    • Für eine vollständigere Charakterisierung einer Häufigkeitsverteilung werden manchmal das 1. und 3. Quartil mit dem Minimalwert, dem Median und dem Maximalwert verwendet, um eine fünfstellige Zusammenfassung der Verteilung zu erstellen. Die fünfstellige Zusammenfassung für die Daten zur Aufenthaltsdauer lautet beispielsweise:
      Minimalwert = 0,
      Q1 = 6,75,
      Median = 10,
      Q3 = 14,5 und
      Maximalwert = 49.
    • Zusammen bieten die fünf Werte eine gute Beschreibung des Zentrums, der Ausbreitung und der Form einer Verteilung. Diese fünf Werte können verwendet werden, um eine grafische Darstellung der Daten zu zeichnen, wie im Boxplot in Abbildung 2.8.

    Abbildung 2.8 Interquartilbereich aus kumulativen Frequenzen

    Bildbeschreibung

    Einige statistische Analyse-Softwareprogramme wie Epi Info erzeugen Häufigkeitsverteilungen mit drei Ausgabespalten: Anzahl oder Anzahl der Beobachtungen für jeden Wert der Verteilung, Prozentsatz der Beobachtungen für diesen Wert und kumulierter Prozentsatz. Der kumulative Prozentsatz, der den Prozentsatz der Beobachtungen bei oder unter diesem Wert darstellt, gibt Ihnen das Perzentil an (siehe Tabelle 2.10).

    Tabelle 2.10 Häufigkeitsverteilung der Dauer des Krankenhausaufenthalts, Probendaten, Projekt zur Qualitätsverbesserung des Northeast Consortium Vancomycin

    Aufenthaltsdauer (Tage) Frequenz Prozent kumulativer Prozentsatz
    0 1 3.3 3.3
    2 1 3.3 6.7
    3 1 3.3 10.0
    4 1 3.3 13.3
    5 2 6.7 20.0
    6 1 3.3 23.3
    7 1 3.3 26.7
    8 1 3.3 30.0
    9 3 10.0 40.0
    10 5 16.7 56.7
    11 1 3.3 60.0
    12 3 10.0 70.0
    13 1 3.3 73.3
    14 1 3.3 76.7
    16 1 3.3 80.0
    18 2 6.7 86.7
    19 1 3.3 90.0
    22 1 3.3 93.3
    27 1 3.3 96.7
    49 1 3.3 100.0
    Gesamt 30 100.0

    Eine Abkürzung zur manuellen Berechnung von Q1, Median und Q3 besteht darin, die tabellarische Ausgabe dieser Softwareprogramme zu betrachten und zu notieren, welche Werte 25%, 50% bzw. 75% der Daten enthalten. Diese Verknüpfungsmethode liefert geringfügig andere Ergebnisse als die von Hand berechneten, aber normalerweise sind die Unterschiede gering.

    Übung 2.8

    Bestimmen Sie das erste und dritte Quartil und den Interquartilbereich für dieselben Impfdaten wie in den vorherigen Übungen.

    2, 0, 3, 1, 0, 1, 2, 2, 4, 8, 1, 3, 3, 12, 1, 6, 2, 5, 1

    Überprüfe deine Antwort.

    Standardabweichung

    Definition der Standardabweichung

    Die Standardabweichung ist das Maß für die Streuung, das am häufigsten mit dem arithmetischen Mittel verwendet wird. Zuvor wurde die Zentrierungseigenschaft des Mittelwerts beschrieben - das Subtrahieren des Mittelwerts von jeder Beobachtung und das anschließende Summieren der Differenzen addiert sich zu 0. Dieses Konzept des Subtrahierens des Mittelwerts von jeder Beobachtung ist die Grundlage für die Standardabweichung. Die Differenz zwischen dem Mittelwert und jeder Beobachtung wird jedoch quadriert, um negative Zahlen zu eliminieren. Dann wird der Durchschnitt berechnet und die Quadratwurzel gezogen, um zu den ursprünglichen Einheiten zurückzukehren.

    xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

    Methode zur Berechnung der Standardabweichung

    So berechnen Sie die Standardabweichung von einem Datensatz im Analysemodul:

    Klicken Sie im Ordner Statistik auf den Befehl Mittel

    Wählen Sie im Dropdown-Feld Mittelwerte die gewünschte Variable aus
    → Variable auswählen

    OK klicken
    → Sie sollten die Liste der Frequenz anhand der von Ihnen ausgewählten Variablen sehen. Scrollen Sie nach unten, bis Sie die Standardabweichung (Std Dev) und andere Daten sehen.

    1. Schritt 1. Berechnen Sie das arithmetische Mittel.
    2. Schritt 2. Subtrahieren Sie den Mittelwert von jeder Beobachtung. Quadrieren Sie den Unterschied.
    3. Schritt 3.Summiere die quadratischen Differenzen.
    4. Schritt 4. Teilen Sie die Summe der quadratischen Differenzen durch n - 1.
    5. Schritt 5. Nehmen Sie die Quadratwurzel des in Schritt 4 erhaltenen Wertes. Das Ergebnis ist die Standardabweichung.

    Eigenschaften und Verwendung der Standardabweichung

    • Der numerische Wert der Standardabweichung ist nicht einfach und nicht statistisch zu interpretieren. Ähnlich wie bei anderen Ausbreitungsmaßen gibt die Standardabweichung an, wie weit oder eng die Beobachtungen vom Zentrum aus verteilt sind. Im vorherigen Beispiel betrug die mittlere Inkubationszeit 25 Tage mit einer Standardabweichung von 6,6 Tagen. Wenn die Standardabweichung bei einem zweiten Ausbruch 3,7 Tage betragen hätte (bei derselben mittleren Inkubationszeit von 25 Tagen), könnte man sagen, dass die Inkubationszeiten beim zweiten Ausbruch weniger variabel waren als die Inkubationszeiten beim ersten Ausbruch.
    • Die Standardabweichung wird normalerweise nur berechnet, wenn die Daten mehr oder weniger "normalverteilt" sind, d. H. Die Daten fallen in eine typische glockenförmige Kurve. Für normalverteilte Daten ist das arithmetische Mittel das empfohlene Maß für die zentrale Position und die Standardabweichung das empfohlene Maß für die Streuung. Tatsächlich sollten Mittelwerte niemals ohne die damit verbundene Standardabweichung gemeldet werden.

    BEISPIEL: Berechnung der Standardabweichung

    Ermitteln Sie den Mittelwert der folgenden Inkubationszeiten für Hepatitis A: 27, 31, 15, 30 und 22 Tage.

    1. Schritt 1. Berechnen Sie das arithmetische Mittel. Mittelwert = (27 + 31 + 15 + 30 + 22) ≤ 5 = 125 ≤ 5 = 25,0
    2. Schritt 2. Subtrahieren Sie den Mittelwert von jeder Beobachtung. Quadrieren Sie den Unterschied.
      Wert abzüglich Mittelwert Unterschied Unterschied im Quadrat
      27 − 25.0 + 2.0 4.0
      31 − 225.0 + 6.0 36.0
      15 − 225.0 −10.0 100.0
      30 − 225.0 + 5.0 25.0
      22 − 225.0 − 3.0 9.0
    3. Schritt 3. Summieren Sie die quadratischen Differenzen. Summe = 4 + 36 + 100 + 25 + 9 = 174
    4. Schritt 4: Teilen Sie die Summe der quadratischen Differenzen durch (n - 1). Dies ist die Varianz. Varianz = 174 ⁄ (5 - 1) = 174 ⁄ 4 = 43,5 Tage im Quadrat
    5. Schritt 5: Nehmen Sie die Quadratwurzel der Varianz. Das Ergebnis ist die Standardabweichung. Standardabweichung = Quadratwurzel von 43,5 = 6,6 Tagen

    Betrachten Sie die in Abbildung 2.9 dargestellte Normalkurve. Der Mittelwert liegt in der Mitte, und die Daten sind auf beiden Seiten dieses Mittelwerts gleichmäßig verteilt. Die Punkte, die ± 1, 2 und 3 Standardabweichungen anzeigen, sind auf der x-Achse markiert. Bei normalverteilten Daten liegen ungefähr zwei Drittel (um genau zu sein 68,3%) der Daten innerhalb einer Standardabweichung von beiden Seiten des Mittelwerts; 95,5% der Daten liegen innerhalb von zwei Standardabweichungen vom Mittelwert; und 99,7% der Daten liegen innerhalb von drei Standardabweichungen. Genau 95,0% der Daten liegen innerhalb von 1,96 Standardabweichungen vom Mittelwert.

    Abbildung 2.9 Fläche unter normaler Kurve innerhalb von 1, 2 und 3 Standardabweichungen

    Bildbeschreibung

    Übung 2.9

    Berechnen Sie die Standardabweichung für denselben Impfdatensatz.

    2, 0, 3, 1, 0, 1, 2, 2, 4, 8, 1, 3, 3, 12, 1, 6, 2, 5, 1

    Überprüfe deine Antwort.

    Standardfehler des Mittelwerts

    Definition des Standardfehlers

    Die Standardabweichung wird manchmal mit einem anderen Maß mit einem ähnlichen Namen verwechselt - dem Standardfehler des Mittelwerts. Die beiden sind jedoch nicht gleich. Die Standardabweichung beschreibt die Variabilität in einem Datensatz. Der Standardfehler des Mittelwerts bezieht sich auf die Variabilität, die wir bei den arithmetischen Mitteln wiederholter Stichproben aus derselben Population erwarten können.

    Der Standardfehler geht davon aus, dass die Daten, die Sie haben, tatsächlich eine Stichprobe aus einer größeren Population sind. Unter der Annahme, dass Ihre Stichprobe nur eine von unendlich vielen möglichen Stichproben ist, die aus der Quellpopulation entnommen werden könnten. Somit ist der Mittelwert für Ihre Stichprobe nur einer von unendlich vielen anderen Stichprobenmitteln. Der Standardfehler quantifiziert die Variation dieser Stichprobenmittel.

    Methode zur Berechnung des Standardfehlers des Mittelwerts

    1. Schritt 1. Berechnen Sie die Standardabweichung.
    2. Schritt 2. Teilen Sie die Standardabweichung durch die Quadratwurzel der Anzahl der Beobachtungen (n).

    Eigenschaften und Verwendung des Standardfehlers des Mittelwerts

    • Die primäre praktische Verwendung des Standardfehlers des Mittelwerts besteht in der Berechnung von Konfidenzintervallen um den arithmetischen Mittelwert. (Konfidenzintervalle werden im nächsten Abschnitt behandelt.)

    BEISPIEL: Ermitteln des Standardfehlers des Mittelwerts

    Finden Sie den Standardfehler des Mittelwerts für die Daten zur Verweildauer in Tabelle 2.10, vorausgesetzt, die Standardabweichung beträgt 9,1888.

    1. Schritt 1. Berechnen Sie die Standardabweichung. Standardabweichung (angegeben) = 9,188
    2. Schritt 2. Teilen Sie die Standardabweichung durch die Quadratwurzel von n. n = 30
      Standardfehler des Mittelwerts = 9,188 ⁄ √ 30 = 9,188 ⁄ 5,477 = 1,67

    Konfidenzgrenzen (Konfidenzintervall)

    Definition eines Konfidenzintervalls

    Oft führen Epidemiologen Studien durch, um nicht nur die Merkmale der untersuchten Probanden zu messen, sondern auch um Verallgemeinerungen über die größere Population vorzunehmen, aus der diese Probanden stammten. Dieser Vorgang wird als Inferenz bezeichnet. Zum Beispiel verwenden politische Meinungsforscher Stichproben von etwa 1.000 Personen aus dem ganzen Land, um Rückschlüsse darauf zu ziehen, welcher Präsidentschaftskandidat am Wahltag voraussichtlich gewinnen wird. Normalerweise enthält die Schlussfolgerung einige Überlegungen zur Genauigkeit der Messung. (Es kann berichtet werden, dass die Ergebnisse einer politischen Umfrage eine Fehlerquote von beispielsweise plus oder minus drei Punkten aufweisen.) In der Epidemiologie besteht ein üblicher Weg, die Genauigkeit einer Messung anzuzeigen, darin, ein Konfidenzintervall anzugeben. Ein enges Konfidenzintervall zeigt eine hohe Präzision an. Ein breites Konfidenzintervall zeigt eine geringe Genauigkeit an.

    Konfidenzintervalle werden für einige, aber nicht alle epidemiologischen Maßnahmen berechnet. Die beiden in dieser Lektion behandelten Kennzahlen, für die häufig Konfidenzintervalle angegeben werden, sind der Mittelwert und der geometrische Mittelwert. Konfidenzintervalle können auch für einige der in Lektion 3 behandelten epidemiologischen Maßnahmen berechnet werden, z. B. Anteil, Risikoverhältnis und Quotenverhältnis.

    Das Konfidenzintervall für einen Mittelwert basiert auf dem Mittelwert selbst und einem Vielfachen des Standardfehlers des Mittelwerts. Denken Sie daran, dass sich der Standardfehler des Mittelwerts auf die Variabilität der Mittelwerte bezieht, die aus wiederholten Stichproben derselben Population berechnet werden können. Glücklicherweise sind Mittel (insbesondere aus großen Stichproben) unabhängig von der Verteilung der Daten in der Regel normal verteilt. (Dies ist aus einem Argument, das als zentraler Grenzwertsatz bekannt ist). Wir können also Abbildung 2.9 verwenden, um zu zeigen, dass der Bereich vom Mittelwert minus einer Standardabweichung bis zum Mittelwert plus einer Standardabweichung 68,3% der Fläche unter der Kurve umfasst.

    Betrachten Sie eine bevölkerungsbasierte Stichprobenerhebung, bei der der mittlere Gesamtcholesterinspiegel erwachsener Frauen 206 betrug, mit einem Standardfehler des Mittelwerts von 3. Wenn diese Erhebung viele Male wiederholt würde, würden 68,3% der Mittelwerte voraussichtlich zwischen dem liegen Mittelwert minus 1 Standardfehler und Mittelwert plus 1 Standardfehler, dh zwischen 203 und 209. Man könnte sagen, dass die Ermittler zu 68,3% davon überzeugt sind, dass diese Grenzwerte den tatsächlichen Mittelwert der Bevölkerung enthalten.

    Im Bereich der öffentlichen Gesundheit möchten die Ermittler im Allgemeinen ein höheres Vertrauensniveau als dieses und legen das Vertrauensniveau normalerweise auf 95% fest. Obwohl die statistische Definition eines Konfidenzintervalls lautet, dass 95% der Konfidenzintervalle aus einer unendlichen Anzahl ähnlich durchgeführter Stichproben die wahren Populationswerte enthalten würden, hat diese Definition für eine einzelne Studie wenig Bedeutung. In der Regel interpretieren Epidemiologen ein 95% -Konfidenzintervall als Wertebereich, der mit den Daten aus ihrer Studie übereinstimmt.

    Methode zur Berechnung eines 95% -Konfidenzintervalls für einen Mittelwert

    1. Schritt 1. Berechnen Sie den Mittelwert und seinen Standardfehler.
    2. Schritt 2. Multiplizieren Sie den Standardfehler mit 1,96.
    3. Schritt 3. Untergrenze des 95% -Konfidenzintervalls = Mittelwert minus 1,96 × Standardfehler.
      Obergrenze des 95% -Konfidenzintervalls =
      Mittelwert plus 1,96 × Standardfehler.

    BEISPIEL: Berechnung eines 95% -Konfidenzintervalls für einen Mittelwert

    Finden Sie das 95% -Konfidenzintervall für einen mittleren Gesamtcholesterinspiegel von 206, Standardfehler des Mittelwerts von 3.

    1. Schritt 1. Berechnen Sie den Mittelwert und seinen Fehler. Mittelwert = 206, Standardfehler des Mittelwerts = 3 (beide angegeben)
    2. Schritt 2. Multiplizieren Sie den Standardfehler mit 1,96. 3 × 1,96 = 5,88
    3. Schritt 3. Untergrenze des 95% -Konfidenzintervalls = Mittelwert minus 1,96 × Standardfehler. 206 - 5,88 = 200,12
      Obergrenze des 95% -Konfidenzintervalls = Mittelwert plus 1,96 × Standardfehler.
      206 + 5.88 = 211.88

    Auf eine Dezimalstelle gerundet, beträgt das 95% -Konfidenzintervall 200,1 bis 211,9. Mit anderen Worten, die beste Schätzung dieser Studie für den wahren Bevölkerungsdurchschnitt liegt bei 206, stimmt jedoch mit Werten zwischen 200,1 und 211,9 überein. Somit gibt das Konfidenzintervall an, wie genau die Schätzung ist. (Dieses Konfidenzintervall ist eng, was darauf hinweist, dass der Stichprobenmittelwert von 206 ziemlich genau ist.) Es zeigt auch, wie sicher die Forscher sein sollten, Rückschlüsse aus der Stichprobe auf die gesamte Population zu ziehen.

    Eigenschaften und Verwendung von Konfidenzintervallen

    • Der Mittelwert ist nicht das einzige Maß, für das ein Konfidenzintervall berechnet werden kann oder sollte. Konfidenzintervalle werden üblicherweise auch für Anteile, Raten, Risikoverhältnisse, Quotenverhältnisse und andere epidemiologische Maßnahmen berechnet, wenn der Zweck darin besteht, Rückschlüsse aus einer Stichprobenerhebung oder -studie auf die größere Bevölkerung zu ziehen.
    • Die meisten epidemiologischen Studien werden nicht unter den idealen Bedingungen durchgeführt, die die Theorie hinter einem Konfidenzintervall erfordert. Infolgedessen verfolgen die meisten Epidemiologen bei der Interpretation eines Konfidenzintervalls eher einen vernünftigen Ansatz als einen strengen statistischen Ansatz, dh das Konfidenzintervall stellt den Wertebereich dar, der mit den Daten einer Studie übereinstimmt, und ist lediglich ein Leitfaden für die Variabilität in einer Studie.
    • Konfidenzintervalle für Mittelwerte, Proportionen, Risikoverhältnisse, Quotenverhältnisse und andere Kennzahlen werden nach unterschiedlichen Formeln berechnet. Die Formel für ein Konfidenzintervall des Mittelwerts wird ebenso akzeptiert wie die Formel für ein Konfidenzintervall für einen Anteil. Für Risikoverhältnisse und Quotenverhältnisse stehen jedoch verschiedene Formeln zur Verfügung. Da unterschiedliche Formeln manchmal zu unterschiedlichen Ergebnissen führen können, wird die Interpretation eines Konfidenzintervalls als Richtlinie und nicht als strenger Wertebereich unterstützt.
    • Unabhängig vom Maß ist die Interpretation eines Konfidenzintervalls dieselbe: Je enger das Intervall, desto genauer die Schätzung; und der Wertebereich im Intervall ist der Bereich der Populationswerte, der am besten mit den Daten aus der Studie übereinstimmt.

    Demonstration: Verwenden von Konfidenzintervallen

    Stellen Sie sich vor, Sie fahren nach Las Vegas, um auf den tatsächlichen mittleren Gesamtcholesterinspiegel bei erwachsenen Frauen in den USA zu setzen.

    Frage: Auf welche Zahl setzen Sie? Antwort: Auf 206, da dies die in der Stichprobe gefundene Nummer ist. Der Mittelwert, den Sie aus Ihrer Stichprobe berechnet haben, ist Ihre beste Schätzung des tatsächlichen Populationsmittelwerts. Frage: Wie hilft ein Konfidenzintervall? Antwort: Hier erfahren Sie, wie viel Sie setzen müssen! Wenn das Konfidenzintervall eng ist, ist Ihre Vermutung relativ genau und Sie fühlen sich möglicherweise wohler (sicherer), wenn Sie mehr wetten. Aber wenn das Konfidenzintervall groß ist, ist Ihre Vermutung relativ ungenau und Sie sollten weniger auf diese eine Zahl setzen oder vielleicht gar nicht wetten!

    Übung 2.10

    Wenn die Serumcholesterinspiegel von 4.462 Männern gemessen wurden, betrug der mittlere Cholesterinspiegel 213 mit einer Standardabweichung von 42. Berechnen Sie den Standardfehler des Mittelwerts für den Serumcholesterinspiegel der untersuchten Männer.

    Überprüfe deine Antwort.

    Vorherige Seite Lektion 2 Übersicht