Prinzipien der Epidemiologie

Wie wählen Sie dann die am besten geeigneten Maßnahmen aus? Eine teilweise Antwort auf diese Frage besteht darin, das Maß für die zentrale Position auf der Grundlage der Verteilung der Daten auszuwählen und dann das entsprechende Maß für die Verbreitung zu verwenden. Tabelle 2.11 fasst die empfohlenen Maßnahmen zusammen.

Tabelle 2.11 Empfohlene Messungen der zentralen Position und Verbreitung nach Datentyp

Art der Verteilung Maß für die zentrale Lage Maß der Ausbreitung
Normal Arithmetisches Mittel Standardabweichung
Asymmetrisch oder schief Median Bereich oder Interquartilbereich
Exponentiell oder logarithmisch Geometrisches Mittel Geometrischer Standard

In der Statistik ist das arithmetische Mittel das am häufigsten verwendete Maß für die zentrale Lage und das Maß, auf dem die meisten statistischen Tests und Analysetechniken basieren. Die Standardabweichung ist das Maß für die Streuung, das am häufigsten mit dem Mittelwert verwendet wird. Wie bereits erwähnt, besteht ein Nachteil des Mittelwerts darin, dass er durch das Vorhandensein einer oder weniger Beobachtungen mit extrem hohen oder niedrigen Werten beeinflusst wird. Der Mittelwert wird in Richtung der Extremwerte „gezogen“. Sie können die Richtung bestimmen, in die die Daten verzerrt sind, indem Sie die Werte des Mittelwerts und des Medians vergleichen. Der Mittelwert wird vom Median in Richtung der Extremwerte weggezogen. Wenn der Mittelwert höher als der Median ist, wird die Datenverteilung nach rechts verschoben. Wenn der Mittelwert niedriger als der Median ist, wie auf der rechten Seite von Abbildung 2.10, wird die Verteilung nach links verschoben.

Der Vorteil des Medians besteht darin, dass er nicht durch einige extrem hohe oder niedrige Beobachtungen beeinflusst wird. Wenn daher ein Datensatz verzerrt ist, ist der Median repräsentativer für die Daten als der Mittelwert.Zu beschreibenden Zwecken und um die Annahme zu vermeiden, dass die Daten normal verteilt sind, geben viele Epidemiologen routinemäßig den Median für Inkubationszeiten, Krankheitsdauer und Alter der Probanden an.

In Verbindung mit dem Median können zwei Ausbreitungsmaße verwendet werden: der Bereich und der Interquartilbereich. Obwohl in vielen Statistikbüchern der Interquartilbereich als bevorzugtes Maß für die Ausbreitung empfohlen wird, verwenden die meisten praktizierenden Epidemiologen stattdessen den einfacheren Bereich.

Der Modus ist das am wenigsten nützliche Maß für die zentrale Position. Einige Datensätze haben keinen Modus. andere haben mehr als eine. Der häufigste Wert befindet sich möglicherweise nicht in der Nähe des Verteilungszentrums. Modi können im Allgemeinen nicht für aufwendigere statistische Berechnungen verwendet werden. Trotzdem kann auch der Modus hilfreich sein, wenn man sich für den allgemeinsten Wert oder die beliebteste Wahl interessiert.

Das geometrische Mittel wird für exponentielle oder logarithmische Daten wie Labortiter und für Umweltproben verwendet, deren Werte mehrere Größenordnungen umfassen können. Das mit dem geometrischen Mittelwert verwendete Streuungsmaß ist die geometrische Standardabweichung. Analog zum geometrischen Mittelwert ist es das Antilog der Standardabweichung des Logarithmus der Werte.

Die geometrische Standardabweichung wird durch die Standardabweichung ersetzt, wenn Logarithmen von Zahlen einbezogen werden. Beispiele hierfür sind die Beschreibung der Partikelgröße in der Umwelt anhand der Masse oder die Variabilität der Bleikonzentrationen im Blut.1

Manchmal ist eine Kombination dieser Maßnahmen erforderlich, um einen Datensatz angemessen zu beschreiben.

BEISPIEL: Zusammenfassen von Daten

Betrachten Sie die Raucheranamnese von 200 Personen (Tabelle 2.12) und fassen Sie die Daten zusammen.

Tabelle 2.12 Selbstberichtete durchschnittliche Anzahl der pro Tag gerauchten Zigaretten, Umfrage unter Studenten (n = 200)

Anzahl der pro Tag gerauchten Zigaretten

 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 3 4 6 7 7 8 8 9 10 12 12 13 13 14 15 15 15 15 15 16 17 17 18 18 18 18 19 19 20 20 20 20 20 20 20 20 20 20 20 21 21 22 22 23 24 25 25 26 28 29 30 30 30 30 32 35 40

Die Analyse aller 200 Beobachtungen ergibt die folgenden Ergebnisse:

Mittelwert = 5,4
Median = 0
Modus = 0
Minimalwert = 0
Maximalwert = 40
Bereich = 0–40
Interquartilbereich = 8,8 (0,0–8,8)
Standardabweichung = 9,5

Diese Ergebnisse sind korrekt, fassen die Daten jedoch nicht gut zusammen. Fast drei Viertel der Schüler, die den Modus repräsentieren, rauchen überhaupt nicht. Die Trennung der 58 Raucher von den 142 Nichtrauchern ergibt eine aussagekräftigere Zusammenfassung der Daten. Unter den 58 (29%), die rauchen:

Mittelwert = 18,5
Median = 19,5
Modus = 20
Mindestwert = 2
Maximalwert = 40
Bereich = 2–40
Interquartilbereich = 8,5 (13,7–22,25)
Standardabweichung = 8,0

Eine aussagekräftigere Zusammenfassung der Daten könnte daher lauten: „142 (71%) der Schüler rauchen überhaupt nicht. Von den 58 Schülern (29%), die rauchen, liegt der durchschnittliche Verbrauch bei knapp einer Packung * pro Tag (Mittelwert = 18,5, Median = 19,5). Der Bereich reicht von 2 bis 40 Zigaretten, die pro Tag geraucht werden, wobei ungefähr die Hälfte der Raucher 14 bis 22 Zigaretten pro Tag raucht. “

* Eine typische Packung enthält 20 Zigaretten

Übung 2.11

Die Daten in Tabelle 2.13 (unten) stammen aus einer Untersuchung eines Ausbruchs schwerer Bauchschmerzen, anhaltenden Erbrechens und allgemeiner Schwäche bei Bewohnern eines ländlichen Dorfes. Die Ursache des Ausbruchs wurde schließlich als Mehl identifiziert, das unbeabsichtigt mit Bleistaub kontaminiert war.

  1. Fassen Sie die Blutspiegeldaten mit einer Häufigkeitsverteilung zusammen.
  2. Berechnen Sie das arithmetische Mittel. [Hinweis: Summe bekannter Werte = 2.363]
  3. Identifizieren Sie den Median und den Interquartilbereich.
  4. Berechnen Sie die Standardabweichung. [Hinweis: Summe der Quadrate = 157.743]
  5. Berechnen Sie den geometrischen Mittelwert anhand der angegebenen Protokollleitungspegel. [Hinweis: Summe der logarithmischen Bleigehalte = 68,45]

Überprüfe deine Antwort.

Tabelle 2.13 Alters- und Blutbleispiegel (BLL) von kranken Dorfbewohnern und Familienmitgliedern - Land X, 1996

ICH WÜRDE Alter Jahre) BLL † Log10BLL
1 3 69 1.84
2 4 45 1.66
3 6 49 1.69
4 7 84 1.92
5 9 48 1.68
6 10 58 1.77
7 11 17 1.23
8 12 76 1.88
9 13 61 1.79
10 14 78 1.89
11 15 48 1.68
12 15 57 1.76
13 16 68 1.83
14 16 ? ?
15 17 26 1.42
16 19 78 1.89
17 19 56 1.75
18 20 54 1.73
19 22 73 1.86
20 26 74 1.87
21 27 63 1.80
ICH WÜRDE Alter Jahre) BLL † Log10BLL
22 33 103 2.01
23 33 46 1.66
24 35 78 1.89
25 35 50 1.70
26 36 64 1.81
27 36 67 1.83
28 38 79 1.90
29 40 58 1.76
30 45 86 1.93
31 47 76 1.88
32 49 58 1.76
33 56 ? ?
34 60 26 1.41
35 65 104 2.02
36 65 39 1.59
37 65 35 1.54
38 70 72 1.86
39 70 57 1.76
40 76 38 1.58
41 78 44 1.64
† Blutbleispiegel gemessen in Mikrogramm pro Deziliter (mcg / dl)? Fehlender Wert

Datenquelle: Nasser A, Hatch D, Pertowski C, Yoon S. Ausbruchsuntersuchung einer unbekannten Krankheit in einem ländlichen Dorf in Ägypten (Fallstudie). Kairo: Field Epidemiology Training Program, 1999.

Referenzen (Dieser Abschnitt)

  1. Griffin S., Marcus A., Schulz T., Walker S. Berechnung der interindividuellen geometrischen Standardabweichung der Verwendung im integrierten biokinetischen Expositionsaufnahmemodell für Blei bei Kindern. Environ Health Perspect 1999; 107: 481–7.
Vorherige Seite Lektion 2 Übersicht