Prinzipien der Epidemiologie: Lektion 4, Abschnitt 2

Eine Tabelle ist ein Datensatz, der in Zeilen und Spalten angeordnet ist. Fast alle quantitativen Informationen können in einer Tabelle zusammengefasst werden. Tabellen sind nützlich, um Muster, Ausnahmen, Unterschiede und andere Beziehungen zu demonstrieren. Darüber hinaus dienen Tabellen in der Regel als Grundlage für die Erstellung zusätzlicher visueller Datenanzeigen wie Grafiken und Diagramme, in denen einige Details verloren gehen können.

Tabellen zur Darstellung von Daten für andere sollten so einfach wie möglich sein.1) Zwei oder drei kleine Tabellen, die sich jeweils auf einen anderen Aspekt der Daten konzentrieren, sind leichter zu verstehen als eine einzelne große Tabelle, die viele Details oder Variablen enthält.

Eine Tabelle in einer gedruckten Publikation sollte selbsterklärend sein. Wenn eine Tabelle aus ihrem ursprünglichen Kontext herausgenommen wird, sollte sie dennoch alle Informationen enthalten, die der Leser zum Verständnis der Daten benötigt. Befolgen Sie die nachstehenden Richtlinien, um eine selbsterklärende Tabelle zu erstellen.

Weitere Informationen zum Erstellen von Tabellen

  • Verwenden Sie einen klaren und präzisen Titel, der Person, Ort und Zeit - was, wo und wann - der Daten in der Tabelle beschreibt. Stellen Sie dem Titel eine Tabellennummer voran.
  • Beschriften Sie jede Zeile und jede Spalte und geben Sie die Maßeinheiten für die Daten an (z. B. Jahre, mm Hg, mg / dl, Rate pro 100.000).
  • Zeigen Sie gegebenenfalls Summen für Zeilen und Spalten an. Wenn Sie Prozentsätze (%) anzeigen, geben Sie auch deren Summe (immer 100) an.
  • Identifizieren Sie fehlende oder unbekannte Daten entweder in der Tabelle (z. B. Tabelle 4.11) oder in einer Fußnote unter der Tabelle.
  • Erläutern Sie alle Codes, Abkürzungen oder Symbole in einer Fußnote (z. B. Syphilis P & S = primäre und sekundäre Syphilis).
  • Ausschlüsse in einer Fußnote beachten (z. B. 1 Fall und 2 Kontrollen mit unbekannter Familienanamnese wurden von dieser Analyse ausgeschlossen).
  • Notieren Sie die Datenquelle unter der Tabelle oder in einer Fußnote, wenn die Daten nicht original sind.

Tabellen mit einer Variablen

In der deskriptiven Epidemiologie ist die grundlegendste Tabelle eine einfache Häufigkeitsverteilung mit nur einer Variablen, wie z. B. Tabelle 4.1a, in der die Anzahl der gemeldeten Syphilisfälle in den USA im Jahr 2002 nach Altersgruppen angegeben ist.2) (Häufigkeitsverteilungen werden in Lektion 2 erläutert.) In dieser Art von Häufigkeitsverteilungstabelle werden in der ersten Spalte die Werte oder Kategorien der durch die Daten dargestellten Variablen wie Alter oder Geschlecht angezeigt. Die zweite Spalte zeigt die Anzahl der Personen oder Ereignisse, die in jede Kategorie fallen. Bei der Erstellung einer Tabelle ergibt sich die Auswahl der Spalten aus der durchzuführenden Interpretation. In Tabelle 4.1a möchte der Analytiker die Rolle des Alters als Risikofaktor für Syphilis ansprechen.Daher wird die Altersgruppe als Spalte 1 und die Fallzahl als Spalte 2 ausgewählt.

In einer zusätzlichen Spalte wird häufig der Prozentsatz der Personen oder Ereignisse in jeder Kategorie aufgeführt (siehe Tabelle 4.1b). Die in Tabelle 4.1b angegebenen Prozentsätze summieren sich aufgrund der Rundung auf eine Dezimalstelle tatsächlich auf 99,9% anstatt auf 100,0%. Rundungen, die zu Summen von 99,9% oder 100,1% führen, sind in Tabellen mit Prozentsätzen üblich. Der Gesamtprozentsatz sollte jedoch als 100,0% angezeigt werden, und eine Fußnote, in der erläutert wird, dass der Unterschied auf Rundungen zurückzuführen ist, sollte enthalten sein.

Die Addition von Prozent zu einer Tabelle zeigt die relative Krankheitslast; In Tabelle 4.1b sehen wir beispielsweise, dass der größte Beitrag zur Krankheit für eine einzelne Alterskategorie zwischen 35 und 39 Jahren liegt. Die anschließende Addition des kumulativen Prozentsatzes (z. B. Tabelle 4.1c) ermöglicht es dem Analysten für öffentliche Gesundheit, die Auswirkungen einer gezielten Intervention zu veranschaulichen. Hier würde jede Intervention zur Verhinderung von Syphilis bei jungen Menschen und jungen Erwachsenen (unter 35 Jahren) fast die Hälfte der Fälle in dieser Population verhindern.

Die Tabelle mit einer Variablen kann weiter modifiziert werden, um die kumulative Häufigkeit und / oder den kumulativen Prozentsatz anzuzeigen, wie in Tabelle 4.1c. Aus dieser Tabelle können Sie auf einen Blick erkennen, dass 46,7% der primären und sekundären Syphilisfälle bei Personen unter 35 Jahren auftraten, was bedeutet, dass mehr als die Hälfte der Syphilisfälle bei Personen ab 35 Jahren auftraten. Beachten Sie, dass die Auswahl der Altersgruppen die Interpretation Ihrer Daten beeinflusst. (3)

Tabelle 4.1a Gemeldete Fälle von primärer und sekundärer Syphilis nach Alter - USA, 2002

Altersgruppe (Jahre) Zahl der Fälle
≤14 21
15–19 351
20–24 842
25–29 895
30–34 1,097
35–39 1,367
40–44 1,023
45–54 982
≥55 284
Gesamt 6,862

Datenquelle: Zentren für die Kontrolle und Prävention von Krankheiten. Überwachung sexuell übertragbarer Krankheiten 2002. Atlanta: US-Gesundheitsministerium; 2003.

Tabelle 4.1b Gemeldete Fälle von primärer und sekundärer Syphilis nach Alter - USA, 2002

FÄLLE
Altersgruppe (Jahre) Nummer Prozent
Gesamt 6,862 100.0*
≤14 21 0.3
15–19 351 5.1
20–24 842 12.3
25–29 895 13.0
30–34 1,097 16.0
35–39 1,367 19.9
40–44 1,023 14.9
45–54 982 14.3
≥55 284 4.1

* Die tatsächliche Gesamtsumme der Prozentsätze für diese Tabelle beträgt 99,9% und wird aufgrund von Rundungsfehlern nicht zu 100,0% addiert.

Datenquelle: Zentren für die Kontrolle und Prävention von Krankheiten. Überwachung sexuell übertragbarer Krankheiten 2002. Atlanta: US-Gesundheitsministerium; 2003.

Tabelle 4.1c Gemeldete Fälle von primärer und sekundärer Syphilis nach Alter - USA, 2002

FÄLLE
Altersgruppe (Jahre) Nummer Prozent kumulativer Prozentsatz
Gesamt 6,862 100.0* 100.0*
≤14 21 0.3 0.3
15–19 351 5.1 5.4
20–24 842 12.3 17.7
25–29 895 13 30.7
30–34 1,097 16 46.7
35–39 1,367 19.9 66.6
40–44 1,023 14.9 81.6
45–54 982 14.3 95.9
≥55 284 4.1 100

* Prozentsätze addieren sich aufgrund von Rundungsfehlern nicht zu 100,0%.

Datenquelle: Zentren für die Kontrolle und Prävention von Krankheiten. Überwachung sexuell übertragbarer Krankheiten 2002. Atlanta: US-Gesundheitsministerium; 2003.

Tabellen mit zwei und drei Variablen

Die Tabellen 4.1a, 4.1b und 4.1c zeigen Fallzahlen (Häufigkeit) durch eine einzelne Variable, z. B. Alter. Daten können auch kreuztabelliert werden, um die Anzahl durch eine zusätzliche Variable anzuzeigen. Tabelle 4.2 zeigt die Anzahl der Syphilisfälle, die sowohl nach Altersgruppe als auch nach Geschlecht des Patienten kreuzklassifiziert sind.

Tabelle 4.2 Gemeldete Fälle von primärer und sekundärer Syphilis nach Alter und Geschlecht - USA, 2002

ZAHL DER FÄLLE
Altersgruppe (Jahre) Männlich Weiblich Gesamt
Gesamt 5,268 1,594 6,862
≤14 9 12 21
15–19 135 216 351
20–24 533 309 842
25–29 668 227 895
30–34 877 220 1,097
35–39 1,121 246 1,367
40–44 845 178 1,023
45–54 825 157 982
≥55 255 29 284

Datenquelle: Zentren für die Kontrolle und Prävention von Krankheiten. Überwachung sexuell übertragbarer Krankheiten 2002. Atlanta: US-Gesundheitsministerium; 2003.

Eine Tabelle mit zwei Variablen, deren Daten gemeinsam nach diesen beiden Variablen kategorisiert werden, wird als Kontingenztabelle bezeichnet. Tabelle 4.3 ist ein Beispiel für eine spezielle Art von Kontingenztabelle, in der jede der beiden Variablen zwei Kategorien hat. Diese Art von Tabelle wird als Zwei-mal-Zwei-Tabelle bezeichnet und ist bei Epidemiologen beliebt. Zwei-mal-zwei-Tabellen sind praktisch, um Personen mit und ohne Exposition und Personen mit und ohne Krankheit zu vergleichen. Anhand dieser Daten können Epidemiologen gegebenenfalls die Beziehung zwischen Exposition und Krankheit beurteilen. Tabelle 4.3 ist eine Zwei-mal-Zwei-Tabelle, die eines der wichtigsten Ergebnisse einer Untersuchung der Kohlenmonoxidvergiftung nach einem Eissturm und einem längeren Stromausfall in Maine zeigt.4) In der Tabelle hat die Belichtungsvariable, Standort des Stromerzeugers, zwei Kategorien - innerhalb oder außerhalb des Hauses. In ähnlicher Weise hat die Ergebnisvariable Kohlenmonoxidvergiftung zwei Kategorien - Fälle (Anzahl der erkrankten Personen) und Kontrollen (Anzahl der nicht erkrankten Personen).

Tabelle 4.3 Position des Generators und Risiko einer Kohlenmonoxidvergiftung nach einem Eissturm - Maine, 1998

ANZAHL VON
Fälle Kontrollen Gesamt
Gesamt 27 162 189
Generatorstandort Drinnen zu Hause oder
angebrachte Struktur
23 23 46
Außerhalb von Zuhause 4 139 143

Datenquelle: Daley RW, Smith A., Paz-Argandona E., Mallilay J., McGeehin M. Ein Ausbruch einer Kohlenmonoxidvergiftung nach einem großen Eissturm in Maine. J Emerg Med 2000; 18: 87–93.

Tabelle 4.4 zeigt ein generisches Format und eine Standardnotation für eine Zwei-mal-Zwei-Tabelle. Der Krankheitsstatus (z. B. krank gegen gut, manchmal als Fälle gegen Kontrollen bezeichnet, wenn eine Fall-Kontroll-Studie vorliegt) wird normalerweise oben in der Tabelle angegeben, und der Expositionsstatus (z. B. exponiert gegen nicht exponiert) wird entlang der Seite bezeichnet. Die Buchstaben a, b, c, und d Innerhalb der 4 Zellen der Zwei-mal-Zwei-Tabelle beziehen sich auf die Anzahl der Personen mit dem oben angegebenen Krankheitsstatus und dem links angegebenen Expositionsstatus. In Tabelle 4.4 steht beispielsweise „c“ für die Anzahl der Personen in der Studie, die krank sind, aber nicht untersucht wurden. Beachten Sie, dass das „Hi“ horizontale Summen darstellt. H1 und H0 repräsentieren die Gesamtzahl der exponierten bzw. nicht exponierten Personen. Das "Vi" steht für vertikale Summen; V1 und V0 repräsentieren die Gesamtzahl der kranken und gesunden Personen (oder Fälle und Kontrollen). Die Gesamtzahl der in der Zwei-mal-Zwei-Tabelle enthaltenen Themen wird durch den Buchstaben T (oder N) dargestellt.

Tabelle 4.4 Allgemeines Format und Notation für eine Zwei-mal-Zwei-Tabelle

Krank Gut Gesamt Angriffsrate (Risiko)
Gesamt a + c = V1 b + d = V0 T. V1 ⁄ T.
Ausgesetzt ein b a + b = H1 a ⁄ a + b
Nicht belichtet c d c + d = H0 c ⁄ c + d

Wenn Sie eine Tabelle erstellen, die entweder im Druck oder in der Projektion angezeigt werden soll, ist es im Allgemeinen am besten, die Anzahl der Variablen auf eins oder zwei zu beschränken. Eine Ausnahme von dieser Regel tritt auf, wenn eine dritte Variable den Effekt (technisch erzeugt eine Interaktion) der ersten beiden ändert. Tabelle 4.5 soll zeigen, wie Rasse / ethnische Zugehörigkeit die Auswirkung von Alter und Geschlecht auf die Inzidenz von Syphilis verändern kann. Da Drei-Wege-Tabellen oft schwer zu verstehen sind, sollten sie nur verwendet werden, wenn eine ausführliche Erklärung und Diskussion möglich ist.

Tabelle 4.5 Anzahl der gemeldeten Fälle von primärer und sekundärer Syphilis nach Rasse / ethnischer Zugehörigkeit, Alter und Geschlecht - USA, 2002

Rasse / ethnische Zugehörigkeit Altersgruppe (Jahre) Männlich Weiblich Gesamt
Indianer/
Alaskan Native
≤14 1 0 1
15–19 0 1 1
20–24 5 3 8
25–29 3 1 4
30–34 1 2 3
35–39 3 5 8
40–44 4 3 7
45–54 8 8 16
≥55 2 1 3
Gesamt 27 24 51
Asiatischer / Pazifischer Insulaner ≤14 1 1 2
15–19 0 2 2
20–24 9 4 13
25–29 16 1 17
30–34 21 1 22
35–39 14 1 15
40–44 14 1 15
45–54 8 0 8
≥55 0 0 0
Gesamt 83 11 94
Schwarz, nicht spanisch ≤14 3 9 12
15–19 89 164 253
20–24 313 233 546
25–29 322 163 485
30–34 310 166 476
35–39 385 183 568
40–44 305 142 447
45–54 370 112 482
≥55 129 23 152
Gesamt 2,226 1,195 3,421
Hispanic ≤14 1 1 2
15–19 37 25 62
20–24 117 29 146
25–29 139 26 165
30–34 172 20 192
35–39 178 22 200
40–44 93 9 102
45–54 69 14 83
≥55 18 1 19
Gesamt 824 147 971
Weiß, nicht spanisch ≤14 3 1 4
15–19 9 24 33
20–24 89 40 129
25–29 188 36 224
30–34 373 31 404
35–39 541 35 576
40–44 429 23 452
45–54 370 23 393
≥55 106 4 110
Gesamt 2,108 217 2,325

Datenquelle: Zentren für die Kontrolle und Prävention von Krankheiten. Überwachung sexuell übertragbarer Krankheiten 2002. Atlanta: US-Gesundheitsministerium; 2003. p. 118.

Übung 4.1

Die Daten in Tabelle 4.6 beschreiben die Merkmale der 38 Personen, die im August 2001 bei oder von einem kirchlichen Abendessen in Texas gegessen haben. Fünfzehn dieser Personen entwickelten später Botulismus.5)

  1. Erstellen Sie eine Tabelle der Krankheit (Botulismus) nach Altersgruppen. Verwenden Sie den Botulismusstatus (Ja / Nein) als Spaltenbezeichnungen und Altersgruppen als Zeilenbezeichnungen.
  2. Erstellen Sie eine Zwei-mal-Zwei-Tabelle der Krankheit (Botulismus), indem Sie Hühnchen ausgesetzt werden.
  3. Erstellen Sie eine Zwei-mal-Zwei-Tabelle der Krankheit (Botulismus), indem Sie Chili ausgesetzt werden.
  4. Erstellen Sie eine Drei-Wege-Tabelle mit Krankheiten (Botulismus), indem Sie Chili und Chili-Resten ausgesetzt werden.

Überprüfe deine Antwort.

Tabelle 4.6 Zeilenliste für Übung 4.1

ICH WÜRDE Alter Besuchte das Abendessen Fall Datum des Beginns Fallstatus Aß jedes Essen Aß Chili Aß Huhn Aß Chili-Reste
1 1 Y. N. Y. Y. Y. N.
2 3 Y. Y. 8/27 Labor bestätigt Y. Y. N. N.
3 7 Y. Y. 8/31 Labor bestätigt Y. Y. N. N.
4 7 Y. N. Y. Y. Y. N.
5 10 Y. N. Y. Y. N. Y.
6 17 Y. Y. 8/28 Labor bestätigt Y. Y. Y. N.
7 21 Y. N. N. N. N. N.
8 23 Y. N. Y. Y. N. N.
9 25 Y. Y. 8/26 Epi-verknüpft Y. Y. N. N.
10 29 N. Y. 8/28 Labor bestätigt Y. Unk Unk Y.
11 38 Y. N. N. N. N. N.
12 39 Y. N. N. N. N. N.
13 41 Y. N. Y. Y. Y. N.
14 41 Y. N. N. N. N. N.
15 42 Y. Y. 8/26 Labor bestätigt Y. Y. Unk N.
16 45 Y. Y. 8/26 Labor bestätigt Y. Y. Y. Y.
17 45 Y. Y. 8/27 Epi-verknüpft Y. Y. Y. N.
18 46 Y. N. Y. N. Y. N.
19 47 Y. N. Y. N. Y. N.
20 48 Y. Y. 9/1 Labor bestätigt Y. Y. Unk N.
21 50 Y. Y. 8/29 Epi-verknüpft Y. Y. N. N.
22 50 Y. N. Y. N. Y. N.
23 50 Y. N. Y. N. N. Y.
24 52 Y. Y. 8/28 Labor bestätigt Y. Y. Y. N.
25 52 Y. N. N. N. N. N.
26 53 Y. Y. 8/27 Epi-verknüpft Y. Y. Y. N.
27 53 Y. N. Y. Y. Y. N.
28 62 Y. Y. 8/27 Epi-verknüpft Y. Y. Y. N.
29 62 Y. N. Y. N. Y. N.
30 63 Y. N. N. N. N. N.
31 67 Y. N. N. N. N. N.
32 68 Y. N. N. N. N. N.
33 69 Y. N. Y. Y. Y. N.
34 71 Y. N. Y. N. Y. N.
35 72 Y. Y. 8/27 Labor bestätigt Y. Y. Y. N.
36 74 Y. N. Y. Y. N. N.
37 74 Y. N. Y. N. Y. N.
38 78 Y. Y. 8/25 Epi-verknüpft Y. Y. Y. N.

Datenquelle: Kalluri P., Crowe C., Reller M., Gallien L., Hayslett J., Barth S., Eliasberg S., Ferreira J., Holt K., Bengston S., Hendricks K., Sobel J. Ein Ausbruch von lebensmittelbedingtem Botulismus im Zusammenhang mit Lebensmitteln, die bei a Bergungsladen in Texas. Clin Infect Dis 2003; 37: 1490–5.

Tabellen mit anderen statistischen Maßen als der Häufigkeit

Die Tabellen 4.1–4.5 zeigen die Anzahl der Fälle (Häufigkeit). In den Zellen einer Tabelle können auch Durchschnittswerte, Raten, relative Risiken oder andere epidemiologische Maßnahmen angezeigt werden. Wie bei jeder Tabelle müssen Titel und / oder Überschriften eindeutig angeben, welche Daten dargestellt werden. Beispielsweise zeigt der Titel von Tabelle 4.7, dass die Daten für gemeldete Fälle von primärer und sekundärer Syphilis eher Raten als Zahlen sind.

Tabelle 4.7 Rate pro 100.000 Einwohner für gemeldete Fälle von primärer und sekundärer Syphilis nach Alter und Rasse - USA, 2002

Altersgruppe (Jahre) Am. Indianer / Alaska-Ureinwohner Asiatisch/
Pazifik ist.
Schwarz, Nicht-
Hispanic
Hispanic Weiß, Nicht-
Hispanic
Gesamt
10–14 0.0 0.1 0.3 0.1 0.0 0.1
15–19 0.5 0.2 8.6 1.9 0.3 1.7
20–24 5.0 1.5 20.7 4.3 1.1 4.4
25–29 2.7 1.6 19.1 4.9 1.8 4.6
30–34 2.0 2.2 18.2 6.1 3.0 5.4
35–39 4.8 1.6 20.1 7.1 3.6 6.0
40–44 4.5 1.6 16.6 4.4 2.8 4.6
45–54 6.1 0.6 11.8 2.7 1.4 2.6
55–64 1.4 0.0 4.6 0.6 0.5 0.9
65+ 0.8 0.0 1.5 0.5 0.1 0.2
Summen 2.4 0.9 9.8 2.7 1.2 2.4

Datenquelle: Zentren für die Kontrolle und Prävention von Krankheiten. Überwachung sexuell übertragbarer Krankheiten 2002. Atlanta: US-Gesundheitsministerium; 2003.

Zusammengesetzte Tabellen

Um Platz in einem Bericht oder Manuskript zu sparen, werden manchmal mehrere Tabellen zu einer zusammengefasst. Beispielsweise erstellen Epidemiologen häufig einfache Häufigkeitsverteilungen nach Alter, Geschlecht und anderen demografischen Variablen als separate Tabellen. Die Redakteure können sie jedoch zur Veröffentlichung in einer großen zusammengesetzten Tabelle zusammenfassen. Tabelle 4.8 ist ein Beispiel für eine zusammengesetzte Tabelle aus der Untersuchung einer Kohlenmonoxidvergiftung nach dem Stromausfall in Maine.4)

Es ist wichtig zu wissen, dass dieser Tabellentyp nicht wie ein Drei-Wege-Tisch interpretiert werden sollte. Die Daten in Tabelle 4.8 wurden nicht zusammengestellt, um den Zusammenhang zwischen Geschlecht, Alter, Rauchen und Disposition bei der medizinischen Versorgung anzuzeigen. Lediglich mehrere Tabellen mit einer Variablen (unabhängig von der Anzahl der Fälle anhand jeder dieser Variablen) wurden zur Platzersparnis verkettet. Diese Tabelle würde also nicht dazu beitragen, die Veränderung des Rauchens auf das Krankheitsrisiko beispielsweise nach Alter zu beurteilen. Dieser Unterschied erklärt auch, warum die Darstellung von Gesamtwerten für Tabelle 4.8 unangemessen und bedeutungslos wäre.

Tabelle 4.8 Anzahl und Prozentsatz der bestätigten Fälle von Kohlenmonoxidvergiftung, die aus vier Krankenhäusern nach ausgewählten Merkmalen identifiziert wurden - Maine, Januar 1998

FÄLLE
Charakteristisch Nummer Prozent
Fälle insgesamt 100 100
Geschlecht (weiblich) 59 59
Alter Jahre)
0–3 5 5
4–12 17 17
13–18 9 9
19–64 52 52
≥65 17 17
Raucher 20 20
Anordnung