Lektion 2: Zusammenfassen von Daten

Abschnitt 6: Maßnahmen der zentralen Lage

Ein Maß für die zentrale Position liefert einen einzelnen Wert, der eine gesamte Datenverteilung zusammenfasst. Angenommen, Sie hatten Daten von einem Ausbruch der Gastroenteritis bei 41 Personen, die kürzlich an einer Hochzeit teilgenommen hatten. Wenn Ihr Vorgesetzter Sie gebeten hat, das Alter der betroffenen Personen zu beschreiben, können Sie einfach das Alter jeder Person auflisten. Alternativ könnte Ihr Vorgesetzter eine Zusammenfassungsnummer bevorzugen - ein Maß für die zentrale Position. Zu sagen, dass das mittlere (oder durchschnittliche) Alter 48 Jahre betrug, anstatt 41 Alter zu rezitieren, ist sicherlich effizienter und höchstwahrscheinlich aussagekräftiger.

Die Messungen der zentralen Position umfassen den Modus, den Median, das arithmetische Mittel, den mittleren Bereich und das geometrische Mittel. Die Auswahl des besten Maßes für eine bestimmte Verteilung hängt weitgehend von zwei Faktoren ab:

  • Die Form oder Schiefe der Verteilung und
  • Die beabsichtigte Verwendung der Maßnahme.

In diesem Abschnitt wird jede Kennzahl beschrieben - was es ist, wie es berechnet wird und wann es am besten verwendet wird.

Modus

Definition des Modus

Der Modus ist der Wert, der in einem Datensatz am häufigsten vorkommt. Sie kann einfach bestimmt werden, indem gezählt wird, wie oft jeder Wert auftritt. Betrachten Sie zum Beispiel die Anzahl der Dosen des Impfstoffs gegen Diphtherie-Pertussis-Tetanus (DPT), die jedes von siebzehn 2-jährigen Kindern in einem bestimmten Dorf erhalten hat:

0, 0, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4

Zwei Kinder erhielten keine Dosen; zwei Kinder erhielten 1 Dosis; drei erhielten 2 Dosen; sechs erhielten 3 Dosen; und vier erhielten alle 4 Dosen. Daher beträgt der Modus 3 Dosen, da mehr Kinder 3 Dosen erhielten als jede andere Anzahl von Dosen.

Methode zur Identifizierung des Modus

  1. Schritt 1. Ordnen Sie die Beobachtungen in einer Häufigkeitsverteilung an und geben Sie die Werte der Variablen und die Häufigkeit an, mit der jeder Wert auftritt. (Alternativ können Sie für einen Datensatz mit nur wenigen Werten die tatsächlichen Werte in aufsteigender Reihenfolge anordnen, wie dies bei den oben genannten DPT-Impfstoffdosen der Fall war.)
  2. Schritt 2. Identifizieren Sie den Wert, der am häufigsten auftritt.

BEISPIELE: Identifizieren des Modus

Beispiel A: Tabelle 2.8 (unten) enthält Daten von 30 Patienten, die ins Krankenhaus eingeliefert wurden und Antibiotika erhielten. Identifizieren Sie für die Variable „Aufenthaltsdauer“ (LOS) im Krankenhaus den Modus.

  1. Schritt 1. Ordnen Sie die Daten in einer Häufigkeitsverteilung an. Teil 1 von 3
    LOS Frequenz
    0 1
    1 0
    2 1
    3 1
    4 1
    5 2
    6 1
    7 1
    8 1
    9 3
    Teil 2
    LOS Frequenz
    10 5
    11 1
    12 3
    13 1
    14 1
    15 0
    16 1
    17 0
    18 2
    19 1
    Teil 3
    LOS Frequenz
    20 0
    21 0
    22 1
    . 0
    . 0
    27 1
    . 0
    . 0
    49 1
    Alternativ können Sie die Werte in aufsteigender Reihenfolge anordnen.

    0, 2, 3, 4, 5, 5, 6, 7, 8, 9,
    9, 9, 10, 10, 10, 10, 10, 11, 12, 12,
    12, 13, 14, 16, 18, 18, 19, 22, 27, 49

  2. Schritt 2. Identifizieren Sie den Wert, der am häufigsten auftritt. Die meisten Werte werden einmal angezeigt, aber die Verteilung umfasst zwei 5er, drei 9er, fünf 10er, drei 12er und zwei 18er.
    Da 10 am häufigsten angezeigt wird, ist der Modus 10.

Beispiel B: Finden Sie den Modus der folgenden Inkubationszeiten für Hepatitis A: 27, 31, 15, 30 und 22 Tage.

  1. Schritt 1. Ordnen Sie die Werte in aufsteigender Reihenfolge an. 15, 22, 27, 30 und 31 Tage
  2. Schritt 2. Identifizieren Sie den Wert, der am häufigsten auftritt. Keiner

Hinweis: Wenn kein Wert mehr als einmal vorkommt, hat die Distribution keinen Modus.

Beispiel: Ermitteln Sie den Modus der folgenden Inkubationszeiten für Bacillus cereus-Lebensmittelvergiftungen:

2, 3, 3, 3, 3, 3, 4, 4, 5, 6, 7, 9, 10, 11, 11, 12, 12, 12, 12, 12, 14, 14, 15, 17, 18, 20, 21 Stunden
  1. Schritt 1. Ordnen Sie die Werte in aufsteigender Reihenfolge an. Erledigt
  2. Schritt 2. Identifizieren Sie die Werte, die am häufigsten auftreten. Fünf 3er und fünf 12er

Beispiel C veranschaulicht die Tatsache, dass eine Häufigkeitsverteilung mehr als einen Modus haben kann. In diesem Fall wird die Verteilung als bimodal bezeichnet. Tatsächlich, Bacillus cereus Es ist bekannt, dass es zwei Syndrome mit unterschiedlichen Inkubationszeiten verursacht: ein Syndrom mit kurzer Inkubationszeit (1–6 Stunden), das durch Erbrechen gekennzeichnet ist; und ein Syndrom mit langer Inkubationszeit (6–24 Stunden), das durch Durchfall gekennzeichnet ist.

Tabelle 2.8 Beispieldaten aus dem Vancomycin-Qualitätsverbesserungsprojekt des Nordostkonsortiums

Zeilenauflistung
ICH WÜRDE Aufnahmedatum Entlassungsdatum LOS DOB (mm / dd) Geburtsdatum (Jahr) Alter Sex ESRD
1 1/01 1/10 9 11/18 1928 66 M. Y. 3 N.
2 1/08 1/30 22 01/21 1916 78 F. N. 10 Y.
3 1/16 3/06 49 04/22 1920 74 F. N. 32 Y.
4 1/23 2/04 12 05/14 1919 75 M. N. 5 Y.
5 1/24 2/01 8 08/17 1929 65 M. N. 4 N.
6 1/27 2/14 18 01/11 1918 77 M. N. 6 Y.
7 2/06 2/16 10 01/09 1920 75 F. N. 2 Y.
8 2/12 2/22 10 06/12 1927 67 M. N. 1 N.
9 2/22 3/04 10 05/09 1915 79 M. N. 8 N.
10 2/22 3/08 14 04/09 1920 74 F. N. 10 N.
11 2/25 3/04 7 07/28 1915 79 F. N. 4 N.
12 3/02 3/14 12 04/24 1928 66 F. N. 8 N.
13 3/11 3/17 6 11/09 1925 69 M. N. 3 N.
14 3/18 3/23 5 04/08 1924 70 F. N. 2 N.
15 3/19 3/28 9 09/13 1915 79 F. N. 1 Y.
16 3/27 4/01 5 01/28 1912 83 F. N. 4 Y.
17 3/31 4/02 2 03/14 1921 74 M. N. 2 Y.
18 4/12 4/24 12 02/07 1927 68 F. N. 3 N.
19 4/17 5/06 19 03/04 1921 74 F. N. 11 Y.
20 4/29 5/26 27 02/23 1921 74 F. N. 14 N.
21 5/11 5/15 4 05/05 1923 72 M. N. 4 Y.
22 5/14 5/14 0 01/03 1911 84 F. N. 1 N.
23 5/20 5/30 10 11/11 1922 72 F. N. 9 Y.
24 5/21 6/08 18 08/08 1912 82 M. N. 14 Y.
25 5/26 6/05 10 09/28 1924 70 M. Y. 5 N.
26 5/27 5/30 3 05/14 1899 96 F. N. 2 N.
27 5/28 6/06 9 07/22 1921 73 M. N. 1 Y.
28 6/07 6/20 13 12/30 1896 98 F. N. 3 N.
29 6/07 6/23 16 08/31 1906 88 M. N. 1 N.
30 6/16 6/27 11 07/07 1917 77 F. N. 7 Y.

So identifizieren Sie den Modus anhand eines Datensatzes im Analysemodul:

Epi Info hat keinen Modusbefehl. Der beste Weg, um den Modus zu identifizieren, besteht darin, ein Histogramm zu erstellen und nach den höchsten Spalten zu suchen.

Wählen Sie Diagramme aus und wählen Sie dann Histogramm unter Diagrammtyp.

Die höchste (n) Spalte (n) ist (sind) der / die Modus (e).

HINWEIS: Der Befehl Mittel bietet einen Modus, jedoch nur den niedrigsten Wert, wenn eine Distribution mehr als einen Modus hat.

Eigenschaften und Verwendung des Modus

Der Modus ist das am einfachsten zu verstehende und zu erklärende Maß für die zentrale Position. Es ist auch am einfachsten zu identifizieren und erfordert keine Berechnungen.

  • Der Modus ist das bevorzugte Maß für die zentrale Position, um zu ermitteln, welcher Wert am beliebtesten oder am häufigsten verwendet wird. Der Modus wird beispielsweise verwendet, um zu beschreiben, an welchem ​​Wochentag die Menschen am liebsten in die Influenza-Impfklinik kommen oder wie viele DPT-Dosen die Kinder in einer bestimmten Gemeinde bis zu ihrem zweiten Geburtstag erhalten haben.
  • Wie gezeigt, kann eine Distribution einen einzelnen Modus haben. Eine Verteilung hat jedoch mehr als einen Modus, wenn zwei oder mehr Werte als häufigste Werte gelten. Es hat keinen Modus, wenn kein Wert mehr als einmal angezeigt wird.
  • Der Modus wird fast ausschließlich als „beschreibende“ Maßnahme verwendet. Es wird fast nie für statistische Manipulationen oder Analysen verwendet.
  • Der Modus wird normalerweise nicht von einem oder zwei Extremwerten (Ausreißern) beeinflusst.

Übung 2.3

Suchen Sie den Modus anhand der gleichen Impfdaten wie in Übung 2.2. (Wenn Sie Übung 2.2 beantwortet haben, ermitteln Sie den Modus anhand Ihrer Häufigkeitsverteilung.)

2, 0, 3, 1, 0, 1, 2, 2, 4, 8, 1, 3, 3, 12, 1, 6, 2, 5, 1

Kontrolliere deine Antworten

Median

Definition des Medians

Der Median ist der Mittelwert eines Datensatzes, der in Rangfolge gebracht wurde. Ähnlich wie der Median auf einer Autobahn, die die Straße in zwei Teile teilt, ist der statistische Median der Wert, der die Daten in zwei Hälften teilt, wobei eine Hälfte der Beobachtungen kleiner als der Medianwert und die andere Hälfte größer ist. Der Median ist auch das 50. Perzentil der Verteilung. Angenommen, Sie hatten in Jahren das folgende Alter für Patienten mit einer bestimmten Krankheit:

4, 23, 28, 31, 32

Das Durchschnittsalter beträgt 28 Jahre, da es sich um den Mittelwert handelt, wobei zwei Werte kleiner als 28 und zwei Werte größer als 28 sind.

Methode zur Identifizierung des Medians

Schritt 1. Ordnen Sie die Beobachtungen in aufsteigender oder abnehmender Reihenfolge an.

Schritt 2. Ermitteln Sie die mittlere Position der Verteilung mithilfe der folgenden Formel:

Mittelstellung = (n + 1) / 2

  • Wenn die Anzahl der Beobachtungen (n) ungerade ist, fällt die mittlere Position auf eine einzelne Beobachtung.
  • Wenn die Anzahl der Beobachtungen gerade ist, liegt die mittlere Position zwischen zwei Beobachtungen.

Schritt 3. Identifizieren Sie den Wert an der mittleren Position.

  • Wenn die Anzahl der Beobachtungen (n) ungerade ist und die mittlere Position auf eine einzelne Beobachtung fällt, entspricht der Median dem Wert dieser Beobachtung.
  • Wenn die Anzahl der Beobachtungen gerade ist und die mittlere Position zwischen zwei Beobachtungen liegt, entspricht der Median dem Durchschnitt der beiden Werte.

Eigenschaften und Verwendungen des Medians

  • Der Median ist ein gutes beschreibendes Maß, insbesondere für Daten, die verzerrt sind, da er der zentrale Punkt der Verteilung ist.
  • Der Median ist relativ leicht zu identifizieren. Sie entspricht entweder einem einzelnen beobachteten Wert (bei ungerader Anzahl von Beobachtungen) oder dem Durchschnitt von zwei beobachteten Werten (bei gerader Anzahl von Beobachtungen).
  • Der Median wird wie der Modus im Allgemeinen nicht von einem oder zwei Extremwerten (Ausreißern) beeinflusst. Wenn beispielsweise die Werte auf der vorherigen Seite 4, 23, 28, 31 und 131 (anstelle von 31) gewesen wären, wäre der Median immer noch 28.
  • Der Median hat weniger als ideale statistische Eigenschaften. Daher wird es bei statistischen Manipulationen und Analysen nicht häufig verwendet.

Übung 2.4

Bestimmen Sie den Median für dieselben Impfdaten, die in den Übungen 2.2 verwendet wurden. und 2.3.

2, 0, 3, 1, 0, 1, 2, 2, 4, 8, 1, 3, 3, 12, 1, 6, 2, 5, 1

Kontrolliere deine Antworten

Arithmetisches Mittel

Definition des Mittelwerts

Das arithmetische Mittel ist ein eher technischer Name für das, was üblicherweise als Mittelwert oder Durchschnitt bezeichnet wird. Das arithmetische Mittel ist der Wert, der allen anderen Werten in einer Verteilung am nächsten kommt.

Methode zur Berechnung des Mittelwerts

Schritt 1. Fügen Sie alle beobachteten Werte in die Verteilung ein.

Schritt 2. Teilen Sie die Summe durch die Anzahl der Beobachtungen.

BEISPIEL: Den Mittelwert finden

Ermitteln Sie den Mittelwert der folgenden Inkubationszeiten für Hepatitis A: 27, 31, 15, 30 und 22 Tage.

Schritt 1. Fügen Sie alle beobachteten Werte in die Verteilung ein.

27 + 31 + 15 + 30 + 22 = 125

Schritt 2. Teilen Sie die Summe durch die Anzahl der Beobachtungen.

125 / 5 = 25.0

Daher beträgt die mittlere Inkubationszeit 25,0 Tage.

Eigenschaften und Verwendungen des arithmetischen Mittels

  • Der Mittelwert hat ausgezeichnete statistische Eigenschaften und wird üblicherweise für zusätzliche statistische Manipulationen und Analysen verwendet. Eine solche Eigenschaft heißt Zentriereigenschaft des Mittelwerts. Wenn der Mittelwert von jeder Beobachtung im Datensatz subtrahiert wird, ist die Summe dieser Differenzen Null (d. H. Die negative Summe ist gleich der positiven Summe). Für die Daten im vorherigen Hepatitis-A-Beispiel:
Hepatitis-A-Daten
Wert minus Mittelwert Unterschied
15 – 25.0 -10.0
22 – 25.0 -3.0
27 – 25.0 + 2.0
30 – 25.0 + 5.0
31 – 25.0 + 6.0
125 – 125.0 = 0 + 13.0 – 13.0 = 0

Dies zeigt, dass der Mittelwert das arithmetische Zentrum der Verteilung ist.

  • Aufgrund dieser Zentrierungseigenschaft wird der Mittelwert manchmal als bezeichnet Schwerpunkty einer Häufigkeitsverteilung. Wenn die Häufigkeitsverteilung in einem Diagramm dargestellt wird und das Diagramm auf einem Drehpunkt ausgeglichen ist, ist der Punkt, an dem sich die Verteilung ausgleichen würde, der Mittelwert.
  • Das arithmetische Mittel ist das beste beschreibende Maß für normalverteilte Daten.
  • Andererseits ist der Mittelwert nicht das Maß der Wahl für Daten, die stark verzerrt sind oder in der einen oder anderen Richtung Extremwerte aufweisen. Da das arithmetische Mittel alle Beobachtungen in der Verteilung verwendet, wird es von jedem Extremwert beeinflusst. Angenommen, der letzte Wert in der vorherigen Verteilung war 131 statt 31. Der Mittelwert wäre 225/5 = 45,0 statt 25,0. Aufgrund eines extrem großen Wertes ist der Mittelwert viel größer als alle Werte in der Verteilung mit Ausnahme des Extremwerts (der „Ausreißer“).

Epi Info Demonstration: Den Median finden

Frage: Wie hoch ist das Durchschnittsgewicht der Teilnehmer im Datensatz SMOKE?

Antwort: In Epi Info:
Wählen Sie Daten analysieren.
Wählen Sie Lesen (Importieren). Der Standarddatensatz sollte Sample.mdb sein. Scrollen Sie unter Ansichten nach unten, um SMOKE anzuzeigen, und doppelklicken Sie oder klicken Sie einmal und dann auf OK. Beachten Sie, dass 9 Personen ein Gewicht von 777 und 10 Personen ein Gewicht von 999 haben. Dies sind Codes für "abgelehnt" und "vermisst". Geben Sie die folgenden Befehle ein, um diese Datensätze zu löschen:
Klicken Sie auf Auswählen. Geben Sie dann die ein Gewicht <770, oder wählen Sie das Gewicht aus den verfügbaren Werten aus, geben Sie <750 ein und klicken Sie auf OK.
Wählen Sie Mittel. Klicken Sie dann auf den Abwärtspfeil unter Mittel von, scrollen Sie nach unten und wählen Sie GEWICHT aus. Klicken Sie dann auf OK.

Die resultierende Ausgabe sollte ein Durchschnittsgewicht von 158,116 Pfund anzeigen.

Sie sind dran: Wie viele Zigaretten werden durchschnittlich pro Tag geraucht? [Antwort: 17]

Übung 2.5

Bestimmen Sie den Mittelwert für denselben Satz von Impfdaten.

2, 0, 3, 1, 0, 1, 2, 2, 4, 8, 1, 3, 3, 12, 1, 6, 2, 5, 1

Kontrolliere deine Antworten

Der Mitteltonbereich (Mittelpunkt eines Intervalls)

Definition des Mitteltonbereichs
Der Mitteltonbereich ist der halbe Punkt oder der Mittelpunkt einer Reihe von Beobachtungen. Der Mitteltonbereich wird normalerweise als Zwischenschritt bei der Bestimmung anderer Kennzahlen berechnet.

Methode zur Identifizierung des Mitteltonbereichs

  1. Identifizieren Sie die kleinste (minimale) Beobachtung und die größte (maximale) Beobachtung.
  2. Addiere das Minimum plus das Maximum und dividiere durch zwei.

Ausnahme: Das Alter unterscheidet sich von den meisten anderen Variablen, da das Alter nicht den üblichen Regeln für das Runden auf die nächste Ganzzahl entspricht. Jemand, der 17 Jahre und 360 Tage alt ist, kann nicht behaupten, mindestens 5 weitere Tage 18 Jahre alt zu sein. Um den mittleren Bereich für Altersdaten (in Jahren) zu ermitteln, müssen Sie die kleinste (minimale) Beobachtung plus die größte (maximale) Beobachtung plus 1 addieren und dann durch zwei teilen.

Mitteltöner (die meisten Datentypen) = (Minimum + Maximum) / 2
Mitteltöner (Altersdaten) = (Minimum + Maximum + 1) / 2

Betrachten Sie das folgende Beispiel:

In einer bestimmten Vorschule werden die Kinder nach dem Alter am 1. September den Zimmern zugewiesen. In Raum 2 sind alle Kinder untergebracht, die zum 1. September mindestens 2 Jahre alt, aber noch nicht 3 Jahre alt waren. Mit anderen Worten: Jedes Kind in Raum 2 war am 1. September 2 Jahre alt. Wie alt sind die Kinder in Raum 2 am 1. September im mittleren Alter?

Für beschreibende Zwecke ist eine vernünftige Antwort 2. Denken Sie jedoch daran, dass der Mitteltonbereich normalerweise als Zwischenschritt in anderen Berechnungen berechnet wird. Daher ist mehr Präzision erforderlich.

Bedenken Sie, dass im August geborene Kinder gerade 2 Jahre alt geworden sind. Andere, die im September des Vorjahres geboren wurden, sind fast, aber nicht ganz drei Jahre alt. Ohne Berücksichtigung der saisonalen Trends bei den Geburten und unter der Annahme eines sehr großen Kinderraums wird erwartet, dass die Geburtstage gleichmäßig über das ganze Jahr verteilt sind. Das jüngste Kind, geboren am 1. September, ist genau 2.000 Jahre alt. Das älteste Kind, dessen Geburtstag der 2. September des Vorjahres ist, ist 2.997 Jahre alt. Zu statistischen Zwecken betragen der Mittelwert und der Mittelwert dieser theoretischen Gruppe von 2-Jährigen jeweils 2,5 Jahre.

Eigenschaften und Verwendung des Mitteltonbereichs

  • Der Mitteltonbereich wird üblicherweise nicht als Maß für die zentrale Lage angegeben.
  • Der Mitteltonbereich wird häufiger als Zwischenschritt in anderen Berechnungen oder zum Zeichnen von Diagrammen von Daten verwendet, die in Intervallen gesammelt wurden.

BEISPIELE: Identifizierung des Mitteltöners

Beispiel A: Finden Sie den mittleren Bereich der folgenden Inkubationszeiten für Hepatitis A: 27, 31, 15, 30 und 22 Tage.

  1. Identifizieren Sie die minimalen und maximalen Werte.
    Minimum = 15, Maximum = 31
  2. Addiere das Minimum plus das Maximum und dividiere durch zwei.
    Mitteltöner = 15 + 31/2 = 46/2 = 23 Tage

Beispiel B: Finden Sie den mittleren Bereich der Gruppe 15–24 (z. B. Anzahl der in einer Woche konsumierten alkoholischen Getränke).

  1. Identifizieren Sie die minimalen und maximalen Werte.
    Minimum = 15, Maximum = 24
  2. Addiere das Minimum plus das Maximum und dividiere durch zwei.
    Mitteltöner = 15 + 24/2 = 39/2 = 19,5

Diese Berechnung geht davon aus, dass die Gruppierung 15–24 tatsächlich 14,50–24,49… abdeckt. Da der Mitteltonbereich von 14,50 bis 24,49… = 19,49… liegt, kann der Mitteltonbereich als 19,5 angegeben werden.

Beispiel C: Finden Sie den mittleren Bereich der Altersgruppe von 15 bis 24 Jahren.

  1. Identifizieren Sie die minimalen und maximalen Werte.
    Minimum = 15, Maximum = 24
  2. Addiere das Minimum plus das Maximum plus 1 und dividiere dann durch zwei.

Mitteltöner = (15 + 24 + 1) / 2 = 40/2 = 20 Jahre

Das Alter unterscheidet sich von den meisten anderen Variablen, da das Alter nicht den üblichen Regeln für das Runden auf die nächste Ganzzahl entspricht. Für die meisten Variablen kann 15,99 auf 16 gerundet werden. Ein Jugendlicher, der 15 Jahre und 360 Tage alt ist, kann jedoch nicht behaupten, mindestens 5 weitere Tage lang 16 Jahre alt zu sein (und daher seinen Führerschein oder seine Lernerlaubnis zu erhalten). Das Intervall von 15 bis 24 Jahren erstreckt sich also tatsächlich über 15,0 bis 24,99 Jahre. Der mittlere Bereich von 15,0 und 24,99… = 19,99… = 20,0 Jahre.

Geometrisches Mittel

Zur Berechnung des geometrischen Mittelwerts benötigen Sie einen wissenschaftlichen Taschenrechner mit log- und yx-Tasten.

Definition des geometrischen Mittels
Das geometrische Mittel ist der Mittelwert oder Durchschnitt eines Datensatzes, der auf einer logarithmischen Skala gemessen wurde. Das geometrische Mittel wird verwendet, wenn die Logarithmen der Beobachtungen normal (symmetrisch) verteilt sind und nicht die Beobachtungen selbst. Das geometrische Mittel ist im Labor besonders nützlich für Daten aus seriellen Verdünnungstests (1/2, 1/4, 1/8, 1/16 usw.) und für Daten aus Umweltproben.

Weitere Informationen zu Logarithmen

Ein Logarithmus ist die Potenz, zu der eine Basis angehoben wird.

Auf welche Stärke müssten Sie eine Basis von 10 erhöhen, um einen Wert von 100 zu erhalten?
Da 10 mal 10 oder 102 gleich 100 ist, ist das Protokoll von 100 an Basis 10 gleich 2. In ähnlicher Weise ist das Protokoll von 16 an Basis 2 gleich 4, weil 24 = 2 x 2 x 2 x 2 = 16.

20 = 1 (alles, was auf die Potenz 0 erhöht wird, ist 1)
21 = 2 = 2
22 = 2 x 2 = 4
23 = 2 x 2 x 2 = 8
24 = 2 x 2 x 2 x 2 = 16
25 = 2 x 2 x 2 x 2 x 2 = 32
26 = 2 x 2 x 2 x 2 x 2 x 2 = 64
27 = 2 x 2 x 2 x 2 x 2 x 2 x 2 = 128
und so weiter.

100 = 1 (Alles, was auf die Potenz 0 angehoben wird, entspricht 1)
101 = 10
102 = 100
103 = 1,000
104 = 10,000
105 = 100,000
106 = 1,000,000
107 = 10,000,000
und so weiter.

Ein Antilog erhöht die Basis auf die Potenz (Logarithmus). Zum Beispiel ist der Antilog von 2 an der Basis 10 102 oder 100. Der Antilog von 4 an der Basis 2 ist 24 oder 16. Die Mehrheit der Titer wird als Vielfaches von 2 angegeben (z. B. 2, 4, 8 usw.). ); Daher wird beim Umgang mit Titern typischerweise die Basis 2 verwendet.

Methode zur Berechnung des geometrischen Mittelwerts

Es gibt zwei Methoden zur Berechnung des geometrischen Mittelwerts.

Methode A.

  1. Nehmen Sie den Logarithmus jedes Wertes.
  2. Berechnen Sie den Mittelwert der Protokollwerte, indem Sie die Protokollwerte summieren und dann durch die Anzahl der Beobachtungen dividieren.
  3. Nehmen Sie den Antilog des Mittelwerts der Log-Werte, um den geometrischen Mittelwert zu erhalten.

Methode B.

  1. Berechnen Sie das Produkt der Werte, indem Sie alle Werte miteinander multiplizieren.
  2. Nehmen Sie die n-te Wurzel des Produkts (wobei n die Anzahl der Beobachtungen ist), um den geometrischen Mittelwert zu erhalten.

BEISPIELE: Berechnung des geometrischen Mittelwerts

Beispiel A: Verwenden von Methode A.
Berechnen Sie den geometrischen Mittelwert aus dem folgenden Datensatz.

10, 10, 100, 100, 100, 100, 10,000, 100,000, 100,000, 1,000,000

Da diese Werte alle ein Vielfaches von 10 sind, ist es sinnvoll, Protokolle der Basis 10 zu verwenden.

Nehmen Sie das Protokoll (in diesem Fall auf Basis 10) jedes Werts.

log10 (xi) = 1, 1, 2, 2, 2, 2, 4, 5, 5, 6

Berechnen Sie den Mittelwert der logarithmischen Werte, indem Sie die Anzahl der Beobachtungen summieren und dividieren (in diesem Fall 10).

Mittelwert von log10 (xi) = (1 + 1 + 2 + 2 + 2 + 2 + 4 + 5 + 5 + 6) / 10 = 30/10 = 3

  1. Nehmen Sie den Antilog des Mittelwerts der Log-Werte, um den geometrischen Mittelwert zu erhalten.
  2. Antilog 10 (3) = 103 = 1.000.
  3. Das geometrische Mittel des Datensatzes beträgt 1.000.

Beispiel B: Verwenden von Methode B.

Berechnen Sie den geometrischen Mittelwert aus den folgenden 95% -Konfidenzintervallen eines Odds Ratio: 1,0, 9,0

    1. Berechnen Sie das Produkt der Werte, indem Sie alle Werte miteinander multiplizieren.

1,0 x 9,0 = 9,0

  1. Nehmen Sie die Quadratwurzel des Produkts.

Das geometrische Mittel = Quadratwurzel von 9,0 = 3,0.

Eigenschaften und Verwendungen des geometrischen Mittels

Das geometrische Mittel ist der Durchschnitt der logarithmischen Werte, die in die Basis zurückgerechnet werden. Das geometrische Mittel dämpft tendenziell den Effekt von Extremwerten und ist immer kleiner als das entsprechende arithmetische Mittel. In diesem Sinne ist das geometrische Mittel für einen oder mehrere Extremwerte weniger empfindlich als das arithmetische Mittel.

  • Das geometrische Mittel ist das Maß der Wahl für Variablen, die auf einer exponentiellen oder logarithmischen Skala gemessen werden, wie z. B. Verdünnungstiter oder Assays.
  • Das geometrische Mittel wird häufig für Umweltproben verwendet, wenn die Werte über mehrere Größenordnungen liegen können. Beispielsweise kann der Gehalt an Coliformen in Proben, die aus einem Gewässer entnommen wurden, zwischen weniger als 100 und mehr als 100.000 liegen.

Übung 2.6

Berechnen Sie anhand der unten gezeigten Verdünnungstiter den geometrischen mittleren Titer von Rekonvaleszenzantikörpern gegen Tularämie unter 10 Bewohnern von Marthas Weinberg. [Hinweis: Verwenden Sie nur die zweite Zahl im Verhältnis, d. H. Verwenden Sie für 1: 640 640.]

Verdünnungstiter
ICH WÜRDE # Akut Rekonvaleszent
1 1:16 1:512
2 1:16 1:512
3 1:32 1:128
4 nicht durchgeführt 1:512
5 1:32 1:1024
6 "Negativ" 1:1024
7 1:256 1:2048
8 1:32 1:128
9 "Negativ" 1:4096
10 1:16 1:1024

Kontrolliere deine Antworten

Auswahl der geeigneten Maßnahme

Messungen der zentralen Position sind Einzelwerte, die die beobachteten Werte einer Verteilung zusammenfassen. Der Modus liefert den gebräuchlichsten Wert, der Median liefert den zentralen Wert, der arithmetische Mittelwert liefert den Durchschnittswert, der Mittelbereich liefert den Mittelpunktwert und der geometrische Mittelwert liefert den logarithmischen Mittelwert.

Der Modus und der Median sind als beschreibende Maßnahmen nützlich. Sie werden jedoch nicht oft für weitere statistische Manipulationen verwendet. Im Gegensatz dazu ist der Mittelwert nicht nur ein gutes beschreibendes Maß, sondern weist auch gute statistische Eigenschaften auf. Der Mittelwert wird am häufigsten für zusätzliche statistische Manipulationen verwendet.

Während das arithmetische Mittel das Maß der Wahl ist, wenn Daten normal verteilt sind, ist der Median das Maß der Wahl für Daten, die nicht normal verteilt sind. Da epidemiologische Daten in der Regel nicht normal verteilt sind (Inkubationszeiten, Dosen, Alter der Patienten), wird häufig der Median bevorzugt. Das geometrische Mittel wird am häufigsten für Labordaten verwendet, insbesondere für Verdünnungstiter oder -assays und Umweltproben.

Das arithmetische Mittel verwendet alle Daten, wodurch es für Ausreißer empfindlich wird. Obwohl das geometrische Mittel auch alle Daten verwendet, ist es für Ausreißer nicht so empfindlich wie das arithmetische Mittel. Der Mitteltonbereich, der auf den Minimal- und Maximalwerten basiert, reagiert empfindlicher auf Ausreißer als alle anderen Kennzahlen. Der Modus und der Median werden in der Regel nicht von Ausreißern beeinflusst.

Zusammenfassend ist jedes Maß für die zentrale Position - Modus, Median, Mittelwert, Mitteltöner und geometrischer Mittelwert - ein einzelner Wert, der zur Darstellung aller beobachteten Werte einer Verteilung verwendet wird. Jede Maßnahme hat ihre Vor- und Nachteile. Die Auswahl der am besten geeigneten Kennzahl erfordert eine Beurteilung auf der Grundlage der Merkmale der Daten (z. B. normalverteilt oder verzerrt, mit oder ohne Ausreißer, arithmetische oder logarithmische Skala) und des Grunds für die Berechnung der Kennzahl (z. B. zu beschreibenden oder analytischen Zwecken). .

Übung 2.7

Identifizieren Sie für jede der unten aufgeführten Variablen aus der Zeilenliste in Tabelle 2.9, welches Maß für die zentrale Position für die Darstellung der Daten am besten geeignet ist.

  • Modus
  • Median
  • Bedeuten
  • Geometrisches Mittel
  • Kein Maß für die zentrale Lage ist angemessen

________ 6. Diagnosejahr

________ 7. Alter (Jahre)

________ 8. Sex

________ 9. Höchster IFA-Titer

________ 10. Thrombozyten x 106 / L.

________ 11. Anzahl weißer Blutkörperchen x 109 / l

Tabelle 2.9 Linienliste für 12 Patienten mit humaner monozytotroper Ehrlichiose - Missouri, 1998–1999

Tabelle 2.9 Linienliste für 12 Patienten mit humaner monozytotroper Ehrlichiose - Missouri, 1998–1999
Patienten ID Jahr der Diagnose Alter Jahre) Sex Höchster IFA * -Titer Thrombozyten x 106 / L. Anzahl weißer Blutkörperchen x 109 / l
01 1999 44 M. 1:1024 90 1.9
02 1999 42 M. 1:512 114 3.5
03 1999 63 M. 1:2048 83 6.4
04 1999 53 F. 1:512 180 4.5
05 1999 77 M. 1:1024 44 3.5
06 1999 43 F. 1:512 89 1.9
10 1998 22 F. 1:128 142 2.1
11 1998 59 M. 1:256 229 8.8
12 1998 67 M. 1:512 36 4.2
14 1998 49 F. 1:4096 271 2.6
15 1998 65 M. 1:1024 207 4.3
18 1998 27 M. 1:64 246 8.5
Bedeuten: 1998.5 50.92 n / a 1:976.00 144.25 4.35
Median: 1998.5 51 n / a 1:512 128 3.85
Geometrisches Mittel: 1998.5 48.08 n / a 1:574.70 120.84 3.81
Modus: keiner keiner M. 1:512 keiner 1.9, 3.5

* Immunfluoreszenz-Assay

Datenquelle: Olano JP, Masters E, Hogrefe W, Walker DH. Humane monocytotrope Ehrlichiose, Missouri. Emerg Infect Dis 2003; 9: 1579 & ndash; 86.

Kontrolliere deine Antworten

Vorherige Seite Lektion 2 Übersicht