Was sind die 5 Schritte der Deskriptive Statistik?

Deskriptive Statistik: Zusammenfassung von Datensätzen. Von Zielgruppe bis Stichprobe. ¡Entdecken Sie ihre Bedeutung hier!

12 ago 2023

Was sind die 5 Schritte der Deskriptive Statistik?
Was sind die 5 Schritte der Deskriptive Statistik?
Was sind die 5 Schritte der Deskriptive Statistik?

Sie kommen mit Statistik nicht zurecht? OK, keine Sorge, wir können nicht alle gut in Mathe sein... Aber was wäre, wenn wir Ihnen sagen würden, dass die deskriptive Statistik Ihnen helfen kann, Marktanalysen zu erstellen und eine Menge daraus zu machen? Und nein, Sie müssen kein Matheexperte sein, wir sind es auch nicht.

Wollen Sie lernen, wie Sie diese Art der Statistik nutzen können, um den Markt Ihres Unternehmens zu verstehen? Dann probieren Sie es aus und lesen Sie weiter.

Was sind deskriptive Statistiken?

Deskriptive Statistiken sind kurze, aussagekräftige Kennzahlen, die einen bestimmten Datensatz zusammenfassen. Dabei kann es sich um eine Repräsentation Ihrer gesamten Zielgruppe oder, etwas technischer ausgedrückt, um eine Stichprobe einer Grundgesamtheit handeln. 

Deskriptive Statistiken werden in Maße der zentralen Tendenz und Maße der Variabilität unterteilt. Zu den Maßen der zentralen Tendenz gehören der Mittelwert, der Median und der Modus, während zu den Maßen der Variabilität die Standardabweichung, die Varianz, das Minimum und das Maximum der Variablen sowie andere komplexere Maße gehören.

Verständnis der deskriptiven Statistik

Deskriptive Statistiken helfen uns, die Merkmale eines bestimmten Datensatzes zu beschreiben und zu verstehen, indem sie kurze Zusammenfassungen der Stichproben und Maße der Daten liefern. 

Die bekanntesten Arten der deskriptiven Statistik sind Maße: 

  • Der Mittelwert.

  • Der Median.

  • Der Modus. 

Sie werden auf fast allen Ebenen der Mathematik und Statistik verwendet. Der Mittelwert oder Durchschnitt wird berechnet, indem alle Zahlen des Datensatzes addiert und dann durch die Anzahl der Zahlen des Satzes geteilt werden.

Der Mittelwert ist 4 (20/5). Der Modus eines Datensatzes ist der am häufigsten vorkommende Wert und der Median ist die Zahl in der Mitte des Datensatzes. 

Er ist der Wert, der den höchsten und den niedrigsten Wert innerhalb eines Datensatzes trennt. Es gibt jedoch auch weniger gebräuchliche Arten der deskriptiven Statistik, die dennoch sehr wichtig sind, auf die wir aber jetzt nicht eingehen werden.

Deskriptive Statistik vs. inferentielle Statistik

Deskriptive Statistiken haben eine andere Funktion als inferentielle Statistiken. Wenn Sie unseren früheren Artikel zu diesem Thema gelesen haben, erinnern Sie sich vielleicht daran. Einzeln betrachtet liefern sie interessante Daten, aber zusammen sind sie ein hervorragendes Instrument für die Entscheidungsfindung und die Umsetzung von Marketingstrategien.

Nehmen wir als Beispiel ein Unternehmen, das scharfe Soßen verkauft. Das Unternehmen sammelt Daten wie die Anzahl der Verkäufe, die durchschnittlich gekaufte Menge pro Transaktion und den durchschnittlichen Umsatz pro Wochentag. 

All diese Informationen sind beschreibend, da sie eine Geschichte darüber erzählen, was in der Vergangenheit tatsächlich passiert ist. 

In diesem Fall werden sie nur zu Informationszwecken verwendet, und wir sehen hier die volle Anwendung der deskriptiven Statistik.

Nehmen wir nun an, dasselbe Unternehmen möchte eine neue scharfe Soße auf den Markt bringen. Es sammelt dieselben Verkaufsdaten aus der Vergangenheit, nutzt die Informationen aber, um Vorhersagen über die Verkaufszahlen der neuen scharfen Soße zu treffen. Erinnern Sie sich an die Inferenzstatistik? Ja, genau das ist der Punkt, auf den wir hinauswollen.

Durch die Verwendung der beschreibenden Statistik und die Anwendung von Merkmalen auf einen anderen Datensatz wird dieser zu einer inferentiellen Statistik. 

Wir betrachten nicht mehr nur eine einfache Zusammenfassung von Daten, sondern verwenden sie, um vorherzusagen, was in Bezug auf einen anderen Datensatz passieren wird, der auf ein neues Produkt ausgerichtet ist.

Die Unterschiede zwischen den beiden

Deskriptive Statistiken sind ein wirksames Mittel zur Beschreibung der Merkmale eines Datensatzes, indem sie Zusammenfassungen über Stichproben von Daten erstellen. 

Diese Daten werden als eine Zusammenfassung der Daten dargestellt, die den Inhalt der gesammelten Informationen erklärt. 

Eine Volkszählung kann zum Beispiel deskriptive Statistiken über den Anteil von Männern und Frauen in einer bestimmten Stadt enthalten.

Sobald wir diese Informationen gesammelt haben, können wir Inferenzstatistiken anwenden, die aus den aus einer Stichprobe gewonnenen Daten erstellt werden und die eine Beziehung zu bestimmten Variablen aufweisen, um Schlussfolgerungen über diese Population zu ziehen. 

Man könnte sagen, dass es sich bei der deskriptiven Statistik um den theoretischen Teil handelt, während der andere Teil der praktischen Anwendung der Inferenzstatistik entspricht.

Was ist der Hauptzweck der deskriptiven Statistik?

Seien wir ehrlich, die deskriptive Statistik ist der langweiligste Teil des gesamten Marktanalyseprozesses. Und das haben wir uns nicht ausgedacht, sondern es gibt einen Beweis dafür. 

Schließlich besteht der Hauptzweck der deskriptiven Statistik darin, Informationen über eine Reihe von Daten zu liefern, so dass viel Forschungs- und Aufbereitungsarbeit zu leisten ist.

Bleiben wir beim Beispiel der scharfen Soße, denn ja, wir mögen scharfe Themen. Im Grunde sammelt man alle Daten, die man von einer Population hat, mit der man vielleicht schon interagiert hat, um eine Zusammenfassung aller Informationen zu erhalten.

Welche Arten von deskriptiven Statistiken gibt es?

Die drei wichtigsten Arten der deskriptiven Statistik sind die Häufigkeitsverteilung, die zentrale Tendenz und die Variabilität eines Datensatzes, aber wir sollten sie etwas genauer betrachten:

 

1. Häufigkeitsverteilung

Wird für quantitative und mengenmäßige Daten verwendet. Sie wird verwendet, um die Häufigkeit oder Anzahl der verschiedenen Ergebnisse in einem bestimmten Datensatz darzustellen.

  • Anzahl, Prozentsatz, Häufigkeit.

  • Zeigt, wie oft etwas vorkommt.

  • Verwenden Sie dies, wenn Sie zeigen möchten, wie oft eine Antwort gegeben wird.

 

2. Zentrale Tendenz

Es handelt sich um die beschreibende Zusammenfassung einer Gruppe von Daten, bei der ein einziger Wert verwendet wurde, der die Verteilung aller Daten widerspiegelt. 

  • Mittelwert, Median und Modus.

  • Ermittelt die Verteilung über mehrere Punkte.

  • Verwenden Sie dies, wenn Sie zeigen möchten, wie der Durchschnitt oder die am häufigsten angegebene Antwort aussieht.

 

3. Variabilität

Zusammenfassung, die den Grad der Streuung einer Stichprobe widerspiegeln soll und die Abweichung vom Zentrum aufzeigt.

  • Bereich, Varianz, Standardabweichung.

  • Identifiziert die Verteilung der Werte durch Angabe von Bereichen.

  • Bereich = hohe/niedrige Punkte.

  • Varianz oder Standardabweichung = Differenz zwischen der beobachteten Punktzahl und dem Mittelwert.

  • Wird verwendet, wenn Sie zeigen möchten, wie "gestreut" die Daten sind. Es ist nützlich zu wissen, wann Ihre Daten so weit gestreut sind, dass sie den Mittelwert beeinflussen.

Die 5 Schritte bei der Anwendung der deskriptiven Statistik

Der erste Schritt bei der Anwendung der deskriptiven Statistik ist in der Regel die Bestimmung der statistischen Daten, die Sie erhalten möchten, und der letzte Schritt ist die Bereitstellung der Daten in der richtigen Form. Aber was liegt zwischen diesen beiden Schritten? Lassen Sie uns Schritt für Schritt vorgehen.

1. Umfang der Stichprobe

Sie sollten eine mittlere bis große Stichprobe von Daten erheben. Darüber hinaus sind Stichproben mit mindestens 20 Beobachtungen in der Regel ausreichend, um die Verteilung Ihrer Daten darzustellen. 

Um die Verteilung am besten mit einem Histogramm darzustellen, empfehlen einige Praktiker jedoch mindestens 50 Beobachtungen. Größere Stichproben liefern auch genauere Schätzungen von Prozessparametern, wie z. B. Mittelwert und Standardabweichung.

2. Bestimmen Sie das Zentrum Ihrer Daten

Verwenden Sie den Mittelwert, um die Stichprobe mit einem einzigen Wert zu beschreiben, der den Mittelpunkt der Daten darstellt. Viele statistische Analysen verwenden den Mittelwert als Standardmaß für die Mitte der Datenverteilung.

Der Median ist ein weiteres Maß für die Mitte der Datenverteilung. Der Median ist in der Regel weniger von Ausreißern beeinflusst als der Mittelwert. Die Hälfte der Datenwerte ist größer als der Medianwert und die Hälfte der Datenwerte ist kleiner als der Medianwert.

Sowohl der Median als auch der Mittelwert messen die zentrale Tendenz. Ungewöhnliche Werte, so genannte Ausreißer, können den Median jedoch weniger beeinflussen als den Mittelwert. Wenn Ihre Daten symmetrisch sind, sind der Mittelwert und der Median ähnlich.

3. Beschreiben Sie die Verteilung der Daten

Verwenden Sie die Standardabweichung, um festzustellen, wie weit die Daten vom Mittelwert entfernt sind. Ein höherer Wert der Standardabweichung weist auf eine größere Streuung der Daten hin.

4. Beurteilen Sie die Form und das Ausmaß der Verteilung Ihrer Daten

Verwenden Sie das Histogramm, die Einzelwertdarstellung und das Boxplot, um die Form und Streuung der Daten zu beurteilen und mögliche Ausreißer zu identifizieren.

Untersuchen Sie die Streuung Ihrer Daten, um festzustellen, ob die Daten schief zu sein scheinen.

Wenn dies der Fall ist, befinden sich die meisten Daten auf der oberen oder unteren Seite des Diagramms. Schiefe Daten lassen sich oft leichter mit einem Histogramm oder einem Boxplot erkennen.

5. Vergleich von Daten aus verschiedenen Gruppen 

Wenn Sie eine Variable haben, die Gruppen in Ihren Daten identifiziert, können Sie diese verwenden, um Ihre Daten nach Gruppen oder Gruppenebene zu analysieren.

Beispiele für deskriptive Statistik

Durch die Erklärung kann nicht jeder verstehen, so dass wir, um alle möglichen Aspekte abzudecken, auch einige Beispiele bringen, die Ihnen helfen können.

1. Beispiel 1 

In einer Bildungseinrichtung wird die deskriptive Statistik auf die durchschnittliche Punktzahl aller Prüfungen eines bestimmten Fachs und einer bestimmten Note, z. B. Mathematik, der neuen Schüler angewandt. 

Wie Sie sehen, wird keine der erhaltenen Daten Aufschluss darüber geben, warum dieser Trend so ist, aber Sie können sehen, wie die deskriptive Statistik bei der Vereinfachung der Daten hilft.

2. Beispiel 2

Sie haben eine Umfrage unter Ihren Arbeitnehmern durchgeführt, um herauszufinden, welche Zeit für sie am angenehmsten ist, nämlich der Abend oder die Nacht, um herauszufinden, welche Arbeitszeiten im Allgemeinen am besten wären.

Sie haben nun eine Tabelle mit allen Ergebnissen, die jedoch nicht sehr informativ ist. Mithilfe einiger einfacher Formeln, die Sie verwenden können, wenn Sie über Excel-Kenntnisse verfügen, können Sie alle Daten mit einigen Grafiken und Tabellen effizient zusammenfassen, damit Sie die Daten besser erkennen können.

So können Sie mit Hilfe der deskriptiven Statistik feststellen, dass nur 24 % der Bevölkerung Ihres Unternehmens lieber nachts arbeiten, während der restliche Prozentsatz lieber abends arbeitet.  

Hier sehen Sie das Wesen der deskriptiven Statistik, aber denken Sie daran, dass es sich nicht um eine Analyse der Grundgesamtheit handelt, sondern nur um eine Zusammenfassung Ihrer Daten.

Kann man mit der deskriptiven Statistik Schlüsse ziehen oder Vorhersagen treffen?

Es sieht so aus, als hätten Sie nicht aufgepasst....

Nun, es schadet nie, ein wenig die Kenntnisse zu wiederholen, vor allem, wenn Sie die deskriptive Statistik als den theoretischen Teil betrachten, d. h. die langweilige Arbeit, d. h. das Sammeln von Informationen.

Während diese Daten Ihnen helfen können, die Eigenschaften der Daten zu verstehen, sind inferenzstatistische Verfahren, ein eigener Zweig der Statistik, erforderlich, um zu verstehen, wie die Variablen in einem Datensatz miteinander interagieren.

Für Ihre Marktanalyse, sei es die Einführung eines neuen Produkts und/oder einer neuen Dienstleistung, benötigen Sie im Grunde beides. Es bleibt Ihnen also nichts anderes übrig, als den Umgang mit diesen beiden Arten von Statistiken zu lernen.

Bedenken Sie jedoch, dass sich die deskriptive Statistik auf die Analyse, Zusammenfassung und Mitteilung von Ergebnissen bezieht, die einen Datensatz beschreiben. Diese Daten werden Ihnen also noch nicht helfen, Entscheidungen zu treffen.

Sie sind jedoch wertvoll, wenn es darum geht, Zusammenfassungen eines Datensatzes auf hoher Ebene zu erklären, wie z.B. Mittelwert, Median, Modus, Varianz, Bereich und Zählinformationen. Außerdem haben Sie die Grundlage, um mit diesen Analysen zu beginnen, wenn Sie die richtigen Techniken anwenden. 

Werden Sie Inferenzstatistischen verwenden, um Entscheidungen zu treffen? Wir empfehlen, beides zu verwenden, um das Beste aus beiden Welten zu haben.