Session 3 – Statistische und deskriptive Analytik
Einführung in die Datenanalyse für Anfänger
Laut McKinsey sind Unternehmen, die datengestützte Entscheidungen treffen, 23-mal häufiger in der Lage, neue Kunden zu gewinnen – und 9-mal häufiger, sie zu halten – als ihre Mitbewerber. Aber um diese klugen Entscheidungen zu treffen, musst du zunächst aussagekräftige Erkenntnisse aus deinen Daten gewinnen. Genau dafür ist die statistische Analyse da.
In dieser Sitzung lernst du, wie du grundlegende statistische Konzepte auf deinen Datensatz anwendest, um Trends aufzudecken, Problembereiche zu identifizieren und sichere, datengestützte Entscheidungen zu treffen – alles mit einfachen Tools in Google Sheets.
Wir verwenden weiterhin den Amazon-Verkaufsdatensatz als Beispiel, den du in der ersten Sitzung heruntergeladen und in Google Sheets importiert hast. Falls nicht, folge dem obigen Link zum Herunterladen.
Schritt 1: Mit den richtigen Geschäftsfragen beginnen
Bevor du Zahlen berechnest, ist es wichtig, deinen Datensatz mit einer unternehmerischen Denkweise anzugehen. Einfache Statistiken ohne Zweck zu berechnen führt zu unnützlichen Erkenntnissen.
Für den Amazon-Verkaufsdatensatz sind hier einige relevante Geschäftsfragen, die du in Betracht ziehen könntest:
-
Which product categories are the most popular among customers?
-
Welche Produktkategorien sind bei den Kunden am beliebtesten?
-
Was sind die minimalen, maximalen und durchschnittlichen Preise der Produkte?
-
Haben die angebotenen Rabatte einen Einfluss auf die Kundenzufriedenheit?
-
Welche Produkte erhalten schlechte Kundenbewertungen, und warum?
-
Welche Produkte entwickeln sich gut, und was können wir davon lernen?
Indem du diese Fragen durchdenkst, kannst du deine statistische Analyse auf die Bereiche konzentrieren, die für die unternehmerische Entscheidungsfindung wirklich wichtig sind.
Schritt 2: Dein Stats-Tabellenblatt vorbereiten
Um deine Analyse übersichtlich zu halten, erstelle ein neues Tabellenblatt in deiner Google-Sheets-Datei. Benenne dieses neue Blatt Stats. Hier wirst du deine wichtigsten statistischen Kennzahlen berechnen und dokumentieren.
Beginne damit, Spaltenüberschriften im Stats-Blatt zu erstellen:
| Kennwerte | Wert |
|---|---|
| Mindestbewertung | (Ergebnis der Formel) |
| Maximalbewertung | (Ergebnis der Formel) |
| Durchschnittsbewertung | (Ergebnis der Formel) |
Schritt 3: Mindest-, Höchst- und Durchschnittsbewertungen berechnen
Let’s begin by analyzing the customer ratings from your Amazon dataset. The ratings are located in Column G of your main data sheet.
Um die Mindestbewertung zu berechnen:
-
Gib im Stats-Blatt unter „Wert” neben „Mindestbewertung” ein:
=MIN(Amazon!G:G) -
Drücke Enter.
Dies zeigt die niedrigste Kundenbewertung über alle Produkte hinweg an.
Um die Höchstbewertung zu berechnen:
-
Gib in der nächsten Zeile unter „Wert” ein:
=MAX(Amazon!G:G) -
Drücke Enter.
Dies zeigt die höchste Bewertung, die einem Produkt gegeben wurde.
Um die Durchschnittsbewertung zu berechnen:
-
Gib in der folgenden Zeile ein:
=AVERAGE(Amazon!G:G) -
Drücke Enter.
Dies gibt dir die gesamte Durchschnittsbewertung über alle Produkte hinweg.
Zum Beispiel könnte es sein, dass die Mindestbewertung 2, das Maximum 5 und der Durchschnitt ungefähr 4,1 beträgt. Diese Zahlen geben dir bereits einen Eindruck davon, wie deine Produkte aus der Kundenperspektive abschneiden.
Schritt 4: Variabilität mit der Standardabweichung messen
Durchschnittswerte allein erzählen nicht die ganze Geschichte. Du möchtest auch wissen, wie stark die einzelnen Bewertungen vom Durchschnitt abweichen. Das nennt sich Standardabweichung, und sie hilft dir zu verstehen, wie konsistent oder gestreut deine Bewertungen sind.
Um die Standardabweichung zu berechnen:
-
Gib im Stats-Blatt in der nächsten freien Zeile ein:
=STDEV(Amazon!G:G) -
Drücke Enter.
Eine niedrige Standardabweichung bedeutet, dass die meisten deiner Produktbewertungen nah am Durchschnitt liegen. Eine hohe Standardabweichung deutet darauf hin, dass es große Unterschiede gibt – einige Produkte schneiden deutlich besser oder schlechter ab als andere.
Wenn zum Beispiel deine Standardabweichung klein ist und die Durchschnittsbewertung 4,1 beträgt, kannst du sicher sein, dass die meisten Produkte nahe an dieser Zahl bewertet werden.
Schritt 5: Schlecht bewertete Produkte identifizieren
Es ist wichtig zu wissen, welche Produkte schlechte Bewertungen erhalten haben, damit Maßnahmen ergriffen werden können, um sie zu verbessern.
So gehst du vor:
-
Geh zu deinem Amazon-Verkaufsdatensatz-Blatt.
-
Wähle den gesamten Datensatz aus.
-
Klicke auf Daten → Bereich sortieren → Erweiterte Bereichssortierungsoptionen.
-
Stelle sicher, dass „Daten haben eine Kopfzeile” aktiviert ist.
-
Sortiere nach Bewertung (Spalte G) von A bis Z.
Dadurch werden die Produkte mit den niedrigsten Bewertungen an den Anfang deines Blatts gebracht.
Du kannst jetzt zum Beispiel sehen, wie viele Produkte eine Bewertung von 2 oder 2,5 erhalten haben, und ob diese schlecht bewerteten Produkte Einzelfälle sind oder Teil eines größeren Musters.
Um diese schlecht bewerteten Produkte zu zählen:
-
Wähle die Zellen mit einer Bewertung von 2 bis 2,9 aus.
-
Schau dir die Anzahl an, die unten rechts in Google Sheets angezeigt wird.
Du kannst dies für Produkte mit Bewertungen von 3 wiederholen, um Produkte zu untersuchen, die möglicherweise Verbesserungsbedarf haben, aber nicht so schlecht abschneiden wie die mit den niedrigsten Bewertungen.
Schritt 6: Zusammenhänge mit Korrelation erkunden
Über einzelne Statistiken hinaus kannst du untersuchen, wie verschiedene Faktoren in deinem Datensatz miteinander zusammenhängen. Du könntest dich zum Beispiel fragen:
Führt ein höherer Rabatt zu besseren Kundenbewertungen?
So überprüfst du den Zusammenhang zwischen Rabatten und Bewertungen mithilfe der CORREL-Funktion.
Um die Korrelation zwischen Rabatt und Bewertung zu berechnen:
-
Gib im Stats-Blatt ein:
=CORREL(Amazon!F:F, Amazon!G:G) -
Drücke Enter.
Das Ergebnis ist eine Zahl zwischen -1 und 1:
-
Ein Wert nahe 1 zeigt einen starken positiven Zusammenhang – wenn eine Größe steigt, steigt auch die andere.
-
Ein Wert nahe -1 deutet auf einen starken negativen Zusammenhang hin – wenn eine Größe steigt, sinkt die andere.
-
Ein Wert nahe 0 zeigt wenig oder keinen Zusammenhang zwischen den beiden an.
In unserem Fall erhältst du eine Korrelation von -0,15. Das deutet darauf hin, dass es in deinem Datensatz keinen signifikanten Zusammenhang zwischen Rabatten und Kundenbewertungen gibt. Das bedeutet, dass das bloße Anbieten von Rabatten offenbar keinen Einfluss darauf hat, wie Kunden die Produkte bewerten.
Schritt 7: Wichtigste Erkenntnisse
Mit nur wenigen einfachen Formeln hast du eine grundlegende, aber wirkungsvolle statistische Analyse durchgeführt:
✔ Du hast Minimum, Maximum und Durchschnittsbewertungen berechnet, um die Produktleistung zu bewerten.
✔ Du hast die Standardabweichung verwendet, um die Variabilität in der Kundenzufriedenheit zu verstehen.
✔Du hast schlecht bewertete Produkte identifiziert, die möglicherweise Aufmerksamkeit erfordern.
✔ Du hast potenzielle Zusammenhänge zwischen Rabatten und Kundenbewertungen untersucht.
Statistische Analyse verwandelt Rohdaten in umsetzbare Geschäftserkenntnisse. Selbst mit einfachen Tools wie Google Sheets kannst du bedeutungsvolle Fragen beantworten und Entscheidungsprozesse lenken.
Was kommt als Nächstes?
In der kommenden Session tauchen wir tiefer in den Datensatz ein, mithilfe der explorativen Datenanalyse (EDA). Du lernst, wie du deine Daten visuell erkundest, um versteckte Muster, Ausreißer und Trends aufzudecken.
Contact
Talk to us
Have questions? We’re here to help! Whether you’re curious to learn more, want guidance on applying, or need insights to make the right decision—reach out today and take the first step toward transforming your career.