Session 5 - Datenvisualisierung

Einführung in die Datenanalyse für Anfänger

Willkommen zu einem der wichtigsten Teile deiner Analysen-Reise: der Datenvisualisierung. Stell es dir so vor – Zahlen enthalten die Geschichte, aber Visualisierungen helfen dabei, diese Geschichte sichtbar zu machen und zu kommunizieren. Ohne Visualisierung bleiben Erkenntnisse oft in Tabellen und Zahlenreihen verborgen. Mit den richtigen Grafiken werden Muster erkennbar, Entscheidungen einfacher und deine Botschaft klar verständlich. Es gibt zwei wichtige Gründe, warum Datenvisualisierung zu den wichtigsten Werkzeugen eines Data Analysts gehört:

  1. Muster erkennen:
    Visualisierungen helfen dir dabei, Trends, Spitzen, Einbrüche und Ausreißer sofort zu erkennen, die in Tabellen nur schwer auffallen würden.

  2. Mit verschiedenen Teams kommunizieren:
    Deine Stakeholder – von Marketing bis Finanzen – sind vielleicht keine Datenexpert:innen. Diagramme schaffen eine gemeinsame visuelle Sprache, die Entscheidungen beeinflussen und zum Handeln motivieren kann.


Wir verwenden weiterhin den Amazon-Verkaufsdatenset als Beispiel, den du in der ersten Sitzung heruntergeladen und in Google Sheets importiert hast. Falls nicht, folge dem obigen Link zum Herunterladen.

 

Datenvisualisierung

Das Wichtigste zuerst – Das richtige Diagramm wählen

Nur weil ein Diagramm schön oder kompliziert aussieht, bedeutet das nicht, dass es auch effektiv ist. Nutze Visualisierungen, um Informationen klarer zu machen, nicht komplizierter.

Diagrammtyp Am besten für Vermeiden wenn…
Liniendiagramm Zeitreihentrends du nicht mit chronologischen Daten arbeitest
Säulen-/Balkendiagramm das Vergleichen von Werten über Kategorien hinweg zu viele Kategorien das Diagramm überladen
Histogram das Anzeigen der Verteilung (z.B Bewertungsbereiche) die Kategorien weder kontinuierlich noch nummeriert sind
Streudiagramm die Überprüfung der Korrelation zwischen zwei numerischen Feldern die Daten kategorial oder unkorreliert sind
Kreisdiagramm die Darstellung von Teil-Ganz-Verhältnissen (selten nützlich) Werte zu dicht beieinander liegen
Geodiagramm die Zuordnung von Werten nach Standorten keine Standortdaten verfügbar sind

 

Schritt für Schritt: Produktbewertungen visualisieren

1. Starte mit einer Business-Frage

Bevor du irgendein Diagramm erstellst, solltest du dich immer zuerst am geschäftlichen Kontext orientieren. In unserem Fall wollen wir folgende Frage beantworten:

Welche Produktkategorien erhalten die höchsten und niedrigsten Kundenbewertungen?

Das ist nicht nur eine visuelle Übung. Deine Analyse soll Entscheidungen unterstützen – zum Beispiel bei der Priorisierung von Lagerbeständen, der Verbesserung von Produktqualität oder dem Fokus auf zukünftige Marketingmaßnahmen.

 

2. Untersuche deine Rohdaten

Dein Datensatz enthält eine Spalte namens Category, aber es gibt ein Problem:

Jeder Wert sieht ungefähr so aus:

 
Home & Kitchen | Appliances | Electric Grinders

Das ist keine einzelne Kategorie, sondern eine Hierarchie: Hauptkategorie → Unterkategorie → spezifisches Produkt

Wenn du diese Rohdaten direkt visualisierst, erhältst du Hunderte von sehr spezifischen Kombinationen. Das Ergebnis?

  • Diagramme wirken überladen,
  • Muster sind schwer erkennbar,
  • Stakeholder werden verwirrt.

 

3. Bereinige die Daten: Extrahiere die Hauptkategorie

Um mehr Klarheit zu schaffen, vereinfachen wir die Daten. Die Erkenntnis, die wir suchen, liegt auf der Ebene der Hauptkategorien.

Dafür verwenden wir die Funktion SPLIT() in Google Sheets (oder Excel), um die Werte anhand des Pipe-Symbols (|), zu trennen und nur den ersten Teil – also die Hauptkategorie – zu extrahieren, z. B.: Home & Kitchen, Electronics, Toys & Games.

Formel:

=SPLIT(A2, "|")

Warum das wichtig ist:

  • Wir erhalten konsistente Hauptkategorien.

  • Die Komplexität wird reduziert – von über 200 spezifischen Gruppen auf etwa 8–10 aussagekräftige Kategorien.

  • Visualisierungen werden sauberer, verständlicher und hilfreicher.

Bewährte Vorgehensweise: Wenn du Daten visualisierst, solltest du zuerst herauszoomen, bevor du ins Detail gehst. Beginne mit einem breiten Überblick, um Muster zu erkennen. Falls nötig, kannst du später tiefer tauchen.

 

4. Erstelle eine Pivot-Tabelle zur Zusammenfassung der Daten

Jetzt, wo wir eine Spalte mit Hauptkategorien haben, möchten wir folgende Frage beantworten:

Wie hoch ist die durchschnittliche Bewertung jeder Hauptkategorie?

Dafür erstellen wir eine Pivot-Tabelle:

  • Gehe zu InsertPivot Table

  • Wähle dein bereinigtes Tabellenblatt als Datenquelle

  • Lege die Pivot-Tabelle in einem neuen Tabellenblatt an

Dann:

  • ReihenMain Category

  • WerteAverage Rating
    (Achte darauf, dass „DURCHSCHNITT“ und nicht „SUMME“ ausgewählt ist.)

Jetzt hast du eine Tabelle, die die durchschnittlichen Kundenbewertungen jeder Hauptkategorie zusammenfasst.

 

5. Erstelle dein erstes Diagramm

Markiere die Ergebnisse deiner Pivot-Tabelle und gehe zu:

Insert → Chart

Google Sheets schlägt automatisch einen Diagrammtyp vor. Wenn ein Säulendiagramm empfohlen wird, kannst du es zunächst verwenden – überprüfe aber, ob ein Balkendiagramm möglicherweise besser lesbar ist, besonders wenn die Kategorienamen lang sind.


Die verschiedenen Diagrammoptionen schauen wir uns im nächsten Abschnitt genauer an.

Lass uns visualisieren

📈 Liniendiagramm

Ein Liniendiagramm verbindet einzelne Datenpunkte mit einer Linie. Es eignet sich am besten, wenn deine Daten eine natürliche Reihenfolge haben – besonders wenn du Veränderungen über die Zeit verfolgst (Tage, Monate, Jahre usw.).


Beispiel:
Monatliche Verkäufe oder Kundensupport-Tickets über ein Quartal hinweg verfolgen.


Tipp:
Verwende keine Liniendiagramme für kategoriale Vergleiche. Wenn deine Daten nicht zeitbasiert sind, ist ein Säulendiagramm wahrscheinlich die bessere Wahl.

 

📊 Säulendiagramm vs. Balkendiagramm

  • Säulendiagramm: Vertikale Balken. Kann bei langen Kategorienamen schnell eng wirken.

  • Balkendiagramm: Horizontales Layout, das oft besser lesbar ist – besonders wenn die Beschriftungen lang sind.

Faustregel: Wenn du Beschriftungen drehen oder Text kürzen musst, solltest du vom Säulendiagramm zum Balkendiagramm wechseln.

Sortieren für mehr Klarheit: Sortiere nach durchschnittlicher Bewertung (absteigend). Das verbessert das Storytelling – dein Publikum sieht zuerst die „besten“ Ergebnisse.

 

◑ Kreisdiagramm

Kreisdiagramme werden oft verwendet, um zu zeigen, wie sich ein Ganzes in Teile aufteilt – zum Beispiel, welcher Prozentsatz des Gesamtumsatzes aus jeder Region stammt. Sie werden jedoch leicht falsch eingesetzt.


Einschränkungen:
Wenn es zu viele Segmente gibt oder die Unterschiede sehr klein sind, wird ein Kreisdiagramm schwer lesbar. Außerdem ist es schwierig, Winkel genau zu vergleichen.


Alternativen:
Verwende ein Balkendiagramm, wenn du Präzision und einfache Vergleiche möchtest. Nutze ein Kreisdiagramm nur dann, wenn du betonen möchtest, dass die Daten Teile eines Ganzen darstellen.

 

📉 Histogram

  • Zeigt die Verteilung einer Variable (z. B. Bewertungen).

  • Gut geeignet, um Schiefe zu erkennen: linksschief = viele niedrige Bewertungen; rechtsschief = überwiegend hohe Bewertungen

 

🔗 Streudiagramm

  • Verwende es, um Beziehungen zu analysieren. Versuche zum Beispiel, Discount % vs. Rating.

  • In unserem Fall zeigt das Streudiagramm keinen klaren Trend – Rabatt und Bewertung korrelieren nicht miteinander.

Interpretations-Tipp: Wenn die Punkte zufällig verteilt sind, gibt es keine Korrelation. Wenn sie eine Steigung bilden, stehen die Variablen in Beziehung.

 

🌍 Geodiagramm

  • Füge eine „Country“-Spalte ein, um geografische Daten zu simulieren.

  • Verwende ein Geo-Diagramm, um zu sehen, wie sich durchschnittliche Bewertungen zwischen Ländern unterscheiden.

  • Der Farbverlauf zeigt die Stimmung an: rot (niedrig) → grün (hoch)

Optional: Verwende Geo-Marker für zusätzlichen Kontext – Farbe + Größe = Stimmung + Häufigkeit.

 

Wann du nicht visualisieren solltest

Vermeide Visualisierungen, die:

  • dieselbe Erkenntnis wiederholen, die bereits gezeigt wurde
  • kleine Unterschiede dramatisch wirken lassen
    mehr verwirren als erklären

 

Goldene Regel: Jede Visualisierung sollte eine Frage beantworten, eine Entscheidung unterstützen oder ein Muster sichtbar machen.

 

Die Verteilung von Bewertungen verstehen

Ein Histogramm hilft dir zu verstehen, wie Daten über verschiedene Bereiche oder „Buckets“ verteilt sind. In diesem Fall betrachten wir die Verteilung der durchschnittlichen Produktbewertungen in unserem Datensatz.


Anstatt Kategorien zu vergleichen, richten wir unseren Fokus nun auf die Form der Daten. Sind die meisten Bewertungen um 4 und 5 gruppiert? Gibt es viele schlechte Bewertungen? Oder ist die Verteilung ausgeglichen?

 

Warum ist das wichtig?

Die Form deiner Daten zu verstehen, ist entscheidend, um verlässliche Schlussfolgerungen zu ziehen:
Eine normale (glockenförmige) Verteilung deutet auf Konsistenz und Zuverlässigkeit hin.

  • Eine rechtsschiefe Verteilung (langer Schwanz rechts) kann auf weit verbreitete Unzufriedenheit hinweisen.
  • Eine linksschiefe Verteilung (langer Schwanz links) spiegelt oft allgemein hohe Zufriedenheit mit gelegentlichen schlechten Bewertungen wider.

 

Das ist die Art von Nuance, die eine Tabelle nicht sichtbar macht – ein Histogramm hingegen sofort.

 

Schritt für Schritt: Das Histogramm der Bewertungen erstellen

  1. Gehe zu deinen bereinigten Bewertungsdaten – genauer gesagt zur Spalte mit den durchschnittlichen Bewertungen pro Produkt oder pro Kategorie.

  2. Wähle die Spalte mit diesen Bewertungen aus.

  3. EinfügenDiagramm
    Google Sheets schlägt möglicherweise automatisch ein Histogramm vor. Falls nicht:

    • Wechsel im Diagrammeditor den Diagrammtyp manuell zu Histogramm.

 

Wie liest du dieses Diagramm?

Sobald dein Histogramm erscheint, nimm dir einen Moment Zeit, um seine Form zu beobachten.


Nehmen wir an, dein Histogramm zeigt:

  • einen Höhepunkt zwischen 4.0–4.4 durchschnittlicher Bewertung
  • sehr wenige Produkte mit Bewertungen unter 3.5 oder über 4.8


Das nennt man eine normale Verteilung – eine ausgeglichene „Glockenkurve“. Die meisten Produkte werden gut bewertet, während nur wenige außergewöhnlich gut oder enttäuschend sind.

 

Schiefe erklärt

  • Rechtsschief: Wenn das Diagramm einen langen Schwanz rechts hat, mit vielen niedrigen Bewertungen (2er und 3er), könnte das auf tiefere Probleme hinweisen – schlechte Qualität, Lieferprobleme oder unerfüllte Erwartungen.

  • Linksschief: Ein langer Schwanz links mit vielen 5-Sterne-Bewertungen und wenigen 2ern/3ern kann auf überdurchschnittliche Leistung hinweisen – oder möglicherweise auf Bewertungsinflation.

Ein flaches Histogramm ohne klaren Höhepunkt könnte auf zu viel Rauschen hindeuten – vielleicht eine uneinheitliche Qualität oder ein Datensatz, der stärker segmentiert werden muss (z. B. nach Region oder Produkttyp).

 

Business Erkenntnis

Angenommen, dein Histogramm zeigt eine Häufung bei 4.2 und einige wenige Produkte bei 2.5. Das sagt dir:

  • Die meisten Kunden sind zufrieden – das ist großartig!
  • Aber einige Produkte könnten die Markenwahrnehmung verschlechtern – das sollte untersucht werden.

Du könntest nun entscheiden:

  • tiefer in die am schlechtesten bewerteten Produkte einzutauchen
  • Kundenfeedback zu lesen, um Schmerzpunkte zu verstehen
  • gezielte Verbesserungen oder strategische Änderungen zu empfehlen

 

Die Zusammenhänge zwischen Rabatt und Bewertungen untersuchen

Manchmal drehen sich die wichtigsten Fragen im Business nicht um Summen oder Durchschnittswerte – sondern um Zusammenhänge. Eine solche Frage ist:

„Führen höhere Rabatte zu besseren Bewertungen?“

Hier wird ein Streudiagramm nützlich. Ein Streudiagramm ermöglicht dir zu visualisieren, wie sich zwei kontinuierliche Variablen im Verhältnis zueinander bewegen. In unserem Fall:

  • X-Achse: Rabattprozentsatz
  • Y-Achse: Produktbewertung

Schritt für Schritt: Das Streudiagramm erstellen

  1. Wähle die zwei Spalten aus:

    • Eine mit discount_percent

    • Eine mit rating
      Das sind die zwei Variablen, deren Beziehung wir untersuchen möchten.

  2. Diagramm einfügenStreudiagramm

    Google Sheets schlägt möglicherweise automatisch ein Streudiagramm vor. Falls nicht, kannst du es manuell aus der Liste der Diagrammtypen auswählen.

 

Was du sehen wirst

Das Ergebnis ist eine Wolke aus Datenpunkten, die über das Diagramm verteilt sind. Wenn es einen klaren Aufwärts- oder Abwärtstrend gibt (eine sichtbare Steigung), könnte das auf eine Korrelation hinweisen.

In unserem Fall:

  • Die Punkte sind weit verstreut, ohne klares auf- oder absteigendes Muster.

  • Bewertungen variieren sowohl bei niedrigen als auch bei hohen Rabattbereichen.

  • Einige Produkte mit 0 % Rabatt erhielten trotzdem hohe Bewertungen.

  • Andere Produkte mit über 70 % Rabatt zeigten gemischte Bewertungen.

Was bedeutet das? (Praxisbezogene Erkenntnis)

Es gibt keine starke Korrelation zwischen Rabatt und Bewertung. Tatsächlich ist die Beziehung laut Streudiagramm nahezu nicht vorhanden.

Das deutet darauf hin, dass:

  • Kunden die Rabatte nicht einfach automatisch mit besseren Bewertungen belohnen.

  • Produktqualität, Nutzererfahrung oder Erwartungen wichtiger sein als Preisnachlässe könnten.

Erkenntnis für Analysten

Diese Art von Erkenntnis ist subtil, aber wirkungsvoll. Sagen zu können:

„Es gibt keine statistische Beziehung zwischen Rabattaktionen und Bewertungsleistung“
…hilft dabei, strategische Geschäftsentscheidungen zu treffen.

Anstatt blind Promotionen durchzuführen, könnte das Team:

  • Probleme bei der Produktqualität untersuchen
  • Produktbeschreibungen oder Liefererfahrung verbessern
  • Rabatte gezielter einsetzen – nicht als allgemeine Lösung

 

 

Bewertungen nach Ländern mit Geo-Diagrammen visualisieren

Warum geografische Visualisierungen verwenden?

Bis jetzt haben wir hauptsächlich mit produktbezogenen Erkenntnissen gearbeitet – Kategorien, Unterkategorien, Bewertungen und Rabatte analysiert. In einem realen Business-Kontext ist die geografische Lage jedoch eine der wertvollsten Dimensionen für Analysen. Zu verstehen, wie sich Kundenzufriedenheit zwischen Ländern unterscheidet, kann Unternehmen helfen, ihre Strategie an bestimmte Märkte anzupassen.


Nehmen wir an, wir möchten nun folgende Frage beantworten:

„Sind Kunden aus bestimmten Ländern zufriedener mit unseren Produkten als andere?“

Um das zu untersuchen, verwenden wir ein Geodiagramm – eine kartenbasierte Visualisierung, mit der du Werte (wie Bewertungen oder Umsatz) über geografische Regionen hinweg vergleichen kannst.

 

Schritt für Schritt: Ein Geo-Diagramm in Google Sheets erstellen

1. Stelle sicher, dass du geografische Daten hast

Bevor wir beginnen, benötigen wir eine Spalte in unserem Datensatz, die Ländernamen enthält. In diesem Beispiel haben wir manuell eine Country Spalte hinzugefügt und jede Kundenbewertung einem Land zugeordnet. In einem realen Datensatz könnten diese Informationen aus der Lieferadresse, dem Benutzerprofil oder der Rechnungsadresse stammen.

Hinweis: Die Daten hier sind hypothetisch und dienen nur zu Lernzwecken.

Du kannst diese Länderdaten aus dem Lumen github repository herunterladen.

 

2. Wähle deine Daten aus

Wähle die zwei Spalten aus:

  • Spalte A: Country

  • Spalte B: Rating

Diese Kombination signalisiert Google Sheets, dass wir durchschnittliche Bewertungen pro Land kartieren möchten.

3. Füge ein Geo-Diagramm ein

Nachdem die zwei Spalten ausgewählt sind:

  • Klicke auf Einfügen Diagramm
  • Ändere im Diagrammeditor den Diagrammtyp zu Geo-Diagramm.

Wenn deine Daten gültig sind (Ländernamen korrekt und konsistent geschrieben sind), erstellt Google Sheets automatisch eine Weltkarte, die jedes Land basierend auf seinem entsprechenden Wert (durchschnittliche Bewertung) hervorhebt.

 

Wie interpretiert man das Geo-Diagramm?

Die Karte wird mit einem Farbverlauf eingefärbt:

  • Länder mit höheren durchschnittlichen Bewertungen erscheinen dunkelgrün.

  • Länder mit durchschnittlichen oder mittleren Bewertungen erscheinen grau oder hellgrün.

  • Länder mit niedrigen durchschnittlichen Bewertungen erscheinen rot oder orange.

Dadurch kannst du regionale Unterschiede sofort erkennen. In unserem Beispieldiagramm beobachten wir:

  • Hohe durchschnittliche Bewertungen in Ländern wie:

    • 🇲🇽 Mexiko (4.8)

    • 🇸🇦 Saudi Arabien (5.0)

    • 🇵🇰 Pakistan (4.6)

  • Niedrige durchschnittliche Bewertungen in:

    • 🇨🇦 Kanada (3.2)

    • 🇨🇴 Kolumbien (3.0)

    • 🇩🇪 Deutschland (2.0)

 

Was sagt uns das?

Diese Visualisierung ist mehr als nur ein optischer Effekt. Sie kann echte Geschäftsentscheidungen beeinflussen. Hier ist wie:

  • Problemgebiete identifizieren
    Ein Land mit niedriger durchschnittlicher Bewertung (z. B. Deutschland mit 2.0) könnte auf Probleme mit Produktqualität, Lieferlogistik oder Kundenerwartungen in dieser Region hinweisen.

  • Marketing- oder Supportstrategie anpassen
    Wenn bestimmte Länder konstant hohe Bewertungen geben, könnte das auf einen guten Product-Market-Fit hindeuten. Diese Länder könnten deine Markenbotschafter sein. Länder mit niedrigen Bewertungen hingegen benötigen möglicherweise eine tiefere Untersuchung – vielleicht müssen Produktbeschreibungen lokalisiert oder Verpackungen kulturell angepasst werden.

  • Kundenverhalten nach geografischer Lage untersuchen
    Bestimmte Länder tendieren möglicherweise dazu, unabhängig vom Produkt niedrigere oder höhere Bewertungen zu vergeben – möglicherweise aufgrund kultureller Unterschiede im Bewertungsverhalten.

 

Wechsel zu einem marker-basierten Geo-Diagramm

Google Sheets bietet auch eine alternative Ansicht derselben Daten an, das sogenannte Geo-Diagramm mit Markern.

Zum Wechseln:

  • Klicke auf das Geo-Diagramm

  • Öffne den Diagrammeditor

  • Ändere den Diagrammtyp zu Geo-Diagramm mit Markern

 
Was ändert sich?
  • Jedes Land wird nun durch einen kreisförmigen Marker auf der Karte dargestellt.

  • Die Farbe des Markers repräsentiert die durchschnittliche Bewertung (wie zuvor).

  • Die Größe des Markers repräsentiert die Anzahl der Datenpunkte oder Beobachtungen, die zur Berechnung dieser Bewertung verwendet wurden.

Zum Beispiel könnte Deutschland einen kleinen roten Kreis haben – wenige Datenpunkte, aber niedrige durchschnittliche Bewertung.
Mexiko hingegen könnte einen großen grünen Kreis haben – viele Bewertungen und hohe Zufriedenheit.

 

Analysten-Tipp: Karten mit Vorsicht verwenden

Geo-Diagramme sind visuell sehr wirkungsvoll, sollten aber immer mit Kontext unterstützt werden. Ein Land mit nur einer einzigen Bewertung (positiv oder negativ) kann deine Wahrnehmung verzerren, wenn es nicht sorgfältig interpretiert wird.

Bewährte Vorgehensweise:

  • Zeige oder erwähne immer die Stichprobengröße, besonders wenn du deine Erkenntnisse den Entscheidungsträger präsentierst.

  • Kombiniere Geo-Diagramme mit Pivot-Tabellen oder zusammenfassende Statistiken, um sicherzugehen, dass du dich nicht zu sehr auf Ausreißer verlässt.

  • Achte auf Ländernamen, die von Google Sheets möglicherweise nicht erkannt werden (z. B. unterschiedliche Schreibweisen oder Abkürzungen wie „USA“ statt „United States“).

Zusätzliche praxisnahe Einzelhandelsszenarien

Szene Vorgeschlagenes Diagramm
Vergleich der Umsätze über Produktlinien hinweg Säulen-/Balkendiagramm
Bewertung der Kundenzufriedenheit nach Ländern Geo-Diagramm
Überwachung des täglichen Website-Traffics Liniendiagramm
Analyse der Verteilung von Transaktionsgrößen Histogram
Korrelation von Preis und Kundenbewertung Streudiagramm

Was kommt als Nächstes?

In der nächsten Sitzung gehen wir noch einen Schritt weiter: Wie du diese Visualisierungen in eine überzeugende Datenstory verwandelst.

Contact

Talk to us

Have questions? We’re here to help! Whether you’re curious to learn more, want guidance on applying, or need insights to make the right decision—reach out today and take the first step toward transforming your career.