Session 1 - Datensammlung

Einführung in die Datenanalyse für Anfänger

Daten sind die Grundlage jeder modernen Geschäftsentscheidung. Ob ein Unternehmen ein neues Produkt auf den Markt bringt, die Kundenzufriedenheit analysiert oder die Verkaufsleistung optimiert, diese Entscheidungen basieren auf einer Sache: Erkenntnissen, die aus Daten gewonnen werden. Doch Rohdaten an sich sind oft unordentlich, überwältigend und schwer zu interpretieren. Genau hier spielt Datenanalyse eine entscheidende Rolle und genau hier beginnt deine Reise als zukünftiger Datenanalyst.

In diesem ersten Modul des Kurses Einführung in die Datenanalyse für Anfänger wirst du lernen, wie man reale Daten mithilfe zuverlässiger Quellen sammelt. Wir werden mit dem Amazon-Verkaufsdaten-Set für eine Analyse arbeiten und dir damit eine praktische Grundlage für ein praxisorientiertes Lernen geben. Dies ist der erste Schritt beim Aufbau deines ganz eigenen Datenanalyse-Portfolio-Projekts, das deine Fähigkeit zeigen wird, Analysetechniken auf reale Geschäftsprobleme anzuwenden.

Datensammlung

Warum Datenanalyse im Jahr 2026 lernen?

 

Die Nachfrage nach Fachkräften im Bereich Datenanalyse wächst in einem beispiellosen Tempo. Es wird erwartet, dass der globale Datenmarkt bis 2031 ein Volumen von über 285 Milliarden Dollar überschreiten wird, wodurch Datenkompetenz zu einer der wertvollsten Fähigkeiten auf dem Arbeitsmarkt wird. Datenanalyse heute zu lernen ist nicht nur ein kluger Karriereschritt – es ist eine Möglichkeit, deine berufliche Zukunft abzusichern.

Dieser Kurs wurde für Anfänger entwickelt, die selbst ohne technischen Hintergrund, ein solides Verständnis von Datenanalyse aufbauen möchten, Am Ende dieser Tutorial-Reihe wirst du in der Lage sein, deine Fähigkeiten selbstbewusst, mithilfe von Tools wie Google Sheets und vertrauenswürdigen Open-Source-Datensätzen, auf reale Geschäftsprobleme anzuwenden.

 

Verständnis der Datenanalyse-Pipeline

In diesem Kurs wirst du die vollständige Datenanalyse-Pipeline durchlaufen, die die folgenden Schritte umfasst:

Zuerst wirst du lernen, wie man Daten aus zuverlässigen Quellen sammelt. Danach wirst du die Daten bereinigen, um Unreinheiten und Fehler zu entfernen. Anschließend wirst du deskriptive und explorative Analysen anwenden, um Muster und Trends zu entdecken. Danach wirst du deine Ergebnisse mithilfe von Diagrammen und Grafiken visualisieren. Schließlich wirst du deine Erkenntnisse durch klares Storytelling, mit Fokus auf die geschäftlichen Auswirkungen der Datenanalyse, präsentieren.

Alle diese Schritte werden auf einen realen Datensatz angewendet, damit du praxisnahe Erfahrungen sammelst, die in deinem Portfolio aufgenommen werden können.

Schritt 1: Sammeln von realen Daten für die Analyse

Bevor du Daten analysieren kannst, musst du sie finden. Glücklicherweise gibt es vertrauenswürdige Plattformen, auf denen du hochwertige, kostenlose Datensätze abrufen kannst. Eine der beliebtesten Ressourcen sowohl für Anfänger als auch für erfahrene Analysten ist Kaggle, eine globale Plattform für Data-Science-Wettbewerbe, Lernressourcen und eine umfangreiche Sammlung mit offenen Datensätzen.

Wenn du auf Kaggle nach einem Datensatz suchst, solltest du immer einige wichtige Details überprüfen. Schau dir an, wer den Datensatz hochgeladen hat und ob diese Person ein verifizierter, aktiver Mitwirkender ist. Achte darauf, wie viele Menschen den Datensatz heruntergeladen oder mit diesem interagiert haben. Du solltest außerdem prüfen, wann der Datensatz zuletzt aktualisiert wurde und wie gut er beschrieben ist. Ein gut dokumentierter Datensatz mit klaren Beschreibungen und einer klaren Struktur ist für Anfänger immer vorzuziehen.

Für diesen Kurs werden wir das Amazon-Verkaufsdaten-Set verwenden. Dieser Datensatz, der ursprünglich auf Kaggle verfügbar war (du kannst ihn dir hier ansehen, wenn du möchtest), enthält Informationen wie Produktnamen, Kategorien, Preise, Rabatte, Kundenbewertungen und Rezensionen. Mit über 1.465 Datenpunkten bietet dieser Datensatz genügend Komplexität, um aussagekräftige Analysen durchzuführen und bleibt gleichzeitig zugänglich für Personen, die neu in der Datenanalyse sind.

Importieren des Amazon Sales Datasets in Google Sheets

Sobald du den Datensatz aus dem oben genannten Lumen-GitHub-Repository heruntergeladen hast, musst du ihn in ein Tool importieren, das eine einfache Bearbeitung und Analyse ermöglicht. Für diesen Kurs empfehlen wir Google Sheets, was kostenlos ist – perfekt für Anfänger.

Um deinen Datensatz in Google Sheets zu importieren, folge diesen Schritten:

Melde dich zuerst in deinem Google-Konto an und öffne Google Sheets. Gehe anschließend zum Menü „Datei“, wähle „Importieren“ aus und lade die CSV-Datei hoch, die du von Kaggle heruntergeladen hast. Stelle sicher, dass der Dateityp als Datei mit komma-separierten Werten erkannt wird. Falls du dir unsicher bist, kannst du die Funktion zur automatischen Erkennung verwenden.


Sobald der Datensatz importiert wurde, nimm dir einen Moment Zeit, um deine Tabelle in etwas Aussagekräftiges umzubenennen, zum Beispiel: „Amazon Sales Data“. Überprüfe den Datensatz, um sicherzustellen, dass alle erwarteten Spalten vorhanden sind. Du solltest Produkt-IDs, Produktnamen, Kategorien, tatsächliche und reduzierte Preise, Rabatteprozente, Bewertungen, die Anzahl der Rezensionen sowie zusätzliche Informationen wie Produktlinks sehen.


Durch das Abschließen dieses Schrittes hast du deinen Datensatz erfolgreich gesammelt und für die Analyse vorbereitet — der erste Baustein des realen Datenanalyseprojekts.

Über das Arbeiten mit Daten hinausdenken: Geschäftliche Auswirkungen und Reflexion

Technische Fähigkeiten sind für jeden Datenanalysten essentiell, aber was dich wirklich hervorhebt, ist die Fähigkeit, deine Analyse mit realen Geschäftsergebnissen zu verbinden. Jeder Datensatz, mit dem du arbeitest, sollte mit klaren Geschäftsfragen verknüpft sein.
Wenn du dir das Amazon Sales Dataset ansiehst, stelle dir folgende Fragen:

  • Welche Produkte erzielen die beste Verkaufsleistung?

  • Wie beeinflussen Rabatte das Kaufverhalten der Kunden?

  • Welche Muster existieren bei den Bewertungen der Kundenzufriedenheit?

  • Wie können diese Daten dabei helfen, Produktangebote oder Preisstrategien zu verbessern?

Indem du deine Analyse konsequent mit den geschäftlichen Auswirkungen der Datenanalyse verbindest, zeigst du nicht nur technische Fähigkeiten, sondern auch strategisches Denken — ein wichtiger Unterschied für jeden, der in das Feld der Datenanalyse einsteigt.

 

Nächste Schritte

Im nächsten Modul dieses Kurses Learn Data Analytics with Real-World Project wirst du dich mit der Datenbereinigung beschäftigen, bei der du lernen wirst, wie man einen Datensatz für eine genaue und zuverlässige Analyse vorbereitet, indem Fehler und Unreinheiten entfernt werden.

 

Bevor du weitermachst, nimm dir ein paar Minuten Zeit, um deinen Datensatz in Google Sheets zu erkunden. Mache dich mit der Struktur vertraut, überprüfe die Spalten und beginne darüber nachzudenken, welche Arten von Erkenntnissen du gewinnen könntest, um Geschäftsentscheidungen zu unterstützen.

Contact

Talk to us

Have questions? We’re here to help! Whether you’re curious to learn more, want guidance on applying, or need insights to make the right decision—reach out today and take the first step toward transforming your career.