In diesem Projekt wurden über 4,5 Millionen Uber-Fahrten aus dem Zeitraum April bis September 2014 in New York City analysiert. Ziel war es, zeitliche und räumliche Nutzungsmuster sichtbar zu machen. Nach der Datenbereinigung wurden aus Zeitstempeln Merkmale wie Wochentag und Uhrzeit extrahiert. Anschließend erfolgte eine explorative Analyse mithilfe von Diagrammen, Heatmaps und Karten. Die Ergebnisse zeigen Stoßzeiten, Wochenendtrends und regionale Schwerpunkte der Fahrten und bieten einen umfassenden Überblick über das Mobilitätsverhalten in dieser Zeit.
In diesem Projekt wird ein Hotelbuchungs-Datensatz umfassend analysiert. Nach dem Einlesen und Bereinigen der Daten werden ungültige Buchungen entfernt, um nur gültige Gäste zu berücksichtigen. Anschließend werden verschiedene Aspekte untersucht, darunter die Herkunftsländer der Gäste, die mit interaktiven Diagrammen und Karten visualisiert werden. Es folgt ein Vergleich der Zimmerpreise nach Hoteltyp und Zimmerkategorie sowie deren Entwicklung im Jahresverlauf. Außerdem wird die Aufenthaltsdauer in Abhängigkeit vom Marktsegment und Hoteltyp betrachtet. Weitere Analysen zeigen die Verteilung gebuchter Mahlzeiten und den Zusammenhang zwischen Sonderwünschen und Stornierungen. Schließlich werden Gästezahlen und Stornierungen für Resort- und City-Hotels gegenübergestellt, um Muster im Buchungsverhalten und Stornoverhalten zu erkennen.
Im Rahmen dieses Projekts wurden Amazon-Produktbewertungen aus einer SQLite-Datenbank geladen und mit Hilfe von Python und gängigen Bibliotheken wie Pandas, TextBlob und Seaborn analysiert. Der Schwerpunkt lag auf der Durchführung einer Sentimentanalyse der Bewertungstitel („Summary“), bei der mittels TextBlob die Polarität der Aussagen berechnet wurde, um zwischen positiven, neutralen und negativen Bewertungen zu unterscheiden. Auf Basis dieser Analyse wurden Wordclouds für positive und negative Zusammenfassungen erstellt, um häufig genutzte Begriffe visuell darzustellen. Darüber hinaus wurde das Nutzerverhalten analysiert, etwa durch Identifikation der aktivsten Rezensenten. Zusätzlich wurden Textdaten umfassend bereinigt durch Entfernen von Satzzeichen, Stopwörtern und URLs und mithilfe von Visualisierungen (u.a. Boxplots) hinsichtlich ihrer Länge und Verteilung ausgewertet. Ziel dieser Arbeit war es, ein besseres Verständnis über Kundenmeinungen und Bewertungsmuster zu gewinnen sowie Daten für weitere Analysen aufzubereiten.