Mission: Einen globalen Data Lake from-scratch zu designen und zu
implementieren.
Zu Beginn gab es nur die Idee, ein System zur Verfügung zu stellen, welches
vor allem den Kunden erweiterte Analysemöglichkeiten bieten sollte. Dies alles
geschah in einer neu gegründeten Division. Das heißt, das Leistungsspektrum
reichte von organisatorischen Aufgaben, über Prozessdefinitionen, Team-
Aufbau und Use-Case Definition und -Alignment bis hin zur Erarbeitung der
Daten- und Systemarchitektur und Erstellung von PoC’s. Im Laufe der
Coronakrise und der Betrugsaufdeckung richtete sich das Hauptaugenmerk
auf interne betriebswirtschaftliche Kennzahlen und Unterstützung des
Controllings.
Verwendete Technologien: Cloudera auf einer Hadoop Platform, Python,
Scala, Streaming Technologien (v.a. Kafka) u.v.m.