Schlagwörter
Skills
- Big Data Analytics & Business Intelligence (Spark, SQL, NoSQL, Excel, div. Visualisierungstools, Jupyter Notebooks)
- Data Science, Zeitreihen, Machine Learning Engineering (Python, Java, Pandas, Scikit Learn, Tensorflow, PyTorch)
- Vollständige Planung und Implementierung von Data Science Projekten (Problemformulierung, Zielsetzung, Fachkommunikation, Durchführung, Evaluation, Monitoring und Wartung)
- Umsetzung komplexer ETL Jobs und Datentransformationen (Batch- und Online-Processing), Realtime Datastream Processing
- Sonstige Kenntnisse (unvollständige Liste): C++, Javascript, Flutter, React JS, Git, Docker, Apache Kafka, Apache Hive, Hadoop Map Reduce, Bash, Python Flask, REST API, Scrum, Amazon Web Services, Google Cloud, Redis, MySQL, PostgreSQL, MongoDB, Apache Cassandra
Projekthistorie
Entwurf und Umsetzung einer Data Warehouse Infrastruktur in der Google Cloud. Erstellen von ETL Jobs um unstrukturierte Daten leicht analysierbar zu machen. Analyse und visuelle Aufbereitung historischer Geschäftsdaten.
Verwendete Technologien: Python Machine Learning Stack (Pandas, Scikit Learn), Google Cloud, Google Big Query, MySQL, Apache Spark
Konzeption, Koordination und Implementierung eines Real Time Bidding Systems für Online Marketing zur Vorhersage von Klick- und Conversionwahrscheinlichkeiten. Hierfür wurden diverse spezialisierte Echtzeit Machine Learning Algorithmen mit unterschiedlichen Zielsetzungen entwickelt und in den Live-Betrieb übernommen.
Verwendete Technologien: Apache Hadoop, Apache Hive, Apache Spark, Redis, PostgresQL, Python Machine Learning Stack bestehend aus Pandas, Scikit-Learn und C++ (zur Beschleunigung einzelner Python-Programmteile).
Planung und Implementierung einer Business Intelligence Reporting Pipeline, inklusive prediktiver Funktionalität für die darauffolgenden Tage einer Woche.
Verwendete Technologien: Python Machine Learning Stack (Pandas, Scikit Learn), AWS Redshift, AWS, MySQL.
Reisebereitschaft
Sonstige Angaben
Planung, Koordination und Umsetzung von Big Data Analytics Projekten:
Kommunikation, Zielformulierung, Datenbeschaffung und Aufbereitung (ETL), Sicherstellung einer soliden Datenqualität, zuverlässiger Betrieb der Analyse-Prozesse, Visualisierung und Reporting zur sicheren & schnellen Beurteilung von Analyse-Ergebnissen. Herstellerunabhängige Beratung zur Auswahl von Softwares und Tools mit dem besten Kosten-Nutzen Verhältnis für den Kunden.
Data Science / Machine Learning Engineering
Vollständige Umsetzung des sogenannten Data Science Prozesses. Dieser gliedert sich in folgende Schritte:
- Problemidentifizierung (erfordert Einbindung verantwortlicher Stakeholder)
- Unmissverständliche Zielformulierung und Planung (erfordert Einbindung verantwortlicher Stakeholder)
- Datenbeschaffung, -aufbereitung, -transformation, -bereinigung
- Modellierung und/oder ermitteln des passenden Vorhersagealgorithmus, Objektive Performance Evaluation
- Implementierung in den Live-Betrieb / Deployment
- Monitoring und Maintenance