Profilbild von Anonymes Profil, Big Data Analytics ,  Data Science , Machine Learning Engineering , Spark , Time Series / Zeitreihen
verfügbar

Letztes Update: 13.09.2022

Big Data Analytics , Data Science , Machine Learning Engineering , Spark , Time Series / Zeitreihen

Abschluss: Dr. rer. nat. / Diplom Mathematiker (TU Berlin)
Stunden-/Tagessatz: anzeigen
Sprachkenntnisse: chinesisch (verhandlungssicher) | deutsch (Muttersprache) | englisch (verhandlungssicher) | spanisch (verhandlungssicher)

Skills

  • Big Data Analytics & Business Intelligence (Spark, SQL, NoSQL, Excel, div. Visualisierungstools, Jupyter Notebooks)
  • Data Science, Zeitreihen, Machine Learning Engineering (Python, Java, Pandas, Scikit Learn, Tensorflow, PyTorch)
  • Vollständige Planung und Implementierung von Data Science Projekten (Problemformulierung, Zielsetzung, Fachkommunikation, Durchführung, Evaluation, Monitoring und Wartung)
  • Umsetzung komplexer ETL Jobs und Datentransformationen (Batch- und Online-Processing), Realtime Datastream Processing
  • Sonstige Kenntnisse (unvollständige Liste): C++, Javascript, Flutter, React JS, Git, Docker, Apache Kafka, Apache Hive, Hadoop Map Reduce, Bash, Python Flask, REST API, Scrum, Amazon Web Services, Google Cloud, Redis, MySQL, PostgreSQL, MongoDB, Apache Cassandra

Projekthistorie

01/2015 - 06/2016
Data Scientist, Data Engineering
Adrule GmbH (Marketing, PR und Design, < 10 Mitarbeiter)

Entwurf und Umsetzung einer Data Warehouse Infrastruktur in der Google Cloud. Erstellen von ETL Jobs um unstrukturierte Daten leicht analysierbar zu machen. Analyse und visuelle Aufbereitung historischer Geschäftsdaten.

 

Verwendete Technologien: Python Machine Learning Stack (Pandas, Scikit Learn), Google Cloud, Google Big Query, MySQL, Apache Spark


03/2013 - 10/2014
Machine Learning Engineer
MBR Targeting (Internet und Informationstechnologie, 10-50 Mitarbeiter)

Konzeption, Koordination und Implementierung eines Real Time Bidding Systems für Online Marketing zur Vorhersage von Klick- und Conversionwahrscheinlichkeiten. Hierfür wurden diverse spezialisierte Echtzeit Machine Learning Algorithmen mit unterschiedlichen Zielsetzungen entwickelt und in den Live-Betrieb übernommen.

 

Verwendete Technologien: Apache Hadoop, Apache Hive, Apache Spark, Redis, PostgresQL, Python Machine Learning Stack bestehend aus Pandas, Scikit-Learn und C++ (zur Beschleunigung einzelner Python-Programmteile).


05/2012 - 08/2014
Data Scientist
Hitfox GmbH (Internet und Informationstechnologie, 50-250 Mitarbeiter)

Planung und Implementierung einer Business Intelligence Reporting Pipeline, inklusive prediktiver Funktionalität für die darauffolgenden Tage einer Woche.

 

Verwendete Technologien: Python Machine Learning Stack (Pandas, Scikit Learn), AWS Redshift, AWS, MySQL.

 

Reisebereitschaft

Weltweit verfügbar
Einsatzort: 100% Remote (Vorort unter bestimmten Umständen unregelmäßig möglich)

Sonstige Angaben

Angebotene Dienstleistungen
Planung, Koordination und Umsetzung von Big Data Analytics Projekten:
Kommunikation, Zielformulierung, Datenbeschaffung und Aufbereitung (ETL), Sicherstellung einer soliden Datenqualität, zuverlässiger Betrieb der Analyse-Prozesse, Visualisierung und Reporting zur sicheren & schnellen Beurteilung von Analyse-Ergebnissen. Herstellerunabhängige Beratung zur Auswahl von Softwares und Tools mit dem besten Kosten-Nutzen Verhältnis für den Kunden.
Data Science / Machine Learning Engineering
Vollständige Umsetzung des sogenannten Data Science Prozesses. Dieser gliedert sich in folgende Schritte:
  1. Problemidentifizierung (erfordert Einbindung verantwortlicher Stakeholder)
  2. Unmissverständliche Zielformulierung und Planung (erfordert Einbindung verantwortlicher Stakeholder)
  3. Datenbeschaffung, -aufbereitung, -transformation, -bereinigung
  4. Modellierung und/oder ermitteln des passenden Vorhersagealgorithmus, Objektive Performance Evaluation
  5. Implementierung in den Live-Betrieb / Deployment
  6. Monitoring und Maintenance
Machine Learning Engineering, d.h. Entwicklung individualisierter Vorhersage-Algorithmen auf Basis unstrukturierter Daten (z.B. Text, Bild, Zeitriehen, etc.).
Profilbild von Anonymes Profil, Big Data Analytics ,  Data Science , Machine Learning Engineering , Spark , Time Series / Zeitreihen Big Data Analytics , Data Science , Machine Learning Engineering , Spark , Time Series / Zeitreihen
Registrieren