08.01.2026 aktualisiert


verifiziert
Premiumkunde
20 % teilweise verfügbarSenior AI & Machine Learning Engineer - GenAI | multimodal AI Agents | Deep Learning | Cloud
Köln, Deutschland
Weltweit
M. Sc. Human Technology in Sports and MedicineSkills
APIsKünstliche IntelligenzAirflow
Generative AI & AI Agents
- Experte für multimodale, mehrsprachige AI Agents mit Sprach-, Bild- und Dokumenteneingabe sowie der Entwicklung individuell angepasster und skalierbarer Einzelkomponenten als Microservices, wie Speech-to-Text, LLM und Text-to-Speech.
Deep Learning / Machine Learning
- Umfassende Erfahrung in der Entwicklung, dem Training und der Optimierung von Deep-Learning- und Machine-Learning-Modellen sowie in der Implementierung leistungsfähiger end-to-end MLOps-Prozesse in der Cloud. Expertise reicht von der Modellentwicklung über die Evaluierung bis hin zur produktiven Bereitstellung.
MLOps/DevOps
- Einsatz moderner MLOps-/DevOps-Praktiken für effiziente, wartbare KI-Systeme mit Fokus auf Monitoring und Dashboarding. Erfahrung mit Orchestrierungstools wie Airflow, MLFlow sowie AWS- und Azure-Lösungen.
Cloud und Infrastructure as Code
- Fundierte Kenntnisse in Azure und AWS-Diensten (SageMaker, Lambda, Step Functions) und diversen Datenbank-/Speicherlösungen. Entwicklung skalierbarer KI-Pipelines. Deployment mit Infrastructure as Code (Terraform, OpenTofu, CDK).
Frameworks
- GenAI/AI Agents/NLP: LangChain, LlamaIndex, Pipecat, LiveKit, Haystack, Hugging Face Transformers, LangChain, LlamaIndex, Haystack, NLTK, SpaCy, Gensim, OpenAI API
- ML: TensorFlow, PyTorch, Keras, Spark
Main Programming Languages
- Python
- Golang
Datenmanagement und -verarbeitung
- Datenmanagement, Feature Engineering, Big Data-Skalierung und -Visualisierung
Tools
- Vertrauter Umgang mit CICD, Docker, git, VS Code, GitLab, Bitbucket in macOS, Windows und Linux
Sprachen
DeutschMutterspracheEnglischverhandlungssicherFranzösischgut
Projekthistorie
Entwicklung eines multimodalen, multilingualen KI-Assistenten im Rahmen eines EU-geförderten Innovationsprojekts (IPCEI-CIS). In der Rolle als Senior AI Engineer verantwortete ich die Konzeption und Umsetzung zentraler KI-Komponenten (u.a. LLM-Integration, Speech-to-Text, Text-to-Speech) als skalierbare Microservices.
Besonderer Fokus lag auf niedriger Latenz für Echtzeitkommunikation mit Einsatz von WebRTC, sowie der produktiven Bereitstellung mittels MLOps, CI/CD und Cloud-Infrastruktur (IaC).
Besonderer Fokus lag auf niedriger Latenz für Echtzeitkommunikation mit Einsatz von WebRTC, sowie der produktiven Bereitstellung mittels MLOps, CI/CD und Cloud-Infrastruktur (IaC).
Zuständig für den Aufbau einer Ende-zu-Ende Datenaufbereitungs-, Verarbeitungs- und Trainingsstrecke für die eingehenden Anrufe im Kundenservice. Hierbei wurden Methoden aus den Bereichen der natürlichen Sprachverarbeitung und der generativen künstlichen Intelligenz verwendet, um die zugrundeliegenden Daten in Text und weiterführend in für den Fachbereich analysierbare Ergebnisse zu überführen. Zu diesem Zwecke wurden Machine Learning Modelle (Transformer; LLMs) trainiert zur Vorhersage relevanter Parameter hinsichtlich der Kundenanliegen und -zufriedenheit und in die Verarbeitungsstrecke in der AWS-Cloud implementiert. Mit diesem MLOps-Prozess und den täglich neuen, resultierenden Daten wurden dem Fachbereich und dem Kunden im Allgemeinen wertvolle und zuvor nicht vorliegende Einblicke in das Anrufsverhalten der Kund*innen ermöglicht.


