I did my PhD in AI at the University of Freiburg in Frank Hutter's ML Lab, spent time at the Stanford AI Lab and AWS AI, and now work at the ELLIS Institute where I develop and research data selection methods for efficient LLM training. I'm interested in meta-learning, AutoML, and building AI systems that actually work in practice. My open-source projects have 500+ GitHub stars and 150k+ package downloads. I also contribute to projects like open-instruct and OpenJury, which are used to train some of the best AI models like OLMo.
Ich habe an der Universität Freiburg in Frank Hutters Machine Learning Lab promoviert, war am Stanford AI Lab und bei AWS AI, und entwickle und forsche jetzt am ELLIS Institut an Datenselektion für das effektive Training von LLMs. Mich interessiert Meta-Learning, AutoML, und KI-Systeme die in der Praxis funktionieren. Meine Open-Source Projekte haben 500+ GitHub Stars und 150k+ Downloads. Ich trage auch zu Projekten wie open-instruct und OpenJury bei, die genutzt werden, um unter anderem eines der besten KI-Modelle wie OLMo zu trainieren.
Freelance AI consulting and engineering for startups and enterprises alike, in Karlsruhe, Mannheim, Stuttgart and the wider Rhine-Neckar region. I work in both German and English. Freiberufliche KI-Beratung und -Entwicklung für Startups und Großunternehmen gleichermaßen, in Karlsruhe, Mannheim, Stuttgart und der gesamten Rhein-Neckar-Region. Ich arbeite auf Deutsch und Englisch.
I cover the full pipeline, from first idea to production: Ich decke die gesamte Pipeline ab, von der ersten Idee bis zur Produktion:
From research spike to deployed product. I build custom ML pipelines, fine-tune models, set up automated testing, and ship to production with CI/CD. Vom Forschungsprototyp zum fertigen Produkt. Ich baue ML-Pipelines, fine-tune Modelle, richte automatisierte Tests ein und deploye mit CI/CD in die Produktion.
RAG systems, chatbots, AI agents, and LLM-powered workflows. I handle the full stack: evaluation, deployment, and continuous monitoring. RAG-Systeme, Chatbots, KI-Agenten und LLM-Workflows. Ich übernehme den gesamten Stack: Evaluation, Deployment und kontinuierliches Monitoring.
Architecture reviews, ML feasibility assessments, and hands-on guidance. I help your team make the right technical decisions early. Architektur-Reviews, ML-Machbarkeitsanalysen und praxisnahe Begleitung. Ich helfe Ihrem Team, früh die richtigen technischen Entscheidungen zu treffen.
Based in Karlsruhe. Available on-site in the Karlsruhe, Mannheim, and Stuttgart metro area. Remote worldwide. Standort Karlsruhe. Vor Ort verfügbar im Raum Karlsruhe, Mannheim und Stuttgart. Remote weltweit.
Recent projects and selected research I shipped end-to-end. Aktuelle Projekte und ausgewählte Forschung, die ich von Anfang bis Ende umgesetzt habe.
AI-powered perfume recommender using embedding similarity and LLM reasoning. KI-basierter Parfüm-Empfehlungsdienst mit Embedding-Ähnlichkeit und LLM-Reasoning.
Large-scale OCR and entity extraction over 1M+ public Epstein-related documents. Groß angelegte OCR- und Entity-Extraktion über 1M+ öffentliche Epstein-Dokumente.
We transfer knowledge about finetuning pipelines from related tasks to efficiently adapt LLMs to new datasets, outperforming zero-shot and default finetuning baselines. Wir übertragen Wissen über Finetuning-Pipelines von verwandten Aufgaben, um LLMs effizient an neue Datensätze anzupassen – besser als Zero-Shot- und Standard-Finetuning-Baselines.
A method that jointly searches for the optimal pretrained model and its finetuning hyperparameters using meta-learned surrogates, delivering strong results in a fraction of the compute. Eine Methode, die gleichzeitig das optimale vortrainierte Modell und dessen Finetuning-Hyperparameter mittels meta-gelernter Surrogate findet – mit starken Ergebnissen bei einem Bruchteil der Rechenkosten.
Selects the best pretrained deep learning pipeline for a new dataset in zero-shot, using meta-learned surrogates over a large meta-dataset of pipeline performances. Wählt die beste vortrainierte Deep-Learning-Pipeline für einen neuen Datensatz in Zero-Shot aus, mithilfe meta-gelernter Surrogate über einen großen Meta-Datensatz von Pipeline-Ergebnissen.
Neural proxy environments and reward networks that replace expensive real-world interactions, enabling RL agents to train faster with fewer steps and transfer to unseen agents. Neuronale Proxy-Umgebungen und Reward-Netzwerke, die teure reale Interaktionen ersetzen – RL-Agenten trainieren schneller mit weniger Schritten und generalisieren auf neue Agenten.
A unified grasp synthesis method that generalizes across novel object geometries and diverse multi-fingered robotic hands, achieving 90%+ success in simulation and real-world experiments. Eine einheitliche Greifmethode, die über verschiedene Objektgeometrien und mehrfingrige Roboterhände generalisiert – mit über 90% Erfolgsrate in Simulation und realen Experimenten.
Full list onVollständige Liste auf Google Scholar.