Moderne Ansätze für Datenpipelineszur Industrialisierung Ihrer KI-Anwendungen

Entdecken Sie, wie moderne MLOps- und Data-Engineering-Ansätze die Industrialisierung fortschrittlicher KI- und GenAI-Anwendungen beschleunigen. In dieser Sitzung erkunden wir gemeinsam den Stand der Technik bei Technologien, die die Leistung, Skalierbarkeit und Zuverlässigkeit von KI-Diensten gewährleisten.

Wir werden auch unsere konkreten Erfahrungen mit der Umsetzung dieser Lösungen und Architekturen zur Bereitstellung und Wartung von KI-Modellen in großem Maßstab teilen, wobei wir uns auf Streaming-Technologien wie Kafka, Inferenztechnologien wie Nvidia Triton und MLOps-Technologien wie ZenML stützen.

Praktische Informationen praktische

GMAI-Dialog-Auditorium – links

Wann?

🗓️ Am 24. Juni 2025, von 8:30 bis 10:30 Uhr

Wo?

📍 Paris, La Défense, Tour Légende – 20 place de la Défense – 92800 Puteaux

Für wen?

🎯 Tech-Experten, Innovationsfachleute, IT-Leiter ... alle, die Data-/KI-Teams jeder Größe leiten.

Die Sprecher

Augustin HOFF

Augustin HOFF – Leitender Datenwissenschaftler bei der MAIFBesonderer Gast

Dieser konkrete Erfahrungsbericht der MAIF gibt Ihnen einen Einblick in die Industrialisierung ihrer KI-Dienste. Sie erfahren, wie der führende Versicherungsanbieter seine Streaming-Datenpipelines mit Kafka für das Ereignismanagement seiner Lösung aufgebaut hat.

Augustin HOFF, Projektleiter auf Seiten von Data Science (MAIF), und Ugo Lorenzini (ILLUIN Technology) werden uns ihre Erfahrungen mitteilen und detailliert auf die Einführung eines Microservices-Ansatzes eingehen, wobei sie aufzeigen werden, wie dieser Ansatz die Agilität, Skalierbarkeit und unabhängige Wartung der verschiedenen KI-Komponenten fördert.

Robert VESOUL

CEO & Mitbegründer
ILLUIN Technology

Victor ALIBERT

Data Engineering Manager
ILLUIN Technology

Ugo LORENZINI

Staff Data Engineer
ILLUIN Technology

Pierre LECERF

Staff Data Engineer
ILLUIN Technology

Ablauf und behandelte Themen

8:30 Uhr ☕️ Begrüßungskaffee

9:00 Uhr 🎤 Einführung in die ILLUIN-Technologie

9:15 Uhr ⚙️ Stand der Technik im Data Engineering für das automatische Retraining von Modellen in der Produktion

9:30 Uhr ⚙️ Erfahrungsbericht der MAIF zur Industrialisierung von KI-Dienstleistungen

10:00 Uhr 🙋‍♀️ Fragen und Austausch

ML Ops

Durch die Integration kontinuierlicher Trainings-, Bereitstellungs- und Überwachungs-Workflows erleichtert MLOps die schnelle Iteration von Modellen und gewährleistet deren Robustheit angesichts sich ändernder Daten und Geschäftsanforderungen. Dieser Ansatz ist entscheidend für den Übergang von isolierten POCs zu groß angelegten, widerstandsfähigen und langfristig wartbaren KI-Diensten. Anhand von Technologien wie ZenML werden wir untersuchen, wie MLOps zur Grundlage für die Industrialisierung der KI in Unternehmen wird.

Data Engineering

Der Data-Engineering-Ansatz ist ein unverzichtbares Glied, um leistungsstarke KI-Modelle zu versorgen und KI-Lösungen zu industrialisieren. Moderne Datenpipelines müssen den Anforderungen an Skalierbarkeit, Zuverlässigkeit und Governance gerecht werden. Anhand von Technologien wie Kafka oder Airflow werden wir sehen, wie Data Engineering den Aufbau von Architekturen für Ereignisdatenströme und die optimale Speicherung von Daten ermöglicht.

Warum kommen?

  • Entdecken Sie fortschrittliche MLOps-/Data-Engineering-Lösungen für die Industrialisierung Ihrer KI-Modelle in der Produktion.
  • Profitieren Sie von konkreten und detaillierten Erfahrungsberichten von ILLUIN Technology und seinen Kunden zu den Herausforderungen der KI-Industrialisierung mithilfe modernster Technologien (Kafka, Microservices-Architekturen, Nvidia Triton).
  • Identifizieren Sie bewährte Verfahren und zu vermeidende Fallstricke für Ihre eigenen KI-Industrialisierungsprojekte, indem Sie sich von realen Anwendungsfällen inspirieren lassen.
  • Tauschen Sie sich mit Kollegen und unseren Experten über Ihre Ansätze aus und beschleunigen Sie die Produktionsaufnahme Ihrer eigenen KI-Modelle.

Setzen Sie auf unsere Expertise , um Ihre Daten zu einem strategischen Vorteil zu machen

Wir unterstützen Sie bei der Konzeption robuster Architekturen und der Optimierung von Pipelines, um zuverlässige und leistungsstarke Datenflüsse zu gewährleisten. Ganz gleich, ob Sie gerade erst am Anfang stehen oder bereits weit fortgeschritten sind – wir maximieren den Wert Ihrer Daten, um den Erfolg Ihrer Datenprojekte zu beschleunigen.

Unser Know-how

Wir entwickeln Pipelines für die Erfassung und Verarbeitung großer Datenmengen (mehrere Millionen pro Tag). Unsere Kompetenzen umfassen insbesondere die Datenverarbeitung (ETL/ELT-Pipelines) und die Verarbeitung per Batch (Apache Spark...), Streaming (Google Dataflow, Apache Beam / Flink...)oder Ereignis (Apache Kafka...) sowie die Orchestrierung undAutomatisierung komplexerWorkflows mit Technologien wie Apache Airflow / Dagster.

Beispiele für verwendete Technologien

Unser Know-how

Wir zentralisieren und migrieren Ihre Daten in zuverlässige, sichere und skalierbare Speicherbereiche, um Ihre Single Source of Truth (SSoT) aufzubauen. Unsere Lösungen umfassen insbesondere Architekturen vom Typ Data Warehouse (Google BigQuery, AWS Redshift) und Data Lake House (auf Cloud-Lösungen wie Databricks oder vor Ort mit einem Stack vom Typ Minio / Dremio / Apache Iceberg beispielsweise).

Beispiele für verwendete Technologien

Unser Know-how

Wir optimieren und implementieren Ihre Dateninfrastrukturen kontinuierlich und automatisiert (Infrastructure as Code mit „Terraform“) auf Ihren Servern oder bei den wichtigsten Cloud-Anbietern (GCP, AWS, Azure, OVH, Outscale ...). Ihre Architekturen sind skalierbar, sicher und werden vollständig überwacht (Metriken/Dashboard, Warnmeldungen, Protokollierung, Nachverfolgung) mit einem Stack vom Typ Prometheus/Grafana, um die Zuverlässigkeit Ihrer Abläufe zu gewährleisten.

Beispiele für verwendete Technologien

Unser Know-how

Wir industrialisieren Ihre KI-Projekte mit ML Ops Cloud-Plattformen (AWS Sagemaker / Azure ML / Vertex AI) oder vor Ort mit ZenML, indem wir Ihre Pipelines von Anfang bis Ende konsolidieren: vom Experimentieren mitExperiment-Tracking-Lösungen bis hin zur Bereitstellung in der Produktion durch die Integration von Model Serving / Versioning und die Orchestrierung Ihrer Trainings-Pipelines (z. B. mit Airflow ). Ihre Daten werden in speziellen Feature Stores gespeichert, gesichert und versioniert, um sie live oder im Batch abzufragen.

Beispiele für verwendete Technologien

Unser Know-how

Wir bieten umfassende Analytics-Lösungen, die von der Verarbeitung/Speicherung in OLAP-Datenbanken (z. B. Google BigQuery, Apache Druid ) bis zur Integration von Daten visualisierungslösungen (Apache Superset, Tableau...) reichen . Dank unserer Expertise werden Ihre Daten mithilfe fortschrittlicher Visualisierungs- und Reporting-Tools in verwertbare Erkenntnisse umgewandelt .

Beispiele für verwendete Technologien

Unser Know-how

Wir stärken die Governance, Rückverfolgbarkeit (Data Lineage, Data Monitoring) und Sicherheit Ihrer Daten, indem wir deren Konformität (Data Compliance) und Qualität während ihres gesamten Lebenszyklus gewährleisten. Wir helfen Ihnen dabei, sich mit Data-Mesh-Organisationen entsprechend Ihren Datenanforderungen zu strukturieren.

Unser Know-how

Wir entwickeln Pipelines für die Erfassung und Verarbeitung großer Datenmengen (mehrere Millionen pro Tag). Unsere Kompetenzen umfassen insbesondere die Datenverarbeitung (ETL/ELT-Pipelines) und die Verarbeitung per Batch (Apache Spark...), Streaming (Google Dataflow, Apache Beam / Flink...)oder Ereignis (Apache Kafka...) sowie die Orchestrierung undAutomatisierung komplexerWorkflows mit Technologien wie Apache Airflow / Dagster.

Beispiele für verwendete Technologien

Unser Know-how

Wir zentralisieren und migrieren Ihre Daten in zuverlässige, sichere und skalierbare Speicherbereiche, um Ihre Single Source of Truth (SSoT) aufzubauen. Unsere Lösungen umfassen insbesondere Architekturen vom Typ Data Warehouse (Google BigQuery, AWS Redshift) und Data Lake House (auf Cloud-Lösungen wie Databricks oder vor Ort mit einem Stack vom Typ Minio / Dremio / Apache Iceberg beispielsweise).

Beispiele für verwendete Technologien

Unser Know-how

Wir optimieren und implementieren Ihre Dateninfrastrukturen kontinuierlich und automatisiert (Infrastructure as Code mit „Terraform“) auf Ihren Servern oder bei den wichtigsten Cloud-Anbietern (GCP, AWS, Azure, OVH, Outscale ...). Ihre Architekturen sind skalierbar, sicher und werden vollständig überwacht (Metriken/Dashboard, Warnmeldungen, Protokollierung, Nachverfolgung) mit einem Stack vom Typ Prometheus/Grafana, um die Zuverlässigkeit Ihrer Abläufe zu gewährleisten.

Beispiele für verwendete Technologien

Unser Know-how

Wir industrialisieren Ihre KI-Projekte mit ML Ops Cloud-Plattformen (AWS Sagemaker / Azure ML / Vertex AI) oder vor Ort mit ZenML, indem wir Ihre Pipelines von Anfang bis Ende konsolidieren: vom Experimentieren mitExperiment-Tracking-Lösungen bis hin zur Bereitstellung in der Produktion durch die Integration von Model Serving / Versioning und die Orchestrierung Ihrer Trainings-Pipelines (z. B. mit Airflow ). Ihre Daten werden in speziellen Feature Stores gespeichert, gesichert und versioniert, um sie live oder im Batch abzufragen.

Beispiele für verwendete Technologien

Unser Know-how

Wir bieten umfassende Analytics-Lösungen, die von der Verarbeitung/Speicherung in OLAP-Datenbanken (z. B. Google BigQuery, Apache Druid ) bis zur Integration von Daten visualisierungslösungen (Apache Superset, Tableau...) reichen . Dank unserer Expertise werden Ihre Daten mithilfe fortschrittlicher Visualisierungs- und Reporting-Tools in verwertbare Erkenntnisse umgewandelt .

Beispiele für verwendete Technologien

Unser Know-how

Wir stärken die Governance, Rückverfolgbarkeit (Data Lineage, Data Monitoring) und Sicherheit Ihrer Daten, indem wir deren Konformität (Data Compliance) und Qualität während ihres gesamten Lebenszyklus gewährleisten. Wir helfen Ihnen dabei, sich mit Data-Mesh-Organisationen entsprechend Ihren Datenanforderungen zu strukturieren.

Einige Erfolge im großen Stil

Randstad

Wie hat Randstad seine Daten mit einem Data Mart zentralisiert, um die Qualität zu verbessern und seine Geschäftsprozesse zu optimieren?

Erfahren Sie, wie Randstad seine Daten mithilfe eines Data Marts zentralisiert, die Qualität der Informationen verbessert und seine ...
Wie hat GEOPOST ein maßgeschneidertes und skalierbares Datalakehouse eingerichtet, um KI-Anwendungen zu fördern?

Wie hat GEOPOST ein maßgeschneidertes und skalierbares Datalakehouse eingerichtet, um KI-Anwendungen zu fördern?

Erfahren Sie, wie Geopost seine Dateninfrastruktur durch die Einrichtung eines skalierbaren Datalakehouse und Kafka-Pipelines modernisiert hat, um ...
Wie hat sich die MAIF mit einer optimalen MLOps-Infrastruktur ausgestattet, um ihre KI-Projekte zu skalieren?

Wie hat sich die MAIF mit einer optimalen MLOps-Infrastruktur ausgestattet, um ihre KI-Projekte zu skalieren?

Entdecken Sie, wie es der MAIF gelungen ist, ihre KI-Lösungen mit MLOps- und LLM Ops-Verfahren zu industrialisieren und so ...

Die Wahl der Führungskräfte

Um sich anzumelden, klicken Sie hier 👇

🗓️ Am 24. Juni 2025, ab 8:30 Uhr

📍 Vor Ort, Paris, La Défense, Tour Légende – 20 place de la Défense – 92800 Puteaux