Senior Data Engineer H/F

Mirakl | 22 Dec 2024


Les missions du poste

Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l'ergonomie...

Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l'ensemble des produits.

Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au coeur de notre philosophie.

Et pour favoriser ce partage avec d'autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

A propos du job

La solution SaaS Mirakl est le moteur des marketplaces des plus importants e-commerçants à travers le monde. Cette solution gère et produit de gros volumes de données qui présentent des challenges extrêmement intéressants pour les spécialistes de la donnée (produits, commandes, clients, niveaux de stock, prix, messages, appels API, données de navigation, séries temporelles, données géolocalisées etc.).

En tant que (Senior) Data Engineer au sein de l'équipe Data Mirakl, vos principales missions seront de :
- Contribuer à l'enrichissement de la Data Platform (ETL)
- Améliorer la robustesse de nos pipelines de production pour nos applications Machine Learning (inférence real time etc.)

Intégré(e) dans une équipe de spécialistes de la donnée (data engineers, machine learning engineers, data scientists, data analysts), vous êtes un des acteurs clés pour garantir la place de Mirakl comme solution dominante sur son marché.

Notre stack et nos outils

Apache Spark, Kafka, AWS, Databricks, Python, Airflow, Mlflow, Tensorflow, Delta lake, Superset, Kubernetes, Redshift, SQL, Terraform, Ansible

Au quotidien, vous allez :
- Participer à la définition et à l'implémentation d'une architecture performante, robuste, scalable et aux coûts maîtrisés pour nos applications Spark ainsi que pour nos pipelines de production de Machine Learning (évaluation des feature stores, refactoring de DAG Airflow)
- Accompagner les Data Scientists lors de leur mise en production (relecture de code, pair programming) et mettre en place les best practices
- Optimiser et améliorer la CI/CD de l'équipe en collaboration avec l'équipe SRE
- Assurer la montée en compétence des membres de l'équipe sur les sujets de MLOPS et Data Engineering
- Réfléchir à la meilleure façon d'intégrer les données Google Analytics dans la data platform
- Partager ses connaissances et présenter les travaux devant toutes les équipes Labs

Ce qu'on peut vous apporter :
- Des projets data driven, divers et variés (traitements massifs d'images, de textes, time series etc.) pour des produits différents de Mirakl
- Une culture orientée sur la veille technologique
- Des projets qui ont un vrai impact business devant être déployés sur des centaines de clients dans un contexte multilingue

Quelques exemples de sujets en cours :
- Enrichissement des données produit à partir des images et des descriptions
- Modération automatique des produits
- Mapping automatique des données produit
- Identification des produits à fort potentiels
- Détection de comportements frauduleux
- Sentiment analysis sur les messages échangés entre clients et vendeurs et dans les évaluations
- Détermination de prix optimaux
- Monitoring de la qualité de service des vendeurs
- Des applications d'inférence en synchrone de nos modèles de ML

Vous aimerez ce job si :
- Vous êtes passionné(e) par la data et les technologies modernes permettant d'en tirer partie
- Vous vous intéressez à la data science et avez des connaissances générales sur les algorithmes de Machine Learning
- Vous avez un background en développement et avez évolué dans un environnement Data
- Vous avez a minima 4 ans d'expérience en environnement Machine Learning et/ou Data
- Vous avez mis en production avec succès des applications Big Data faisant appel à du Machine Learning, du NLP, du traitement d'images dans des projets d'envergure, à fort volume de données
- Votre maîtrisez Python, êtes un pro des frameworks data de la fondation Apache et êtes à l'aise dans un environnement AWS
- Vous maîtrisez au moins un outil d'orchestration (Airflow, Data Pipeline ou tout autre outil similaire)
- Vous présentez vos travaux de manière simple et accessible
- Vous faîtes preuve d'un bon relationnel et vous aimez mentorer des collaborateurs
- Vous parlez couramment anglais et français

Les plus pour le poste :
- Vous avez une expérience significative dans le domaine du e-commerce
- Vous avez déjà mis en place un Data Lake, Data Warehouse ou une Data Platform
- Vous avez déployé des applicatifs en environnement Kubernetes
- Vous avez mis en place des pipelines d'ingestion de données avec une approche CDC à l'aide de Debezium ou autre
- Vous maîtrisez Java/Scala

Mirakl est engagée en faveur de la diversité, de l'égalité des chances et de l'inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d'innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.

Bienvenue chez Mirakl

Mirakl, leader et pionnier de l'économie de plateforme, propose aux entreprises une suite unique de solutions leur permettant de transformer significativement leur e-commerce afin d'accélérer de façon durable et rentable leur croissance. Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media. Basée à Paris et Boston, Mirakl est certifiée Great Place to Work.

A propos de Mirakl Labs

Finalisez votre candidature

sur le site du recruteur.