Stage - Utilisation d'IA pour l'Analyse d'Incidents Opérationnels H/F

CLS – Collecte Localisation Satellites | 15 Oct 2024


Les missions du poste

Dans le cadre de ses services 24/7, CLS gère des systèmes critiques nécessitant une surveillance opérationnelle continue. L'objectif est de maintenir une haute disponibilité en identifiant rapidement les incidents, d'en déterminer l'origine et d'améliorer ainsi la résilience du système. Le produit Grafana comprend un outil de machine learning spécialisé dans la détection automatique d'incidents et l'identification de ses origines, permettant ainsi d'optimiser la gestion des incidents dans des environnements complexes.

Tes missions si tu nous rejoins :
- Paramétrer Grafana afin de détecter automatiquement les anomalies et incidents dans certains systèmes critiques,
- Mettre en place des dashboards Grafana pour la visualisation de ces incidents détectés et des alertes en temps réel,
- Proposer et tester des solutions permettant la remontée des alertes Grafana sur un système centralisé (type Nagios),
- Analyser les incidents identifiés par Grafana et remonter à l'origine afin de prévenir des incidents futurs,
- Collaborer avec les opérateurs, les ingénieurs d'exploitation et les ingénieurs IT pour optimiser la gestion des incidents et assurer la coordination dans un environnement à haute disponibilité,
- Proposer des améliorations dans la configuration de Grafana pour affiner les prédictions et les détections d'anomalies.

L'environnement technique que nous utilisons : Grafana, Python, Git, Nagios, DEVOPS (Kubernetes, Docker), Systèmes de gestion de logs (OpenSearch/ELK, Prometheus).

L'adresse du poste

Localisez l'entreprise et calculez votre temps de trajet en un clic !

Le profil recherché

Compétences techniques requises :
- Etudiant(e) en formation Informatique.
- Compétences en monitoring de systèmes et en haute disponibilité.
- Connaissance des outils de visualisation de données, en particulier Grafana.
- Compréhension de l'utilisation d'outils de machine learning et d'intelligence artificielle pour la détection d'anomalies.
- Bonne maîtrise de l'administration système, des infrastructures IT et des environnements critiques.

L'ouverture d'esprit, l'aisance relationnelle, la flexibilité, l'autonomie, la curiosité et l'esprit d'analyse sont attendus.

Tu aimes les challenges, tu as l'esprit d'équipe, alors, demain avec l'ensemble des équipes de CLS, nous rendrons nos systèmes plus efficients et utilisés par le plus grand nombre, viens rejoindre l'aventure !

Bienvenue chez CLS ? Collecte Localisation Satellites

Au coeur des enjeux de la planète, CLS, Tech4Good company, filiale du CNES et de la CNP, est une société à mission internationale, pionnière dans la fourniture de solutions d'observation et de surveillance de la Terre.

Opérateur historique des balises Argos, CLS, depuis 1986, avec plus de 900 salariés dans 30 pays et un chiffre d'affaires annuel de près de 170 millions d'Euros, figure parmi les spécialistes des services satellitaires en utilisant les technologies spatiales les plus avancées, couplées au génie logiciel et à la data-sciences.

Tu souhaites rejoindre des équipes agiles et dynamiques sur des projets innovants et ambitieux ? Explorer de nouvelles technologies ? Evoluer sur des projets transverses et variés autour des 5 secteurs d'activité de CLS ?

L'équipe du Pole Opérations de la Direction systèmes d'Informations de CLS, recherche un(e) stagiaire pour évoluer et développer ses compétences autour du sujet suivant :

"Utilisation d'IA pour l'analyse d'incidents opérationnels "

Finalisez votre candidature

sur le site du recruteur.