Stage de 4 à 6 mois
VOTRE FUTURE ÉQUIPE
Au sein de la Direction Internet, Données, Presse, Postes et Utilisateurs, l’unité « Régulation par la donnée » incarne stratégiquement, coordonne et soutient opérationnellement les actions de l’Arcep relatives à l’information des utilisateurs finals par le développement d’outils de régulation par la donnée, à la protection des consommateurs et à l’animation des relations entre l’Autorité et les utilisateurs finals.
VOS MISSIONS
L’un des coeurs de métier de l’unité consiste à fiabiliser et à automatiser le traitement de la donnée au sein des différents processus métiers de l’Arcep, en mettant en place des méthodes et des outils adaptés aux usages internes. Vous participerez aux travaux en cours sur l’intégration, la transformation et l’exploitation des données en base de données. Vous contribuerez à :
1/ Conception et implémentation de pipelines de données :
- - Extraction des données de différentes sources (APIs, bases de données, fichiers plats...) ;
- - Transformation et nettoyage des données à l’aide d’outils tels que dbt ou pandas ;
- - Chargement des données en base de données (e.g., PostgreSQL).
2/ Automatisation des workflows :
- - Mise en place de pipelines avec un orchestrateur (Apache Airflow) ;
- - Surveillance et optimisation des performances des tâches automatisées.
3/ Collaboration interdisciplinaire : travailler en lien avec les équipes BI et Produit pour garantir l’alignement entre les solutions techniques et les besoins métiers
4/ Documentation et bonnes pratiques :
- - Elaboration de documentations techniques ;
- - Respect et promotion des principes DataOps.
VOTRE PROFIL
- Vous suivez un master en géomatique orienté développement logiciel ou un master Data (Big Data, Data Science...) avec une expérience dans la manipulation de données spatiales.
- Vous maîtrisez les langages de programmation (Python et R).
- Vous connaissez des systèmes de contrôle de version (Git) et des approches CI/CD pour les pipelines de données.. Vous disposez de connaissances dans la gestion de base de données relationnelles (PostgreSQL, MySQL..) et en système d’information géographique (SIG).
- Vos atouts : esprit analytique et résolution de problèmes complexes, rigueur, travail en équipe.
- Vos petits + : connaissances en orchestration de workflows (Airflow), en monitoring/logging des systèmes de données.