Stagiaire Data Steward - H/F
L'entreprise
Depuis 20 ans, le Groupe TRAVELFACTORY se donne pour objectif de rendre accessible et de simplifier la location de vacances en ligne et l’organisation de séjours en groupe. Travelfactory a rejoint la Compagnie des Alpes en janvier 2018, faisant de lui le leader de la distribution des séjours en montagne en France.
Aujourd’hui, nos 80 collaborateurs.trices développent avec passion deux marques principales en France et aussi en Angleterre, au Pays-Bas et en Belgique : TRAVELSKI.COM, le n°1 du séjour ski tout compris sur internet et YOONLY, la référence du séjour à la montagne pour les millenials.
Reconnu pour notre savoir-faire, Travelfactory, est implanté dans plusieurs pays : France, Belgique, Israël et au Pays-Bas depuis le rachat du tour-opérateur hollandais Snowtime en septembre 2020.
Travelfactory, c’est 6 valeurs que nous partageons tous au quotidien : ambition, épanouissement, esprit d'équipe, agilité, autonomie et persévérance.
Nous recherchons un.e :
Stagiaire - Data Steward F/H
Le poste
Le challenge 🚀
Notre catalogue de prestations s’appuie sur des données provenant de multiples partenaires et sources. Avec la croissance de notre offre, un enjeu majeur émerge : garantir la cohérence, la complétude et la fiabilité de nos données résidences et logements. Descriptions, catégories, équipements, capacités… ces informations doivent être irréprochables pour alimenter notre site, nos algorithmes de recommandation et nos outils internes.
C’est là que vous intervenez.
⛷ Voici ce que seront vos missions et challenges :
Amélioration de la qualité des données hébergements
- Auditer et nettoyer les données existantes sur nos résidences et logements (identification des incohérences, doublons, données manquantes).
- Labelliser et catégoriser manuellement des hébergements pour constituer des jeux de données de référence fiables.
- Définir et documenter des règles de qualité applicables à l’ensemble du catalogue.
Développement d’outils d’automatisation (Python)
- Concevoir et développer des scripts de matching automatique entre nos données internes et celles de nos partenaires (rapprochement de résidences, détection de doublons inter-sources).
- Explorer et mettre en œuvre des approches de catégorisation automatique (règles métier, NLP, modèles de classification) pour réduire le besoin de labellisation manuelle.
- Mesurer la performance de ces outils et itérer pour améliorer leur précision.
Profil recherché
Nous sommes faits pour travailler ensemble si …
- Étudiant(e) en data, informatique, statistiques ou formation équivalente (de Bac+3 à Bac+5).
- À l’aise avec Python (pandas, scikit-learn ou équivalent). Une expérience avec des librairies de NLP (spaCy, fuzzywuzzy/thefuzz…) est un plus.
- Goût du travail bien fait : rigueur et attention au détail, y compris sur des tâches de labellisation manuelle.
- Capacité à manipuler des données tabulaires (CSV, bases SQL) et esprit analytique.
- Curieux(se), autonome et force de proposition.
- Un intérêt pour le secteur du tourisme ou du e-commerce est apprécié.
Éléments nécessaires pour postuler
Pour valider votre candidature, nous vous demandons de fournir les éléments suivants, vous devrez télécharger les pièces demandées directement lors de votre inscription.
Toute candidature incomplète ne sera pas traitée par nos services.
Document(s) :
- Curriculum Vitæ
Candidature facile