REJOIGNEZ-NOUS !

Beezen recrute de nouveaux

talents en 2016
Serez-vous le prochain ? Nos offres d'emploi
Candidature spontanée

INGENIEURS STAGIAIRES – DATA SCIENCE

6 décembre 2017

PROGRAMME : CONNAISSANCE CLIENT / PROJET : REDUCTION DE DIMENSIONS D'UN PROBLEME PREDICTIF COMPLEXE
L'ENTREPRISE
BEEZEN EST UNE ESN FRANÇAISE INDÉPENDANTE, ACTEUR MAJEUR DE LA TRANSFORMATION ET DE LA PERFORMANCE DES ENTREPRISES QUI AMBITIONNE DE SE POSITIONNER COMME LE PARTENAIRE STRATÉGIQUE DE SES CLIENTS EN LES ACCOMPAGNANT DANS L’ANALYSE ET LA VALORISATION DE LEURS DONNÉES, LE DÉVELOPPEMENT ET LA MAÎTRISE DE LEUR EXPÉRIENCE DIGITALE.

LA MISSION

Poste basé à Neuilly, 163/165 Avenue Charles de Gaulle, 92200 Neuilly-sur-Seine.

Mission :

Dans le cadre du Programme Connaissance Client :

Ce projet a pour objectif de tester et élaborer une méthode de réduction de dimension d’un problème complexe basé sur des données structurées.

Contexte : au sein de BEEZEN, en relation étroite avec ses clients, sous la Responsabilité croisée du Directeur de l’Innovation, l’ingénieur stagiaire intégrera une équipe projet de R&D afin de développer une solution innovante. La démarche consistera à produire :

  1. Un rapport de recherche
  2. Un rapport de stage (s’appuyant sur le rapport de recherche)
  3. La conception et les développements inhérents au sujet.

Activité : à partir d’un jeu de données structure présentant un grand nombre de colonnes :

  • Retenir un petit ensemble de méthodes de réduction de dimension s’avérant les plus pertinentes
  • Compléter les modélisations prédictives par une analyse explicative des phénomènes étudiés
  • Améliorer les capacités prédictives des modèles
  • Obtenir une méthode la plus généraliste possible permettant d’intégrer les données les plus diversifiées possibles en entrée

 

Il existe de très nombreuses méthodes pour réduire la dimension d’un : ACP, ACI, MDI, MD, LDA, MDD

Le recensement exhaustif de ces méthodes est un préalable à la sélection d’une méthode ayant les caractéristiques suivantes :

 

  • le moins de biais possible dans la sélection (exemple de biais : une variable comportant plus de modalités qu’une autre est privilégiée alors que son pouvoir explicatif n’est pas plus élevé)
  • la plus généraliste possible : cette méthode exige le moins de transformation possible des variables en amont et permet de traiter tous types de variables (catégorielles et numériques) quelques soient leurs distributions
  • la plus économique en temps de calcul (capable d’absorber de fortes volumétries)

On proposera, en fonction de cette base de connaissances, des améliorations des meilleures méthodes donnant lieu à des développements spécifiques dans différents langages.

On traitera deux ensembles de méthodes distincts :

1 – on ne considère que les méthodes ne retenant qu’un sous ensemble des variables de départ sans transformation

2 – on génère des nouvelles variables combinaisons des variables de départ

On n’oubliera pas que ces méthodes doivent tenir compte de l’aspect supervisé du problème.

 

Méthode de travail

Chacune des méthodes sera testée et les biais afférents analysés à partir de jeux de données standards et de jeux de données fournis par Beezen. Des informations externes (climatiques, INSEE, …) pourront être intégrées pour tester des hypothèses explicatives de travail originales.

 

PROFIL RECHERCHÉ

Stage de 5ème année

Compétences requises

  • Ouverture d’esprit et capacité à explorer des sujets novateurs
  • Capacités d’analyse et de synthèse
  • Compétences rédactionnelles
  • Compétences techniques : connaissance des principes et algorithmes de machine learning – analyse multivariée

Confidentialité

  • Rapport de stage : tous les documents seront rendus à BEEZEN à l’issue du stage
  • Soutenance : La soutenance se déroulera à huis clos.
  • Durée : 6 mois

 


MOTS CLÉS
connaissance client, machine learning, projet de R&D, stage, transformation digitale

Pour postuler c’est ici :
POSTULER
REVENIR AUX OFFRES