Retour au blog
Fiabiliser vos données

Et si, nous parlions de Data Science ?



Data Science : comment démystifier les nouvelles technologies pour donner aux directions de l’entreprise l’autonomie et la pleine intelligence de leurs données ?

Discipline visant à exploiter l’ensemble des données disponibles, la Data Science a pour objet de faciliter la prise de décision des entreprises. Pourtant, il est encore compliqué de définir clairement et précisément cette science des données, car bien trop nouvelle, elle se crée chaque jour davantage et chaque partie prenante y apporte sa définition et se l’approprie à sa façon.

Aujourd’hui, la prise de décision est l’une des principales difficultés, à laquelle se confronte de nombreuses entreprises qui souhaitent se positionner au mieux sur un marché en perpétuelle évolution. Obtenir une meilleure visibilité, exploiter, de la meilleure façon, leurs données ainsi que de se rapprocher au maximum de la bonne décision, font donc partie de leurs objectifs !

C’est ainsi que la Data Science devient directement un enjeu de rentabilité et de performance pour l’entreprise. Mais comment s’approprier cela et l’adapter concrètement en entreprise ?

Petite histoire autour de la Data Analyse

Pour vous aider à y voir plus clair, nous avons mis en place un scénario afin d’illustrer notre méthode d’analyse. Une entreprise lance une nouvelle gamme de produits et souhaite organiser une prospection ciblée et efficace. Pour cela, elle décide de mettre en place des listes de prospection.

Comment la Data Analyse peut-elle aider cette entreprise dans son projet de recherche de client ?

Grâce à une méthode d’analyse constituée de six étapes, nous allons pouvoir fournir des éléments de réponse très opérationnels à cette entreprise. Ces étapes sont :

  • Profilage
  • Identification des sources
  • Collecte des données
  • Production de données
  • Modélisation
  • Présentation des données

Pour démarrer, l’entreprise doit mettre en place une phase de profilage. Cette phase lui permettra d’identifier son client cible en déterminant plusieurs critères. A partir du CRM, source interne à l’entreprise, un premier travail de qualification peut être réalisé. L’entreprise identifie par exemple ici la taille des entreprises cibles et leur secteur d’activité.

Le data analyst ou data scientist va compléter cette liste de critères, grâce à sa connaissance du marché ou de la problématique de l’entreprise. Dans ce cas, l’entreprise va s’intéresser particulièrement aux entreprises qui recrutent. Une fois cette phase de profilage réalisée, l’entreprise doit rechercher les sources qui vont lui permettre de compléter son dispositif. Elle va, de la sorte, collecter et combiner les sources externes aux sources internes dans le but d’articuler sa démarche autour des critères identifiés précédemment. En complément de son CRM, l’entreprise va donc s’appuyer sur des sources OpenData obtenues par exemple sur des sites comme Data.gouv ou Pole Emploi et Emploi store. L’entreprise entre alors dans une dimension de Big Data.

La phase de modélisation intervient ensuite. Les données collectées alimentent un entrepôt de données, et peuvent faire l’objet de traitement afin d’être nettoyées et croisées. Les données sont assemblées et organisées en fonction des clés de rapprochements disponibles (N° Siret, Code Postal, …), afin de constituer un modèle de données exploitable par le Data Scientist.

Par la suite, l’entreprise va appliquer la succession de filtres pour ne voir apparaître que les entreprises répondant aux critères sélectionnés.

C’est ainsi que l’entreprise passe d’une base de près de 11 millions de données à un total affiné de 24 entreprises, il s’agit de la phase de production des données. Ce sont ces entreprises que les commerciaux devront aller prospecter en priorité.

L’entreprise pourra ensuite présenter les résultats aux managers et aux équipes commerciales de l’entreprise, avec l’aide d’un outil de Datavisualisation, accessible n’importe où, depuis leur véhicule par exemple sur leur smartphone ou leur tablette.

Enfin, dès lors que l’algorithme est constitué et que le modèle est validé et jugé pertinent, il peut être dupliqué et adapté à différents cas d’usage, on parle alors d’exploitation du dataproduct.

Vous découvrez, à travers cet exemple, que la Data Science peut également être applicable pour les PME. Le Data management, la data analyse et enfin la data visualisation permettent ici concrètement de répondre à cette mission d’aide à la prospection.

Pour découvrir l’intégralité de ce scénario, visionnez la vidéo de l’atelier d’Ayrald Berthod à l’occasion du salon Big Data 2018.