L’Analytics en quelques questions
Pourquoi parle-t-on autant d’analyse de données ?
Nous sommes dans un monde où les données sont omniprésentes. Elles sont alimentées au quotidien par un grand nombre d’actions allant notamment des interactions humaines (réseaux sociaux, transactions financières, emails, etc.), en passant par les objets connectés (téléphones, voitures, trains etc…) jusqu’aux process spécifiques des sociétés (supply chain, fraudes, ventes, etc….).
Ces données contiennent énormément de renseignements sur des activités, des personnes morales ou physiques.
Analyser ces données, afin de pouvoir en extraire de l’information permettant de maitriser son environnement est un challenge important!
Car mieux comprendre son environnement, savoir par avance ce qui peut se produire, permet notamment d’optimiser la prise de décision (par exemple: la météo!).
A qui l’Analytics peut-il être utile?
Tous les domaines fonctionnels sont concernés, du moment qu’il existe des données contenant de l’information, qu’elles soient “Big” ou “Small”.
L’analyse de données peut apporter à toutes ces questions des éléments de réponse qui vont confirmer ou démentir des intuitions et/ou révéler des tendances inconnues jusqu’alors.
Qui analyse les données ?
Les analyses de données sont réalisées par des personnes spécialisées dites dataminers / data scientists, en partenariat avec des personnes connaissant le métier.
Ces profils d’analystes doivent avoir des compétences en mathématiques, statistiques mais aussi en développement informatique et bien comprendre les enjeux de leurs études. Ils sont de plus en plus nombreux sur le marché, aidés par l’augmentation du nombre de formations et par l’image positive du métier de data scientist qui est présenté par la presse comme le métier du 21 ème siècle.
Comment faire ?
Pour essayer de répondre à ces problématiques, les DataScientists / Analystes vont utiliser des méthodes statistiques / mathématiques. Il en existe notamment 5 types :
- Méthodes descriptives : elles permettent d’avoir une vue d’ensemble des données, de comprendre les tendances qu’il peut y avoir.
- Méthodes de clustering: Elles permettent de créer des groupes d’individus homogènes.Cela permet de ne plus résonner au niveau de l’individu, mais d’un groupe d’individus qui se “ressemblent”. Elles peuvent être très utiles dans le domaine du marketing par exemple, où les populations concernées peuvent être importantes (clients des opérateurs téléphoniques, d’une marque de supermarché…)
- Méthodes d’estimation : Elles permettent de mettre en place des modèles d’estimation. (exemple : si un enfant fait 90 cm à ses 2 ans, sa taille d’adulte estimée sera d’environ 1m80)
- Méthodes de prévision : Elles permettent de prévoir la valeur que prendra une variable dans le futur (météo, chiffre d’affaire, etc.)
- Méthodes de scoring : Elles permettent de définir une probabilité qu’un individus fasse telle ou telle action (exemple : le score de risque de fraude permet de repérer les individus qui risquent de frauder)
A cela vont s’ajouter des méthodes de multimedia mining (text mining, video mining, etc.) et de web mining notamment.
A-t-on besoin de Big data pour faire de l’Analytics ?
La notion de Big Data fait en effet grand bruit en ce moment mais il n’est pas nécessaire d’avoir des peta octets de données pour faire de l’Analytics. Parfois, mieux vaut une petite base de données riche en informations que des Big Data ne permettant pas de répondre aux questions des métiers.
Cependant les Big Data, les nouvelles capacités de stockage et d’analyse de ces dernières, ouvrent de nouvelles perspectives…
Que faire une fois les données analysées?
Une fois la valeur extraite des données, l’un des gros challenges est de rendre intelligibles les résultats via notamment la visualisation ou DataViz. Cela sera le sujet d’un prochain article.
Je n’aime pas lire, y-a-t-il un autre support?
En conclusion
L’Analytics est donc un outil d’aide à la décision qui peut faire la différence dans l’évolution d’une activité. Nous espérons que cet article vous a aidé à en saisir les enjeux. D’autres articles abordant la méthodologie et les aspects techniques viendront le compléter par la suite.
Article écrit par Anne-Sophie LAUGIER et Louis-Baptiste FRANCE
Felicitations Louis-Baptiste…Parmi les 5 methodes d analyse presentees, dans quelle categorie tu mets l analyse explicative qui fait intervenir les modeles lineaires et non lineaires, les reseaux de neurones, les arbres de decisions..?
Bonjour Amisial,
Pour répondre à ta question, pour moi les modèles linéaires et non linéaires peuvent aussi bien servir à l’estimation, à la prédiction que au scoring. Il faut cependant choisir la méthode adaptée à ce que l’on souhaite faire. Nous écrirons un article pour présenter plus précisément les méthodes et leurs cas d’usages.
Pour les arbres et les réseaux de neurones, je dirais que ces méthodes sont plutôt faites pour l’estimation mais peuvent être adaptées pour le scoring et la prédiction dans certain cas.
Lbf
Super…J’attends le nouvel article!