MOOC, Une solution pour aller vers la Data Science ?
Mais qu’est ce que c’est ?
Un MOOC (Massive Online Open Course) ou « formation en ligne massive ouverte à tous” est comme son nom l’indique un cours
- En ligne (Online)
- Ouvert à tous sans restriction (Open) et gratuit
- Auquel peuvent participer des milliers de participants (Massive)
- Avec un projet pédagogique défini (programme, exercices, contrôle de connaissances)
Il en existe sur énormément de thématiques, allant de la cuisine au développement durable en passant notamment par le juridique, la création d’entreprise ou la Data Science.
Comment ça marche ?
La première étape consiste à s’inscrire sur un site de MOOC, puis à un MOOC (cf. liste ci-dessous), cela ne vous prendra que quelques secondes.
Une fois inscrit, selon le type de MOOC les contenus sont soit disponibles immédiatement soit mis à disposition après une date de lancement officielle de la session.
Une fois commencé, on doit généralement suivre le rythme imposé, en regardant des vidéos et/ou en lisant du contenu. Des QCM et/ou des exercices pratiques sont à réaliser de manière hebdomadaire (attention, il y a souvent des deadlines à respecter!).
Un QCM ou un contrôle clôture le MOOC.
Une fois terminé, les participants reçoivent un certificat s’ils réussissent à obtenir les résultats nécessaires.
Sont-ils payants ?
Par définition non, le contenu du MOOC est ouvert et on doit pouvoir y accéder gratuitement.
Cependant, certains sites proposent de payer (entre 50 et 100 euros pour un MOOC d’un mois par exemple) afin d’obtenir une “certification” attestant que c’est bien vous qui avez suivi le cours tout au long du mois et qui avez effectué tous les QCM et exercices.
A qui sont-ils destinés ?
La réponse est assez simple car ils sont destinés à tout le monde ! Que ce soit
- Aux professionnels qui souhaitent approfondir des connaissances, monter en compétences sur de nouvelles méthodes et technologies ou alors se réorienter
- Aux étudiants qui souhaitent compléter leurs formations continues sur des thématiques plus précises
- A toute personne souhaitant découvrir ou apprendre de nouvelles choses
A noter que certains MOOC nécessitent quelques connaissances préalables sur le domaine concerné, ou font partie d’une série de MOOC, et dans ce cas il est préférable d’y assister en respectant l’ordre prévu. Les prérequis sont toujours clairement énoncés et il est tout à fait possible de s’inscrire à un MOOC sans avoir ses prérequis, l’obtention de l’éventuelle certification demandera simplement plus d’investissement personnel.
Sont-ils reconnus dans le domaine de la Data Science et pourquoi ?
Le monde du Big Data et de la Data Science que ce soit au niveau technologique ou méthodologique évolue très vite. Afin de rester compétitif et à jour une montée en compétence continue est nécessaire. Pour ce faire les MOOC peuvent beaucoup aider mais ils faut bien les choisir.
En effet, leur reconnaissance dépend principalement des points suivants :
- la richesse du contenu
- l’engagement qu’ils demandent
- leur niveau d’exigence
- du nom de l’école qui l’encadre
Par exemple un MOOC de 3h évalué par un QCM n’est évidemment pas aussi reconnu qu’une spécialisation constituée de 5 MOOC, réalisée sur 5 mois et demandant la réalisation de véritables exercices pratiques.
Avec un ou plusieurs MOOC peut-on devenir Data Scientist?
Les cours et la théorie sont extrêmement importants quelque soit la profession mais cela ne suffit pas. La pratique, en effet, permet de valider et de prouver les acquis théoriques. Une astuce consiste à participer à des concours qui ont lieu en ligne via notamment :
- Kaggle : https://www.kaggle.com/
- Challenge Data (Français) : https://challengedata.ens.fr/fr/accueil
- Datascience.net (Français) : https://www.datascience.net/fr/home/
Les problématiques abordées durant ces concours sont proposées par des sociétés, elles sont souvent très challengeantes et intéressantes. On peut participer à ces concours seul ou en équipe, et chaque soumission est classée.
La combinaison MOOC / concours (encore mieux si le classement est bon!) et une bonne solution pour enrichir un CV et se réorienter vers la DataScience.
De manière générale quels sont les avantages/contraintes des MOOC ?
Où trouver des MOOCs intéressants sur la data Science / le Big Data ?
Quelques plateformes :
- FUN : https://www.fun-mooc.fr/ (plateforme généraliste en français)
- Coursera : https://www.coursera.org (plateforme généraliste)
- Cognitive Class : https://cognitiveclass.ai/ (plateforme spécialisée en Big Data et Data science, anciennement Big Data university)
- Institut mines telecom : https://www.mines-telecom.fr/formation/les-mooc/
En guise de conclusion, nous vous proposons une liste de MOOC que nous avons testés :
- Spark est la technologies phare du BIG Data pour l’analyse et le traitement en temps réel. Ces deux MOOC permettent de rapidement monter en compétence et de devenir autonome d’autant plus quand l’on a déjà quelques connaissances en Python ou Scala :
https://cognitiveclass.ai/courses/what-is-spark/
https://cognitiveclass.ai/courses/spark-rdd/ - Hadoop est par excellence la référence des technologies de stockage Big Data, ce MOOC de 5 à 8 heures permet de bien appréhender cet écosystème complexe : https://cognitiveclass.ai/courses/introduction-to-hadoop/
- MOOC très intéressant faisant un focus sur deux modules de l’écosystème Hadoop (Flume et SQOOP) permettant d’alimenter hdfs en données : https://cognitiveclass.ai/courses/flume-sqoop-moving-data-into-hadoop/
- Si vous cherchez à monter en compétence sur R et la Data Science, il existe une spécialisation très progressive, complète et souvent pratique, constituée de 10 MOOC (de chacun 1 mois). Nous n’avons pas testé tous les MOOC de la spécialisation mais ceux que nous avons testés étaient pertinents! https://www.coursera.org/specializations/jhu-data-science
- Voici une autre spécialisation qui permet de manipuler une VM Hadoop avec des exercices pratiques. Elle permet également de manipuler Neo4J (Base Nosql graph) et introduit de manière générale pas mal de technologies de l’environnement Big Data. Cependant si le dernier MOOC sur “graph analytics” est très intéressant, il est à noter que l’année dernière, le second MOOC de la spécialisation n’était ni pertinent ni clair, nous espérons cependant que le contenu a été updaté depuis! https://www.coursera.org/specializations/big-data
- …
Article écrit par Anne-Sophie LAUGIER et Louis-Baptiste FRANCE
Bonjour,
Très bel article que j’aimerais compléter par ce commentaire : OPENCLASSROOM et UDEMY sont aussi des plate-formes de MOOC très accessibles en Data Sciences et Big Data!