4e et 5e cours sur Coursera!

En décembre, j’ai commencé le cours Data Scientist’s Toolbox sur Coursera. C’est le premier cours de la Data Science Specialization offerte par la Johns Hopkins University. La spécialisation compte 9 cours et un projet final de 7 semaines. Les cours sont offerts à chaque mois et sont dans un format de 4 semaines.

Le cours Data Scientist’s Toolbox se veut une introduction aux principaux outils et concepts que devrait avoir dans sa « boite à outils » un Data scientist. Il est composé de 3 semaines de vidéos et de quiz dont la facilité est un peu déconcertante, pour un total de 60%. L’autre 40% s’obtient en faisant un projet évalué par les pairs : une série de captures écran démontrant l’installation de RStudio ainsi que la création, la configuration et l’utilisation d’un compte GitHub.

Comme j’ai terminé en moins d’une semaine, je me suis inscrite au second cours de la spécialisation : R Programming. Ce cours est destiné à l’apprentissage du langage R pour analyser des données de façon optimale. La marche entre le premier cours et le deuxième cours est assez intense : c’est d’ailleurs le sujet de conversation le plus populaire sur le forum. Pour une personne n’ayant jamais programmé, j’ose à peine imaginer la charge de travail. De mon côté, j’ai pu terminer le cours en 2 semaines. Le cours est constitué de 4 semaines de vidéos, chacune d’elle correspondant à un quiz (pour un total de 45%) et à un projet de programmation (pour un total de 55%). Le premier et troisième projet sont évalués à l’aide d’un script qui valide les fonctions via des tests unitaires. Le deuxième projet est évalué par les pairs. Enfin, 5% additionnels peuvent être obtenus en faisant des tutoriels sur le R.

Bien que ces tutoriels soient facultatifs, je les recommande fortement aux étudiants qui voudraient prendre le cours : ils permettent de réaliser rapidement les apprentissages qui facilitent la production des projets de programmation. Le R est un langage à la syntaxe un peu particulière et les tutoriels permettent de faire des liens avec d’autres langages.

Je suis très satisfaite du niveau de difficulté du deuxième cours : ce n’est pas facile, mais ce n’est pas insurmontable non plus. Je recommanderais toutefois à ceux qui n’auraient pas de base en programmation de faire au moins un cours de programmation préalablement. Comme Lucas Allen, je recommande quelques leçons sur Codecademy.

Pourquoi pas en profiter pour participer à Hour of code?

Lire aussi : MOOC : mon expérience et 3e cours sur Coursera!

Mise à jour : Tiens, Mashable a justement publié un article au sujet de la carrière de Data Scientist!

Autre mise à jour : Je me suis laissée tentée par le cours Getting and Cleaning Data offert durant le mois de janvier, j’ai hâte de voir si le contenu est aussi intéressant que ce que laisse entrevoir le descriptif!