Je suis en train de me préparer à enseigner un cours d'introduction à la science des données en utilisant le langage de programmation R. Mon public est composé d'étudiants de premier cycle spécialisés dans les matières commerciales. Un étudiant de premier cycle en entreprise n'a pas d'expérience en programmation informatique, mais a suivi quelques cours utilisant Excel.
Personnellement, je suis très à l'aise avec R (ou d'autres langages de programmation) car je me suis spécialisé en informatique. Cependant, j'ai le sentiment que beaucoup de mes élèves se sentiront réticents à apprendre un langage de programmation, car cela peut leur sembler difficile.
Je connais Excel, et je pense qu'Excel peut être utile pour la simple science des données, mais il est nécessaire que les étudiants apprennent un langage de programmation sérieux pour la science des données (par exemple, R ou Python). Comment puis-je me convaincre et convaincre les étudiants qu'Excel est insuffisant pour un étudiant en commerce sérieux étudiant la science des données et qu'il est nécessaire pour eux d'apprendre une certaine programmation?
Modifié en réponse au commentaire
Voici quelques-uns des sujets que je couvrirai:
- Traitement et nettoyage des données
- Comment manipuler un tableau de données, par exemple, sélectionner un sous-ensemble de lignes (filtrer), ajouter de nouvelles variables (muter), trier les lignes par colonnes
- Jointures SQL à l'aide du package dplyr
- Comment dessiner des graphiques (nuages de points, graphiques à barres, histogrammes, etc.) à l'aide du package ggplot2
- Comment estimer et interpréter des modèles statistiques tels que la régression linéaire, la régression logistique, les arbres de classification et les k-voisins les plus proches
Parce que je ne connais pas très bien Excel, je ne sais pas si toutes ces tâches peuvent être effectuées facilement dans Excel.