Machine Learning

Le Machine Learning est tout autour de nous. Il intervient chaque fois que nous cherchons un mot dans Google, une série sur Netflix, une vidéo sur YouTube, un produit sur Amazon.

Grâce au Machine Learning, des millions de cancers peuvent être diagnostiqués chaque année, des milliards de spams et de virus informatiques sont bloqués pour protéger nos ordinateurs, et sans lui la voiture autonome n’existerait peut-être jamais.

Pourtant le grand public, qui lui donne à tort le nom « Intelligence Artificielle », en ignore presque tout. Et il est bien connu que l’Homme a peur de ce qu’il ne comprend pas.

En suivant ce cours, je vous invite à un voyage qui va vous permettre de briser la glace avec l’Intelligence Artificielle et d’apprendre réellement une nouvelle compétence professionnelle : Le Machine Learning.

Cours

Au format PDF en couleur

Cours Version imprimante TD/TP Références
Chapitre 1 : Les fondations du Machine Learning .

RésuméNous présentons l’apprentissage automatique, ses applications et diverses classes de problèmes.
Concepts : classification et régression, apprentissage supervisé et non supervisé, généralisation.

COURS 1 lien1 Chloé-Agathe
Chapitre 2 : La Régression Linéaire 

RésuméNous introduisons des approches paramétriques à l’apprentissage supervisé ainsi que les modèles linéaires les plus simples. Nous formulons la régression linéaire en tant que problème d’estimation du maximum de vraisemblance et dérivons son estimateur.
Concepts : méthodes paramétriques, estimations du maximum de vraisemblance, régression linéaire, régression logistique.

COURS 2 line2 Chloé-Agathe
Chapitre 3 : Régression Logistique et Algorithmes de Classification

RésuméNous introduisons des approches paramétriques à l’apprentissage supervisé ainsi que les modèles linéaires les plus simples. Nous formulons la régression linéaire en tant que problème d’estimation du maximum de vraisemblance et dérivons son estimateur.
Concepts : méthodes paramétriques, estimations du maximum de vraisemblance, régression linéaire, régression logistique.

Polycopié lien3 G. Saint-Cirgue
Chapitre 4 : Réseaux de Neurones

RésuméNous présentons l’algorithme perceptron de Rosenblatt (1957), l’une des premières étapes vers l’apprentissage avec des ordinateurs, et discutons de ses nombreuses extensions.
Concepts : perceptrons, réseaux multicouches, rétropropagation.

COURS 3 lien4 G. Saint-Cirgue
Chapitre 5 : Apprentissage Non-Supervisé

RésuméNous concluons ce cours en présentant le problème d’apprentissage non supervisé le plus courant, c’est-à-dire le clustering, ou comment trouver des groupes au sein de données qui sont données sans étiquettes.
Concepts : clustering hiérarchique, k-means, DBSCAN.

COURS 4 lien5 Chloé-Agathe
Chapitre 7 : Comment gérer un projet de Machine Learning. COURS 5 lien6 G. Saint-Cirgue

Vous retrouverez ces documents sur les sites ( http://cours.ensa-learning.com)et sur le serveur mon Classroom partagé en classes.

Résumé:

Apprentissage automatique supervisé et non supervisé

Dans l’univers des algorithmes d’apprentissage automatique, il en existe deux grands types : supervisé et non supervisé. On parle d’apprentissage supervisé dans le cas où un modèle d’apprentissage automatique est évalué et ajusté en fonction d’une certaine quantité connue. La majorité des algorithmes d’apprentissage automatique sont d’ailleurs supervisés. On parle d’apprentissage non supervisé dans le cas où le modèle d’apprentissage automatique déduit des schémas et des informations à partir des données, tout en déterminant le paramètre d’ajustement de la quantité connue lui-même. Ces modèles sont plus rares en pratique, mais ils sont utiles en soi et peuvent aider à orienter notre réflexion quant à la manière d’explorer les données en vue de réaliser une analyse plus approfondie.

Un exemple d’apprentissage supervisé pourrait être quelque chose comme ceci : nous avons un modèle que nous avons construit et qui dit que « toute entreprise qui vend moins de 10 unités est un mauvais performeur, et toute entreprise qui vend plus de 10 unités est un bon performeur ». Nous avons ensuite un jeu de données que nous voulons tester en partant de cet énoncé. Supposons que nos données contiennent les chiffres d’un magasin qui vend huit unités. C’est moins de 10, et donc, selon la définition de notre modèle, il est classé comme étant un mauvais performeur. Dans cette situation, nous avons un modèle qui absorbe les données qui nous intéressent, et qui nous donne un résultat tel que décidé selon les conditions posées par le modèle.

Par contraste, un modèle d’apprentissage non supervisé pourrait ressembler à ceci : nous avons un tas de données, et nous voulons savoir comment les scinder en groupes significatifs. Nous pourrions par exemple avoir une masse de données provenant d’une enquête sur la taille et le poids des gens. Nous pouvons alors utiliser certains algorithmes non supervisés pour trouver un moyen de regrouper ces informations en grappes (ou clusters) significatives pour lesquelles nous serions à même de définir des tailles de vêtements. Dans ce cas, le modèle n’a pas de réponse préalable lui disant : « Connaissant la taille et le poids de cette personne, je devrais la classer comme ayant une petite taille de pantalon ». Il doit trouver cette réponse par lui-même.

Ressources

Documentation SI

  • Dossiers PDF
    • a venir
  • Dossiers web
    • Avenir
  • Presse web spécialisée ML
    • 1
    • 2

Outils Machine Learning