C’est quoi l’IA : une séquence « débranchée »

La machine qui apprend à jouer

Source : Quand une machine apprend à jouer au jeu de Nim

Cette activité a pour but de présenter l’intelligence artificielle, plus particulièrement une forme simple d’apprentissage (l’apprentissage par renforcement), et de montrer qu’en effectuant des actions élémentaires notre machine peut réussir à trouver la stratégie gagnante à un jeu.

  • Matériel

8 allumettes ou autres petits objets (stylos,…) ; autant de gobelets/récipients que d’allumettes ; des petits jetons sur lesquels on peut écrire (en bois, en carton…), 3 par verre

Pour préparer l’activité on va numéroter les verres avec les nombres de 1 à 8 (en l’écrivant au marqueur), et faire trois jetons par verre, numérotés 1, 2 et 3. Puis comme ça n’a pas de sens de piocher plus d’allumettes qu’il n’y en a sur la table, on ne laisse que le jeton 1 dans le verre 1, et que les jetons 1 et 2 dans le verre 2.

  • Dans un premier temps, on va faire jouer les élèves au jeu de Nim :
  • Faire jouer la machine contre un élève : l’élève va jouer en premier.

La machine quand c’est son tour va : compter le nombre d’allumettes et prendre le gobelet correspondant, piocher au hasard un jeton dans le gobelet, le poser sur la table juste devant ce gobelet, et piocher le nombre d’allumettes indiqué par le jeton (1, 2 ou 3 donc).

Quand il n’y a plus d’allumettes : soit la machine a gagné, et dans ce cas, elle remet chaque jeton dans le gobelet où elle l’a pioché, soit elle a perdu et dans ce cas elle remet tous les jetons piochés sauf le dernier, qui était clairement un mauvais choix (puisqu’il a permis à l’humain de gagner directement) et qu’elle met de côté.

On continue à faire des parties, et à un moment il peut arriver qu’un gobelet soit vide (parce que par exemple avec 4 allumettes il n’y a pas de bon choix). Dans ce cas on retourne le gobelet à l’envers, et à partir de ce moment là, si l’adversaire nous laisse avec un nombre d’allumettes pour lequel le gobelet est vide, la machine abandonne la partie, décide qu’elle a perdu (car elle sait qu’elle va perdre) et applique son algorithme de partie perdue (remettre tous les jetons piochés dans leur gobelet sauf le dernier)

Une vidéo exemple :

Pour aller plus loin :

– faire jouer deux machines l’une contre l’autre. Ainsi à chaque partie l’une des deux va perdre et apprendre quelque chose.

– toujours faire commencer la même machine, ou les faire alterner. Attention, au bout d’un certain nombre de parties l’une des deux machines va avoir une stratégie gagnante (celle qui commence ou celle qui joue en deuxième selon votre nombre d’allumettes) et l’autre va abandonner la partie systématiquement.

– faire varier le nombre d’allumettes et donc de gobelets.

Espace pédagogique de la DSDEN de la Charente Maritime - Mentions Légales - Protection des données - Autorisation parentale