Apprentissage automatique au jeu de Nim
Marie Duflot-Kremer est une chercheuse et médiatrice scientifique, qui a compilé ou développé tout un ensemble d'activités de médiation autour du numérique. J'utilise l'une d'entre elle dans mes dernières séances à la fin de l'année : Quand une machine apprend à jouer au jeu de Nim.
Le jeu de Nim est très connu : les deux joueuses ont un certain nombre d'alumettes devant elles. À leur tour, elles choisissent d'en enlever une, deux ou trois. La joueuse qui enlève la dernière alumette a perdu1.
Dans sa version, Marie Duflot-Kremer propose une intelligence artificielle qui va jouer et gagner à ce jeu. Là où son activité est très intéressante, c'est que l'intelligence artificielle va apprendre à jouer et gagner : en répétant un grand nombre de partie, en faisant des choix au hasard, et en éliminant les mauvais choix, elle va de mieux en mieux jouer, jusqu'à gagner à chaque fois.
Je trouve cette activité très intéressante pour comprendre l'apprentissage automatique utilisé par énormément d'intelligences artificielles que les élèves ont pu observer ou utiliser : aucun humain n'a « expliqué » à ces systèmes comment fonctionner, mais ils ont fourni assez de données pour qu'ils apprennent seuls.
Documents
Dans la version de Marie Duflot-Kremer, les joueurs et joueuses utilisent des verres et des jetons. Pour alléger le matérier nécessaire, j'ai fait une version avec des cases sur une feuille, et des jetons à découper. L'ensemble (plateau de jeu, jetons, rappel des règles) tient sur une feuille A4.
- Les règles du jeu à projeter : apprentissage-automatique-jeu-de-nim-regles.pdf (source)
- La feuille à distribuer : apprentissage-automatique-jeu-de-nim-regles.pdf (source)
Déroulement
- Je commence par expliquer le jeu (en faisant une partie au tableau contre les élèves), puis je laisse les élèves jouer entre eux (avec des stylos à la place des alumettes), pour qu'ils s'approprient et comprennent le jeu.
- Puis j'explique l'activité, et je leur distribue ce document, qui contient les règles et les jetons.
- Je circule pour aider les élèves qui se trompent et appliquent mal la règle. Dans ce cas, l'intelligence artificielle « apprend mal ».
- Je finis par un bilan en expliquant que c'est ainsi que fonctionnent beaucoup des intelligences artificielles qu'ils manipulent : en apprenant à partir de données connues.
Celles et ceux qui ont grandi avec Fort Boyard connaissent bien ce jeu.↩