Apprentissage automatique au jeu de Nim

Documents
Déroulement

Marie Duflot-Kremer est une chercheuse et médiatrice scientifique, qui a compilé ou développé tout un ensemble d'activités de médiation autour du numérique. J'utilise l'une d'entre elle dans mes dernières séances à la fin de l'année : Quand une machine apprend à jouer au jeu de Nim.

Le jeu de Nim est très connu : les deux joueuses ont un certain nombre d'alumettes devant elles. À leur tour, elles choisissent d'en enlever une, deux ou trois. La joueuse qui enlève la dernière alumette a perdu¹.

Dans sa version, Marie Duflot-Kremer propose une intelligence artificielle qui va jouer et gagner à ce jeu. Là où son activité est très intéressante, c'est que l'intelligence artificielle va apprendre à jouer et gagner : en répétant un grand nombre de partie, en faisant des choix au hasard, et en éliminant les mauvais choix, elle va de mieux en mieux jouer, jusqu'à gagner à chaque fois.

Je trouve cette activité très intéressante pour comprendre l'apprentissage automatique utilisé par énormément d'intelligences artificielles que les élèves ont pu observer ou utiliser : aucun humain n'a « expliqué » à ces systèmes comment fonctionner, mais ils ont fourni assez de données pour qu'ils apprennent seuls.

Documents

Dans la version de Marie Duflot-Kremer, les joueurs et joueuses utilisent des verres et des jetons. Pour alléger le matérier nécessaire, j'ai fait une version avec des cases sur une feuille, et des jetons à découper. L'ensemble (plateau de jeu, jetons, rappel des règles) tient sur une feuille A4.

Les règles du jeu à projeter : apprentissage-automatique-jeu-de-nim-regles.pdf (source)
La feuille à distribuer : apprentissage-automatique-jeu-de-nim-regles.pdf (source)

Déroulement

Je commence par expliquer le jeu (en faisant une partie au tableau contre les élèves), puis je laisse les élèves jouer entre eux (avec des stylos à la place des alumettes), pour qu'ils s'approprient et comprennent le jeu.
Puis j'explique l'activité, et je leur distribue ce document, qui contient les règles et les jetons.
Je circule pour aider les élèves qui se trompent et appliquent mal la règle. Dans ce cas, l'intelligence artificielle « apprend mal ».
Je finis par un bilan en expliquant que c'est ainsi que fonctionnent beaucoup des intelligences artificielles qu'ils manipulent : en apprenant à partir de données connues.

Celles et ceux qui ont grandi avec Fort Boyard connaissent bien ce jeu.↩