Taxi Driver – Reinforcement Learning

Projet d'ouverture d'IA Epitech

PROJET INDIVIDUELPROJET EPITECH

Gaëlle De Nas De Tourris

3/12/20261 min temps de lecture

yellow taxi parked beside curb
yellow taxi parked beside curb

Description du projet

Dans ce projet, j’ai développé un agent intelligent capable de résoudre le problème Taxi-v3 à l’aide de techniques de Reinforcement Learning.

L’objectif est de permettre à un taxi autonome d’apprendre à :

  • naviguer dans une grille,

  • récupérer un passager,

  • le déposer à la bonne destination,

    tout en optimisant ses décisions pour minimiser le nombre d’actions et maximiser les récompenses.

Approche technique

J’ai implémenté un agent basé sur l’algorithme SARSA (State-Action-Reward-State-Action), un algorithme de type on-policy.

Contrairement à Q-learning, SARSA apprend en tenant compte de la politique réellement suivie (ε-greedy), ce qui permet :

  • une meilleure stabilité,

  • un comportement plus réaliste,

  • une gestion naturelle de l’exploration.

Fonctionnalités principales

  • Implémentation complète d’un agent SARSA

  • Pipeline d’entraînement configurable (hyperparamètres via YAML)

  • Système de métriques :

    • reward moyen

    • nombre de steps

    • taux de réussite

  • Visualisation des performances :

    • courbes d’apprentissage

    • moyenne mobile

  • Mode rendu graphique de l’environnement

  • Architecture modulaire permettant d’ajouter facilement d’autres algorithmes (Q-learning, Monte Carlo, etc.)