Taxi Driver – Reinforcement Learning

Projet d'ouverture d'IA Epitech

PROJET INDIVIDUELPROJET EPITECH

Gaëlle De Nas De Tourris

3/12/20261 min temps de lecture

Description du projet

Dans ce projet, j’ai développé un agent intelligent capable de résoudre le problème Taxi-v3 à l’aide de techniques de Reinforcement Learning.

L’objectif est de permettre à un taxi autonome d’apprendre à :

naviguer dans une grille,
récupérer un passager,
le déposer à la bonne destination,
tout en optimisant ses décisions pour minimiser le nombre d’actions et maximiser les récompenses.

J’ai implémenté un agent basé sur l’algorithme SARSA (State-Action-Reward-State-Action), un algorithme de type on-policy.

Contrairement à Q-learning, SARSA apprend en tenant compte de la politique réellement suivie (ε-greedy), ce qui permet :

Implémentation complète d’un agent SARSA
Pipeline d’entraînement configurable (hyperparamètres via YAML)
Système de métriques :
- reward moyen
- nombre de steps
- taux de réussite
Visualisation des performances :
- courbes d’apprentissage
- moyenne mobile
Mode rendu graphique de l’environnement
Architecture modulaire permettant d’ajouter facilement d’autres algorithmes (Q-learning, Monte Carlo, etc.)