Taxi Driver – Reinforcement Learning
Projet d'ouverture d'IA Epitech
PROJET INDIVIDUELPROJET EPITECH
Description du projet
Dans ce projet, j’ai développé un agent intelligent capable de résoudre le problème Taxi-v3 à l’aide de techniques de Reinforcement Learning.
L’objectif est de permettre à un taxi autonome d’apprendre à :
naviguer dans une grille,
récupérer un passager,
le déposer à la bonne destination,
tout en optimisant ses décisions pour minimiser le nombre d’actions et maximiser les récompenses.
Approche technique
J’ai implémenté un agent basé sur l’algorithme SARSA (State-Action-Reward-State-Action), un algorithme de type on-policy.
Contrairement à Q-learning, SARSA apprend en tenant compte de la politique réellement suivie (ε-greedy), ce qui permet :
une meilleure stabilité,
un comportement plus réaliste,
une gestion naturelle de l’exploration.
Fonctionnalités principales
Implémentation complète d’un agent SARSA
Pipeline d’entraînement configurable (hyperparamètres via YAML)
Système de métriques :
reward moyen
nombre de steps
taux de réussite
Visualisation des performances :
courbes d’apprentissage
moyenne mobile
Mode rendu graphique de l’environnement
Architecture modulaire permettant d’ajouter facilement d’autres algorithmes (Q-learning, Monte Carlo, etc.)