Voyager est un outil innovant qui explore et apprend de manière autonome dans le monde de Minecraft, faisant de nouvelles découvertes et maîtrisant des compétences sans avoir besoin d'input humain.
Au cœur de Voyager se trouvent trois composants principaux conçus pour améliorer ses capacités. Le premier est ce qu'on appelle un 'curriculum automatique.' Ce système guide Voyager dans son exploration, adaptant son apprentissage en fonction de ses progrès et de ce qu'il a vécu jusqu'à présent. L'objectif est d'aider Voyager à découvrir une grande variété d'objets et de caractéristiques dans le jeu.
Le deuxième composant est la 'bibliothèque de compétences.' C'est essentiellement une base de données où Voyager stocke toutes les compétences complexes qu'il apprend. Chaque compétence est organisée en fonction d'une description qui aide à la retrouver plus tard lorsqu'il est confronté à des défis similaires. Cette approche organisée facilite non seulement la mémorisation des compétences par Voyager, mais aide également à prévenir l'oubli d'informations importantes au fur et à mesure qu'il apprend et évolue.
La troisième caractéristique clé est le 'mécanisme de sollicitation itératif.' Cela permet à Voyager de créer du code exécutable basé sur les retours de son environnement. Il apprend de ses erreurs et confirme sa compréhension, s'assurant qu'il peut s'adapter et s'améliorer au fil du temps.
Voyager communique principalement avec son environnement par le biais de requêtes blackbox, tirant parti d'un Modèle de Langage de Grande Taille (LLM) pour cette interaction. Au lieu d'utiliser des commandes motrices de base, il opte pour du code, qui est plus efficace pour gérer des tâches complexes sur de longues périodes. Cette capacité est cruciale dans un environnement dynamique comme Minecraft, où les actions impliquent souvent des couches de complexité et de coordination.
Dans l'ensemble, Voyager est conçu pour définir de manière autonome des tâches uniques qui correspondent à ses capacités actuelles et à l'état de son environnement. Il perfectionne continuellement ses compétences en fonction des retours qu'il reçoit, engage des compétences précieuses en mémoire pour une utilisation future, et explore indépendamment le vaste univers de Minecraft, toujours à la recherche de nouveaux défis à relever.
∞