Résumé - GEPA : L'évolution des prompts réfléchis peut surpasser l'apprentissage par renforcement

Titre

GEPA : L'évolution des prompts réfléchis peut surpasser l'apprentissage par renforcement

Temps

2025-07-25 17:42:32

Auteur

{"Lakshya A Agrawal","Shangyin Tan","Dilara Soylu","Noah Ziems","Rishi Khare","Krista Opsahl-Ong","Arnav Singhvi","Herumb Shandilya","Michael J Ryan","Meng Jiang","Christopher Potts","Koushik Sen","Alexandros G. Dimakis","Ion Stoica","Dan Klein","Matei Zaharia","Omar Khattab"}

Catégorie

{cs.CL,cs.AI,cs.LG,cs.SE,"I.2.7; I.2.6; I.2.4; I.2.8"}

Lien
http://arxiv.org/abs/2507.19457v1

PDF Lien
http://arxiv.org/pdf/2507.19457v1

Résumé

GEPA (Optimiseur Paréto-Génétique) est un nouvel optimiseur de prompts pour les modèles de langage à grande échelle (LLM) qui améliore considérablement l'efficacité et l'efficience de l'optimisation de prompt. Contrairement aux approches traditionnelles d'apprentissage par renforcement (RL), GEPA utilise l'interprétabilité du langage pour apprendre des règles de haut niveau par essai et erreur, ce qui entraîne une optimisation de prompt plus efficace et efficace. **Caractéristiques clés de GEPA** : * **Évolution reflective des prompts** : GEPA utilise la réflexion naturelle en langage pour diagnostiquer les problèmes, proposer et tester des mises à jour de prompt, et combiner des leçons complémentaires de la frontière Pareto de ses propres tentatives. Cela permet à GEPA de transformer même un petit nombre de rollouts en une grande amélioration de qualité. * **Effet de la taille de l'échantillon** : GEPA surpasse les méthodes de pointe telles que GRPO et MIPROv2 de 10 % en moyenne et de 20 %, tout en utilisant jusqu'à 35 fois moins de rollouts. * **Généralisation robuste** : GEPA montre une forte généralisation sur diverses tâches et modèles, en devenant une solution pratique pour optimiser des flux de travail AI complexes, réels et du monde réel. * **Conscience du système** : GEPA intègre des trajectoires de niveau système (par exemple, la raison, les appels d'outils et les sorties d'outils) dans son processus d'optimisation, ce qui lui permet d'optimiser les prompts à un niveau supérieur et d'améliorer les performances globales du système. **Composants de GEPA** : 1. **Boucle d'optimisation génétique** : GEPA itère en mutant les prompts à l'intérieur du système AI, informé par les signaux d'apprentissage des nouveaux rollouts collectés et en suivant l'ascendance de chaque candidat nouveau. 2. **Mutation reflective des prompts** : GEPA utilise des LLM pour examiner reflectivement les traces d'exécution du système et évaluer l'efficacité des prompts individuels des modules, proposant de nouvelles instructions pour l'amélioration. 3. **Sélection de candidats basée sur la frontière Pareto** : GEPA maintient une frontière Pareto de prompts candidats, sélectionnant des candidats divers et performants pour une optimisation supplémentaire, évitant les optima locaux et promouvant une généralisation robuste. **Applications de GEPA** : GEPA a été appliqué avec succès à diverses tâches, y compris : * **Raison en plusieurs étapes** : HotpotQA * **Suivi des instructions** : IFBench * **Délégation à la confidentialité** : PUPA * **Vérification enrichie par la recherche** : HoVer * **Optimisation du code** : NPUEval et KernelBench **Bénéfices de GEPA** : * **Amélioration de l'effet de la taille de l'échantillon** : GEPA réduit considérablement le nombre de rollouts nécessaires pour une optimisation de prompt efficace, rendant ainsi plus feasible l'optimisation des flux de travail AI complexes. * **Amélioration des performances** : GEPA entraîne des améliorations significatives dans les performances des tâches, surpassant les méthodes de pointe dans de nombreux cas. * **Généralisation robuste** : GEPA montre une forte généralisation sur diverses tâches et modèles, en devenant une solution polyvalente pour optimiser les flux de travail AI. **Conclusion** : GEPA représente une avancée significative dans l'optimisation de prompt pour les LLM. En utilisant l'interprétabilité du langage et en intégrant la connaissance de niveau système, GEPA offre une approche plus efficace, plus efficace et plus robuste pour optimiser les flux de travail AI.

Articles Recommandés

Problème de Robin avec des données de mesure et des singularités non linéaires sur la frontière

Prévision conforme conditionnelle à la classe pour plusieurs entrées par agrégation de valeurs p

TrinityDNA : Un modèle fondamental bio-inspiré pour la modélisation efficace des séquences longues d'ADN

Démonstration de la sensibilité accrue du deutérium aux violations de symétrie régies par l'Extension du Modèle Standard

Fonction L de Godement--Jacquet et élèvement homologique du theta

TrajLens : Analyse visuelle pour la construction de trajectoires de développement cellulaire dans l'exploration croisée des échantillons

Classer les anneaux d'entiers de Grothendieck jusqu'au rang 5 et au-delà

Dynamique Keplerienne Linéaire et Régulière par des Transformations Projectives : Une Perspective Géométrique

DT4PCP : Un cadre de jumeau numérique pour la planification personnalisée des soins appliqué à la gestion du diabète de type 2

Le programme de Chaudronnerie des Guimauves avec IGRINS sur le télescope Gemini South III : Regarder plus profondément dans l'atmosphère appauvrie en métaux d'une géante gazeuse au seuil de la transition de Jupiter chaud à ultra-chaud