Resumen - GEPA: La evolución de los estímulos reflexivos puede superar el aprendizaje por refuerzo.
Título
GEPA: La evolución de los estímulos reflexivos puede superar el aprendizaje por refuerzo.
Tiempo
2025-07-25 17:42:32
Autor
{"Lakshya A Agrawal","Shangyin Tan","Dilara Soylu","Noah Ziems","Rishi Khare","Krista Opsahl-Ong","Arnav Singhvi","Herumb Shandilya","Michael J Ryan","Meng Jiang","Christopher Potts","Koushik Sen","Alexandros G. Dimakis","Ion Stoica","Dan Klein","Matei Zaharia","Omar Khattab"}
Categoría
{cs.CL,cs.AI,cs.LG,cs.SE,"I.2.7; I.2.6; I.2.4; I.2.8"}
Enlace
http://arxiv.org/abs/2507.19457v1
PDF Enlace
http://arxiv.org/pdf/2507.19457v1
Resumen
GEPA (Genético-Pareto) es un optimizador de sugerencias novedoso para grandes modelos de lenguaje (LLMs) que mejora significativamente la eficiencia y efectividad de la optimización de sugerencias. A diferencia de los enfoques tradicionales de aprendizaje por refuerzo (RL), GEPA aprovecha la interpretabilidad del lenguaje para aprender reglas de alto nivel a través de ensayo y error, resultando en una optimización de sugerencias más eficiente y efectiva.
**Características Clave de GEPA**:
* **Evolución Reflexiva de Sugerencias**: GEPA utiliza la reflexión natural del lenguaje para diagnosticar problemas, proponer y probar actualizaciones de sugerencias y combinar lecciones complementarias de la frontera Pareto de sus propios intentos. Esto permite a GEPA transformar incluso pocas ejecuciones en un gran aumento de calidad.
* **Eficiencia en la Muestra**: GEPA supera a métodos de vanguardia como GRPO y MIPROv2 en un 10% en promedio y hasta un 20%, mientras utiliza hasta 35 veces menos ejecuciones.
* **Generalización Robusta**: GEPA demuestra una fuerte generalización a través de diversas tareas y modelos, convirtiéndose en una solución práctica para optimizar complejos flujos de trabajo de IA en el mundo real.
* **Consciencia del Sistema**: GEPA incorpora trayectorias a nivel de sistema (por ejemplo, razonamiento, llamadas a herramientas y salidas de herramientas) en su proceso de optimización, permitiéndole optimizar sugerencias a un nivel más alto y mejorar el rendimiento general del sistema.
**Componentes de GEPA**:
1. **Bucle de Optimización Genético**: GEPA itera mutando sugerencias dentro del sistema de IA, informado por señales de aprendizaje de nuevas ejecuciones reunidas y rastreando la ascendencia de cada candidato nuevo.
2. **Mutación Reflexiva de Sugerencias**: GEPA utiliza LLMs para examinar reflexivamente las trazas de ejecución del sistema y evaluar la efectividad de sugerencias individuales de módulos, proponiendo nuevas instrucciones para la mejora.
3. **Selección de Candidatos Basada en Pareto**: GEPA mantiene una frontera Pareto de sugerencias candidatas, seleccionando candidatos diversos y de alto rendimiento para una optimización adicional, evitando óptimos locales y promoviendo una generalización robusta.
**Aplicaciones de GEPA**:
GEPA ha sido aplicado con éxito a diversas tareas, incluyendo:
* **Razonamiento Multihop**: HotpotQA
* **Seguimiento de Instrucciones**: IFBench
* **Delegación Consciente de Privacidad**: PUPA
* **Verificación Mejorada por Búsqueda**: HoVer
* **Optimización de Código**: NPUEval y KernelBench
**Beneficios de GEPA**:
* **Mejora de la Eficiencia en la Muestra**: GEPA reduce significativamente el número de ejecuciones necesarias para una optimización efectiva de sugerencias, haciendo más factible optimizar complejos flujos de trabajo de IA.
* **Mejora del Rendimiento**: GEPA lleva a mejoras significativas en el rendimiento de tareas, superando a métodos de vanguardia en muchos casos.
* **Generalización Robusta**: GEPA demuestra una fuerte generalización a través de diversas tareas y modelos, convirtiéndose en una solución versátil para optimizar flujos de trabajo de IA.
**Conclusión**:
GEPA representa un avance significativo en la optimización de sugerencias para LLMs. Al aprovechar la interpretabilidad del lenguaje e incorporar conocimiento a nivel de sistema, GEPA ofrece un enfoque más eficiente, efectivo y robusto para optimizar flujos de trabajo de IA.
Artículos Recomendados
Caos confinado y desconfinado en sistemas de spin clásicos
Planetas más grandes que Neptuno tienen elevadas excentricidades
Construyendo Arreglos Óptimos de Triángulos Kobon a través de Codificación Tabular, Resolución de SAT y Alineación Heurística
Soluciones fuertemente periódicas a un problema de interacción fluido-estructura en capas múltiples
Godement--Jacquet L-función y elevación homológica theta
En la geometría clásica de las funciones verdes caóticas y las funciones de Wigner
$k$-PCA para Distancias Euclidianas (No Cuadradas): Aproximación en Tiempo Polinomial
Atractor global del sistema de quimiotaxis con degradación débil y movimiento dependiente de la densidad
Regressión de kriging sin características
Simulando Evolvability como un Algoritmo de Aprendizaje: Investigaciones Empíricas sobre Sensibilidad a la Distribución, Robustez y Comprimas de Restricciones