Resumen - Salida: Colaboración entre humanos y AI basada en lo físico

Título
Salida: Colaboración entre humanos y AI basada en lo físico

Tiempo
2025-07-24 17:57:18

Autor
{"Xuhui Kang","Sung-Wook Lee","Haolin Liu","Yuyan Wang","Yen-Ling Kuo"}

Categoría
{cs.LG,cs.AI,cs.MA}

Enlace
http://arxiv.org/abs/2507.18623v1

PDF Enlace
http://arxiv.org/pdf/2507.18623v1

Resumen

El documento "Moving Out: Colaboración Humano-AI Basada en la Realidad Física" introduce un nuevo punto de referencia para evaluar la colaboración humano-AI en entornos basados en la realidad física. Este punto de referencia, denominado Moving Out, simula tareas que requieren que los agentes colaboren y naveguen a través de diversas restricciones físicas y comportamientos humanos. **Puntos Clave**: * **Entorno de Moving Out**: El entorno se basa en una simulación de física 2D, permitiendo a los agentes mover objetos con diferentes formas, tamaños y masas. Incluye muros, regiones de objetivo y diferentes diseños de mapas para probar varios modos de colaboración. * **Modos de Colaboración**: El documento se centra en tres modos de colaboración: * **Coordinación**: Requiere que los agentes trabajen juntos para mover objetos a través de pasillos estrechos o alrededor de obstáculos. * **Conciencia**: Requiere que los agentes sean conscientes de las acciones de los demás y tomen decisiones basadas en el entorno y en el comportamiento del otro agente. * **Consistencia de Acción**: Requiere que los agentes mantengan acciones consistentes en el tiempo para mover objetos grandes de manera eficiente. * **Tareas**: Se diseñaron dos tareas para evaluar la capacidad de los agentes de colaborar en Moving Out: * **Adaptación a Diversos Comportamientos Humanos**: Los agentes se entrenan con demostraciones humanas y se evalúan contra diferentes colaboradores humanos. * **Generalización a Restricciones Físicas No Vistas**: Los agentes se entrenan en mapas con propiedades de objetos aleatorias y se evalúan en mapas con propiedades no vistas. * **Método BASS**: Para abordar los desafíos del entorno Moving Out, el documento propone el método BASS, que incluye: * **Aumento de Comportamientos**: Genera nuevos datos de entrenamiento perturbando la postura del compañero y recombiniendo sub-trayectorias. * **Simulación**: Entrena un modelo dinámico para simular el resultado de las acciones. * **Selección**: Selecciona acciones basadas en el estado predicho y la recompensa. * **Experimentos**: El método BASS se comparó con baselines como MLP, GRU y Diffusion Policy. Los resultados mostraron que BASS superó a los baselines tanto en configuraciones de colaboración AI-AI como humano-AI. * **Estudio Humano**: Se llevó a cabo un estudio de usuarios para evaluar la efectividad de BASS en la coordinación y asistencia a humanos reales. Los resultados mostraron que BASS mejoró significativamente las tasas de finalización de tareas y redujo el tiempo de espera. **Significación**: El punto de referencia Moving Out y el método BASS proporcionan una herramienta valiosa para estudiar la colaboración humano-AI en entornos basados en la realidad física. Ayudan a los investigadores a entender los desafíos de la colaboración en entornos complejos y dinámicos y a desarrollar mejores algoritmos para que los agentes de IA trabajen de manera efectiva con los humanos. **Trabajo Futuro**: El documento sugiere varias áreas para futuras investigaciones, incluyendo: * Mejorar la velocidad de inferencia de los modelos generativos para lograr una colaboración humano-AI suave. * Utilizar las habilidades de razonamiento de los LLM en tareas de colaboración basadas en la realidad física. * Extender la investigación a dinámicas de colaboración más complejas entre múltiples agentes de IA y humanos.


Artículos Recomendados

¿Corriendo en CÍRCULO? Una prueba de benchmark simple para la seguridad de los interpretadores de código de LLM

SynC: Refinamiento del Conjunto de Datos de Títulos de Imágenes Sintéticas con Mapeo Uno-a-muchos para la Captura de Títulos de Imágenes a Cero Sesiones

Control de orden superior de la plasticidad sináptica mediada por astrocitos

Rubricas como Recompensas: Aprendizaje por Refuerzo Fuera de Dominios Verificables

Condiciones de salto Rankine-Hugoniot-MHD para ondas de choque en gases de van der Waals

Una nueva prueba de teoremas de tipo Liouville para una clase de ecuaciones elípticas semilineales

Superconductividad chirales cerca de un aislante de Chern fraccional

Descenso Bayesiano en Doble Nivel

Extracción de Enzimas Impulsada por Aprendizaje Automático: Oportunidades, Desafíos y Perspectivas Futuras

Cascada de energía universal y relajación en la turbulencia magnohidrodinámica inercial tridimensional de electrones universales