Zusammenfassung - Auszugsweise Übersetzung: Umzug出去: Körpereingeschlossene Mensch-AI-Zusammenarbeit

Titel
Auszugsweise Übersetzung: Umzug出去: Körpereingeschlossene Mensch-AI-Zusammenarbeit

Zeit
2025-07-24 17:57:18

Autor
{"Xuhui Kang","Sung-Wook Lee","Haolin Liu","Yuyan Wang","Yen-Ling Kuo"}

Kategorie
{cs.LG,cs.AI,cs.MA}

Link
http://arxiv.org/abs/2507.18623v1

PDF Link
http://arxiv.org/pdf/2507.18623v1

Zusammenfassung

Das Papier "Moving Out: Physically-grounded Human-AI Collaboration" stellt einen neuen Maßstab für die Bewertung der menschlich-künstlicher-Intelligenz-Kooperation in physikalisch fundierten Umgebungen vor. Der Maßstab, Moving Out genannt, simuliert Aufgaben, die es Agenten erfordern, zu kooperieren und durch verschiedene physische Einschränkungen und menschliche Verhaltensweisen zu navigieren. **Schlüsselpunkte**: * **Moving Out-Umgebung**: Die Umgebung basiert auf einer 2D-Physiksimulation, die es Agenten ermöglicht, Objekte mit verschiedenen Formen, Größen und Massen zu bewegen. Sie enthält Wände, Zielbereiche und verschiedene Kartenlayout, um verschiedene Kooperationsmodi zu testen. * **Kooperationsmodi**: Das Papier konzentriert sich auf drei Kooperationsmodi: * **Koordination**: Erfordert, dass Agenten zusammenarbeiten, um Objekte durch enge Gänge oder um Hindernisse zu bewegen. * **Bewusstsein**: Erfordert, dass Agenten die Handlungen der anderen Agenten wahrnehmen und Entscheidungen auf Grundlage der Umgebung und des Verhaltens der anderen Agenten treffen. * **Aktionskonsistenz**: Erfordert, dass Agenten über die Zeit konsistente Aktionen aufrechterhalten, um große Objekte effizient zu bewegen. * **Aufgaben**: Zwei Aufgaben wurden entwickelt, um die Fähigkeit der Agenten zur Kooperation in Moving Out zu bewerten: * **Anpassung an verschiedene menschliche Verhaltensweisen**: Agenten werden an menschlichen Demonstrationen trainiert und gegen verschiedene menschliche Kooperationspartner getestet. * **Generalisierung zu unbekannten physischen Einschränkungen**: Agenten werden auf Karten mit zufälligen Objekteigenschaften trainiert und auf Karten mit unbekannten Eigenschaften getestet. * **BASS-Methode**: Um die Herausforderungen der Moving Out-Umgebung zu bewältigen, schlägt das Papier die BASS-Methode vor, die Folgendes umfasst: * **Verhaltensvergrößerung**: Generiert neue Trainingsdaten durch das Verzerren der Pose des Partners und die Kombination von Sub-Strategien. * **Simulation**: Trainiert ein Dynamikmodell, um das Ergebnis von Aktionen zu simulieren. * **Auswahl**: Wählt Aktionen auf Grundlage der vorausgesagten Zustände und Belohnungen aus. * **Experimente**: Die BASS-Methode wurde mit Baselines wie MLP, GRU und Diffusion Policy verglichen. Die Ergebnisse zeigten, dass BASS sowohl in AI-AI- als auch in Mensch-AI-Kooperationsumgebungen die Baselines übertroffen hat. * **Menschliche Studie**: Eine Benutzerstudie wurde durchgeführt, um die Effektivität von BASS bei der Koordination und Unterstützung echter Menschen zu bewerten. Die Ergebnisse zeigten, dass BASS die Abschlussraten der Aufgaben erheblich verbesserte und die Wartezeit reduzierte. **Bedeutung**: Der Moving Out-Maßstab und die BASS-Methode bieten ein wertvolles Werkzeug für die Untersuchung der menschlich-künstlicher-Intelligenz-Kooperation in physikalisch fundierten Umgebungen. Sie helfen Forschern, die Herausforderungen der Kooperation in komplexen und dynamischen Szenarien zu verstehen und bessere Algorithmen für künstliche Agenten zu entwickeln, die effizient mit Menschen zusammenarbeiten können. **Zukünftige Arbeiten**: Das Papier schlägt mehrere Bereiche für zukünftige Forschung vor, einschließlich: * Verbesserung der Inferenzgeschwindigkeit generativer Modelle, um eine reibungslose menschlich-künstliche-Intelligenz-Kooperation zu erreichen. * Nutzung der Beweisfähigkeiten von LLMs in physikalisch fundierten Kooperationsaufgaben. * Ausdehnung der Forschung auf komplexere Kooperationsdynamiken zwischen mehreren künstlichen Agenten und Menschen.


Empfohlene Papiere

Ein End-to-End-DNN-Infusionsrahmen für den SpiNNaker2 neuromorphen MPSoC

Eine kosmische Amplifikation für die Muon-zu-Positron-Conversion in Nukeln

CASCADE: JavaScript-Deobfuscator mit künstlicher Intelligenz auf Basis eines LLM bei Google

In-situ Impedanzspektroskopietests von Li$_{4-x}$Ge$_{1-x}$P$_x$O$_4$ als potenzieller Festkörperelektrolyt für Mikro-Li-Ionenbatterien

Monophone aus Skalar-Portal-Dunkler Materie bei Neutrino-Experimenten

Direkte numerische Simulationen des supersonischen Taylor--Green-Vortex mittels der Boltzmann-Gleichung

Symmetrischer Private Information Retrieval (SPIR) auf graphbasierten replizierten Systemen

DiffuMeta: Algebraische Sprachmodelle für umgekehrtes Design von Metamaterialien über Diffusions-Transformer

Allgemeine Energiekaskade und Relaxation in dreidimensionaler Trägheits-Elektron-Magnetohydrodynamik-Turbulenz

Über die Komplexität optimaler korrelierter Gleichgewichte in erweiterten Formspielen