Resumen - El impacto de la mezcla de lenguas en la razón de los modelos de lenguaje bilingües
Título
El impacto de la mezcla de lenguas en la razón de los modelos de lenguaje bilingües
Tiempo
2025-07-21 17:56:09
Autor
{"Yihao Li","Jiayi Xin","Miranda Muqing Miao","Qi Long","Lyle Ungar"}
Categoría
{cs.CL,cs.AI,cs.LG}
Enlace
http://arxiv.org/abs/2507.15849v1
PDF Enlace
http://arxiv.org/pdf/2507.15849v1
Resumen
Este documento investiga el impacto de la mezcla de lenguas en las habilidades de razonamiento de los modelos de gran lenguaje bilingües (LLMs). Explora el fenómeno de la mezcla de lenguas, donde los LLMs saltan entre inglés y chino durante el razonamiento, y examines si este comportamiento beneficia o obstaculiza su desempeño.
Los autores observan primero que una mayor capacidad de razonamiento se correlaciona con un aumento en la mezcla de lenguas, sugiriendo que la mezcla de lenguas podría ser una estrategia deliberada para mejorar el razonamiento. Identifican el aprendizaje por refuerzo con recompensas verificables (RLVR) como la etapa de entrenamiento crucial que induce la mezcla de lenguas.
Para probar el impacto de la mezcla de lenguas en el razonamiento, llevaron a cabo experimentos en los que limitaron las salidas de los LLM a ser monolingües y las compararon con salidas bilingües no restringidas. Descubrieron que las salidas bilingües superaron significativamente a las monolingües en tareas de razonamiento matemático.
Además, entrenaron un explorador ligero para predecir si un cambio de lenguaje potencial beneficiaría o perjudicaría el razonamiento. Este explorador se utilizó para guiar la decodificación, lo que resultó en mejoras adicionales en la precisión. Esto sugiere que la mezcla de lenguas no es simplemente un subproducto del entrenamiento multilingüe, sino un comportamiento de razonamiento estratégico que se puede aprovechar para mejorar el razonamiento de los LLM.
En general, el documento proporciona evidencia de que la mezcla de lenguas puede ser una estrategia beneficiosa para el razonamiento de los LLM. Resalta la importancia de entender los factores que influyen en la mezcla de lenguas en los LLM y sugiere formas de aprovechar este comportamiento para mejorar el rendimiento del razonamiento.
Artículos Recomendados
Baryonificación II: Limitando el retroalimentamiento con observaciones de rayos X y kinematic Sunyaev-Zel'dovich
Conjuntos evasivos, variedades entrelazadas, y árboles de clique contenedor
Aplicación de nuevos diseños de refrigeración conformal para la inyección de moldes verdes de partes poliméricas delgadas complejas con especificaciones dimensionales altas
Un Estudio de Flujos No Lineales y Bandas de Escalpeado en Micelas de Cinta de gusano Bajo Varying Elasticidad, Curvatura de Flujo y Química de Surfactante
Un nuevo enfoque para la clasificación de Neurotransmisores Monoaminas mediante la aplicación de Aprendizaje Automático en Series de Decaimiento de Auto Fluorescencia Ingenierada con Plasmonas de UV (AFTDS)
Búsqueda de leptones neutros pesados en desintegraciones de $π^+$ a positrones
OWLS I: La Encuesta de Legado de Olin Wilson
Extender la gravedad unificada para tener en cuenta la interacción gravitón-gravitón
Ciencia en Riesgo: La Necesidad Urgente de Apoyo Institucional para la Investigación Ecológica y Evolutiva a Largo Plazo en una Época de Manipulación de Datos y Desinformación
Modelado (deontológico) de Operadores Modales con el Sistema de Programación de Conjuntos de Respuestas Dirigidas por Objetivos s(CASP)