Resumen - TrinityDNA: Un modelo fundamental bioinspirado para modelado eficiente de longas secuencias de ADN

Título
TrinityDNA: Un modelo fundamental bioinspirado para modelado eficiente de longas secuencias de ADN

Tiempo
2025-07-25 12:55:30

Autor
{"Qirong Yang","Yucheng Guo","Zicheng Liu","Yujie Yang","Qijin Yin","Siyuan Li","Shaomin Ji","Linlin Chao","Xiaoming Zhang","Stan Z. Li"}

Categoría
{cs.CE}

Enlace
http://arxiv.org/abs/2507.19229v1

PDF Enlace
http://arxiv.org/pdf/2507.19229v1

Resumen

El documento presenta TrinityDNA, un nuevo modelo de aprendizaje profundo diseñado para abordar los desafíos de la modelización de secuencias de ADN. Integra componentes informados biológicamente y arquitecturas innovadoras para mejorar la precisión y la eficiencia del análisis de secuencias genómicas. **Características clave de TrinityDNA**: * **Componentes Inspirados Biológicamente**: * **Módulo de Fusión de Surcos**: Captura las características estructurales únicas del ADN, como los surcos mayor y menor, mediante operaciones de convolución de escalas múltiples. * **Mecanismo de Reversión Complementaria Conmutada (GRC)**: Explica la simetría inherente de las secuencias de ADN procesando tanto la hebra complementaria como la hebra reversa en paralelo. * **Mecanismo de Atención de Escalas Múltiples**: Permite que el modelo capture dependencias en diferentes escalas, desde motivos locales a regiones regulatorias de largo alcance. * **Estrategia de Entrenamiento Evolutivo**: Se adapta gradualmente a contextos genómicos diversos y a longitudes de secuencias variadas al entrenar con genomas procarióticos y eucarióticos. **Ventajas de TrinityDNA**: * **Mejorada Precisión**: Logra mejoras significativas en la predicción de funciones génicas, la discovery de mecanismos regulatorios y otras aplicaciones genómicas. * **Eficiencia**: Captura de manera eficiente dependencias a largo plazo y manejo de datos genómicos a gran escala. * **Generalización**: Se adapta bien a contextos genómicos diversos y a longitudes de secuencias variadas. **Evaluación**: El documento evalúa a TrinityDNA en diversas tareas de aplicación, incluyendo: * **Benchmarck de Evaluación de Comprensión Genómica (GUE)**: Alcanza un rendimiento de vanguardia en tareas como la clasificación de elementos regulatorios, predicción de marcadores de histona y anotación de sitios de unión de ARN. * **Desempeño de Zero-shot**: Supera a los modelos existentes en una amplia gama de tareas, incluyendo la predicción de patogenicidad de ADN, RNA DMS y predicción de la condición física de proteínas. * **Benchmarck de Anotación de Secuencia de CDS**: Demostrando sólidas capacidades de generalización a través de diversidad de conjuntos de datos y superando a las herramientas de predicción clásicas de genes. **Conclusión**: TrinityDNA representa un progreso significativo en la modelización de secuencias de ADN. Al incorporar componentes informados biológicamente, arquitecturas innovadoras y estrategias de entrenamiento robustas, ofrece un enfoque más preciso y eficiente para el análisis de secuencias genómicas. Esto tiene el potencial de revolucionar varios campos, incluyendo la medicina personalizada, la biotecnología y la biología evolutiva.


Artículos Recomendados

Cuantificación impulsada por el Espacio Latente de la Formación de Biofilms utilizando Microfluídica de Gotas a Tiempo Resuelto

SafeWork-R1: Evolución Coevolucionada de la Seguridad e Inteligencia bajo la Ley AI-45$^{\circ}$

La álgebra de Jacobi de rango dos

Una caracterización constructiva de los gráficos uniformemente 4-conectados

Hacia Modelos Subrogados Robustos: Comparación de Enfoques de Aprendizaje Automático para Acelerar Simulaciones de Fractura Británica con Materiales de Fase菲

Representaciones Exactas versus Aproximadas de Funciones Booleanas en la Base de De Morgan

Marco de Aprendizaje Profundo de Refuerzo Hierárquico para la Gestión de Activos a Multi-Año con Restricciones de Presupuesto

Aplanamiento $L^2$ de Medidas Auto-similares en Curvas No-degeneradas

Susurros del Universo Temprano: El Ringdown de los Agujeros Negros Primitivos

Optimización a gran escala de portafolios con enfriamiento variacional neuronal