Résumé - TrinityDNA : Un modèle fondamental bio-inspiré pour la modélisation efficace des séquences longues d'ADN
Titre
TrinityDNA : Un modèle fondamental bio-inspiré pour la modélisation efficace des séquences longues d'ADN
Temps
2025-07-25 12:55:30
Auteur
{"Qirong Yang","Yucheng Guo","Zicheng Liu","Yujie Yang","Qijin Yin","Siyuan Li","Shaomin Ji","Linlin Chao","Xiaoming Zhang","Stan Z. Li"}
Catégorie
{cs.CE}
Lien
http://arxiv.org/abs/2507.19229v1
PDF Lien
http://arxiv.org/pdf/2507.19229v1
Résumé
L'article présente TrinityDNA, un modèle de deep learning novateur conçu pour répondre aux défis du modélisation des séquences d'ADN. Il intègre des composants informés biologiquement et des architectures innovantes pour améliorer l'exactitude et l'efficacité de l'analyse des séquences génomiques.
**Caractéristiques clés de TrinityDNA** :
* **Composants inspirés biologiquement** :
* **Module de fusion de rainure** : Capture les caractéristiques structurelles uniques de l'ADN, telles que les rainures principales et secondaires, à l'aide d'opérations de convolution à différentes échelles.
* **Mécanisme de complémentarité inverse contrôlée (GRC)** : Exploite la symétrie intrinsèque des séquences d'ADN en traitant en parallèle à la fois la séquence directe et son complémentaire inverse.
* **Mécanisme d'attention à plusieurs échelles** : Permet au modèle de capturer les dépendances à différentes échelles, allant des motifs locaux aux régions régulatrices à longues distances.
* **Stratégie de formation évolutionnaire** : Adapte progressivement le modèle à divers contextes génomiques et longueurs de séquence en le formant sur des génomes procaryotes et eucaryotes.
**Avantages de TrinityDNA** :
* **Amélioration de l'exactitude** : Obtient des améliorations significatives dans la prédiction de la fonction des gènes, la découverte des mécanismes régulateurs et d'autres applications génomiques.
* **Efficiency** : Capture efficacement les dépendances à longues distances et gère les données génomiques à grande échelle.
* **Generalisation** : S'adapte bien à divers contextes génomiques et longueurs de séquence.
**Évaluation** :
L'article évalue TrinityDNA sur diverses tâches descendantes, y compris :
* **Benchmarck d'évaluation de la compréhension génomique (GUE)** : Obtient des performances de pointe sur des tâches telles que la classification des éléments régulateurs, la prédiction des marqueurs d'histone et l'annotation des sites d'espacement.
* **Performance à l'initiation** : Surpasse les modèles existants sur une large gamme de tâches, y compris la pathogénicité de l'ADN, le RNA DMS et la prédiction de la fitness des protéines.
* **Benchmarck d'annotation des CDS** : Démontre des capacités de généralisation solides sur divers ensembles de données et surpasse les outils de prédiction de gènes classiques.
**Conclusion** :
TrinityDNA représente une avancée significative dans le modélisation des séquences d'ADN. En intégrant des composants informés biologiquement, des architectures innovantes et des stratégies de formation robustes, il offre une approche plus exacte et plus efficace pour l'analyse des séquences génomiques. Cela a le potentiel de révolutionner divers domaines, y compris la médecine personnalisée, la biotechnologie et la biologie évolutive.
Articles Recommandés
Modèles à usage général pour les sciences chimiques
Fonctions de deux points et les densités de vide dans l'effet Casimir pour le champ de Proca.
L'Impact des coups de naissance sur les binaries de trous noirs
Attracteur global du système de chimiotaxie avec dégradation faible et mouvements dépendants de la densité
Procédure de renforcement de la recherche par rayon des attaques avec étiquette dure à l'aide de prédictions basées sur le transfert
Écosystèmes de Suivi des Problèmes : Contexte et Meilleures Pratiques
CXR-CML : Amélioration de la classification à partir de zéro des maladies à longues queues à étiquettes multiples sur les radiographies thoraciques
Amélioration de la segmentation des images médicales par le biais d'apprentissage prototype adaptatif par exemple supervisé
Classer les anneaux d'entiers de Grothendieck jusqu'au rang 5 et au-delà
Superlubrissité du Borophène : Propriétés tribologiques par comparaison à l'hBN