Résumé - MODA : Un cadre unifié de diffusion 3D pour la génération moléculaire cible-aware multitâche
Titre
MODA : Un cadre unifié de diffusion 3D pour la génération moléculaire cible-aware multitâche
Temps
2025-07-09 18:19:50
Auteur
{"Dong Xu","Zhangfan Yang","Sisi Yuan","Jenna Xinyi Yao","Jiangqiang Li","Junkai Ji"}
Catégorie
{q-bio.BM,cs.AI,cs.LG}
Lien
http://arxiv.org/abs/2507.07201v1
PDF Lien
http://arxiv.org/pdf/2507.07201v1
Résumé
MODA est un cadre de diffusion 3D unifié conçu pour la génération moléculaire cible-aware multitâche. Ce cadre remédie aux limitations des générateurs moléculaires actuels, qui peinent avec des tâches telles que les entrées SMILES uniquement, les pipelines pré-entraînement-fin fine en deux étapes, et les pratiques un-tâche-un-modèle. MODA unifie la croissance de fragments, la conception des liants, le saut de squelette et la décoration des chaînes latérales avec un planificateur bayésien de masquage, permettant au modèle d'apprendre des prédicats géométriques et chimiques partagés entre les tâches.
Pendant l'entraînement, MODA masque un fragment spatial contigu et le débruit en une seule passe. Cela permet au modèle d'apprendre à partir de représentations partagées entre les tâches, qui sont ensuite utilisées pour générer des molécules avec une haute précision. Le cadre utilise également un planificateur bayésien multitâche de masquage, qui tire quatre masques motivés chimiquement. Cela permet à un seul modèle de remplacer quatre modèles experts spécifiques aux tâches, réduisant ainsi les coûts de données et d'ingénierie.
Les résultats de MODA montrent qu'il surpasse six bases de diffusion et trois paradigmes d'entraînement en termes de sous-structure, de propriétés chimiques, d'interaction et de géométrie. Le modèle-C réduit les conflits ligand-protein et les divergences de sous-structure tout en maintenant la conformité Lipinski, tandis que le modèle-B préserve la similarité mais est en retrait en termes de nouveauté et d'affinité de liaison. Les tests de conception de novo à blanc et d'optimisation des candidats confirment des scores Vina négatifs stables et des taux d'amélioration élevés sans refinement de champ de force.
Dans l'ensemble, MODA démontre le potentiel d'une routine de diffusion multitâche en une seule étape pour la conception moléculaire basée sur la structure. Il offre une approche plus efficace et plus efficace pour générer des molécules avec des propriétés souhaitées et pourrait potentiellement révolutionner le processus de découverte de médicaments.
Articles Recommandés
Publicité sur les recherches Google après l'affaire Dobbs c. Jackson
Quantification de la formation de biofilm grâce à l'espace latent assisté par microfluidique à goutte résolue temporellement
Estimation d'une matrice de probabilité de transition à dimension infinie à l'aide d'un processus généralisé de bris de bâtons hiérarchique
Simulation de mouvements humains de haute fidélité alimentée par l'IA générative
DiffuMeta : Modèles de langage algébriques pour la conception inverse de matériaux métamérisés via des transformatteurs de diffusion
Mesure des inégalités de temps et de Leggett-Garg par des méthodes non invasives sur des ordinateurs quantiques publics
Conception d'architectures de Multi-Chiplet à Haute Performance et Thermiquement Réalisables grâce à des Intercalaires en Verre Inflexible
Oscillationsphasiques à multiples échelles induites par la synchronisation en grappe dans le réseau cérébral central humain
Diagnostic des anomalies par restriction de symétrie dans les systèmes de lattices bidimensionnelles
Pseudorandomness des walks d'expandeurs par analyse de Fourier sur les groupes