Résumé - Plateforme pour la Représentation et l'Intégration des Embeddings Moléculaires Multimodaux

Titre
Plateforme pour la Représentation et l'Intégration des Embeddings Moléculaires Multimodaux

Temps
2025-07-10 01:18:50

Auteur
{"Erika Yilin Zheng","Yu Yan","Baradwaj Simha Sankar","Ethan Ji","Steven Swee","Irsyad Adam","Ding Wang","Alexander Russell Pelletier","Alex Bui","Wei Wang","Peipei Ping"}

Catégorie
{q-bio.BM,cs.LG}

Lien
http://arxiv.org/abs/2507.07367v1

PDF Lien
http://arxiv.org/pdf/2507.07367v1

Résumé

La Plateforme pour la Représentation et l'Intégration des Embeddings Moléculaires Multimodaux (PRISME) est un nouveau cadre de machine learning visant à améliorer l'intégration et l'évaluation des représentations moléculaires dans divers contextes biologiques. L'étude met en avant les limites des méthodes d'embedding moléculaires existantes, qui sont souvent restreintes à des tâches spécifiques ou des modalités de données, conduisant à une compréhension partielle des fonctions et des interactions des gènes. Pour remédier à cela, les chercheurs ont proposé PRISME, qui utilise un autoencodeur pour intégrer plusieurs embeddings moléculaires dans une représentation unifiée et de basse dimension. Cette approche permet une vue plus holistique des signaux moléculaires et capture des insights biologiques intrinsèques à partir de différentes modalités et sources de données. L'étude a également introduit une version ajustée de l'Analysis Canonicale de Corrélation des Vecteurs Singuliers (SVCCA) pour comparer les embeddings moléculaires dérivées de sources de données distinctes. Cette analyse a révélé que les embeddings existants captent principalement des signaux moléculaires non superposés, soulignant la valeur de l'intégration des embeddings. PRISME a été validé sur divers tâches de référence, démontrant une performance cohérente et surpassant les méthodes d'embedding individuelles dans les imputations de valeurs manquantes. Le cadre soutient une modélisation complète des biomolécules, avançant le développement d'embeddings multimodaux robustes et largement applicables optimisés pour les applications de machine learning biomédical descendantes. L'étude met en avant l'importance de l'intégration des modalités complémentaires pour construire des représentations hybrides et met en lumière les bénéfices potentiels de PRISME pour surmonter les limites des méthodes d'embedding moléculaires existantes.


Articles Recommandés

Modélisation de surrogate assistée par l'apprentissage automatique avec optimisation multi-objectif et prise de décision pour un réacteur de réformation méthanée à vapeur

Modèles à usage général pour les sciences chimiques

Recherche de leptons neutres lourds dans les décays de $\pi^+$ en positrons

$PC$-A pour (non carrées) distances euclidiennes : Approximation en Temps Polynomial

Transition de phase ferromagnétique à antiferromagnétique induite par la pression dans le chalcogénure de métaux de transition Cr$_{3}$Te$_{4}$

Échelle sans invariance conforme à partir des déformations intégrables des CFT des cosets

KMT-2024-BLG-0404L : Un système de microlentille triple composé d'une étoile, d'un nain brune et d'une planète

CUDA-L1 : Amélioration de l'optimisation CUDA via l'apprentissage par renforcement contrastif

Sparsification forte pour 1-in-3-SAT via le théorème de Freiman-Ruzsa polynomial

États de mur quantique pour la réduction du bruit et des bornes de pureté éternelle