Résumé - Vers l'apprentissage de la représentation causale temporelle avec la décomposition tensorielle

Titre
Vers l'apprentissage de la représentation causale temporelle avec la décomposition tensorielle

Temps
2025-07-18 17:55:42

Auteur
{"Jianhong Chen","Meng Zhao","Mostafa Reisi Gahrooei","Xubo Yue"}

Catégorie
{cs.LG,cs.AI,stat.ML}

Lien
http://arxiv.org/abs/2507.14126v1

PDF Lien
http://arxiv.org/pdf/2507.14126v1

Résumé

Le document "Toward Temporal Causal Representation Learning with Tensor Decomposition" de Jianhong Chen, Meng Zhao, Mostafa Reisi Gahrooei et Xubo Yue propose un cadre novateur appelé CaRTeD pour apprendre des représentations causales temporelles à partir de données de tenseurs irrégulières. Le cadre répond aux défis de l'analyse de données à haute dimension et structurées de manière irrégulière, et de l'extraction de groupes significatifs et de relations causales. Voici un résumé des points clés : **Défis et Motivation** : * De nombreux ensembles de données réels sont à haute dimension et structurés de manière irrégulière, ce qui rend difficile l'application de méthodes de découverte causale traditionnelles. * Les méthodes existantes ont du mal à intégrer l'apprentissage de la structure causale avec la décomposition de tenseurs, ce qui conduit à des résultats suboptimaux. **Cadre CaRTeD** : * **Apprentissage Joint** : CaRTeD combine l'apprentissage de représentations causales temporelles avec la décomposition de tenseurs irrégulières de manière cohérente. * **Formulation Causale Nouvelle** : Il introduit une formulation causale nouvelle pour les groupes latents, permettant à la fois des relations causales contemporaines et temporelles. * **Regularisation Flexible** : Le cadre offre une conception de régularisation plus flexible pour améliorer la décomposition de tenseurs et améliorer les performances. * **Tâches Descendantes** : CaRTeD fournit un plan pour des tâches descendantes telles que le modèle des structures latentes et l'extraction d'informations causales à partir des facteurs de tenseurs appris. **Méthodologie** : * **Décomposition Coordonnée en Blocs (BCD)** : CaRTeD utilise BCD pour mettre à jour itérativement les blocs de tenseurs et causaux. * **Optimisation Alternée (AO)** : AO est employée pour résoudre la factorisation PARAFAC2 dans le bloc de tenseurs. * **ADMM** : ADMM est utilisé pour résoudre les problèmes d'optimisation pour les blocs de tenseurs et causaux. **Analyse Théorique** : * Le document fournit une analyse de convergence théorique pour le problème d'optimisation non convexe avec des contraintes non convexes. * Il démontre que l'algorithme converge à un point stationnaire, comblant un trou dans les garanties théoriques pour la décomposition de tenseurs irréguliers. **Résultats Expérimentaux** : * Les auteurs évaluent CaRTeD sur des ensembles de données synthétiques et réels, y compris l'ensemble de données des dossiers de santé électroniques MIMIC-III. * Ils comparent CaRTeD avec les méthodes les plus avancées et montrent qu'il les dépasse en termes d'exactitude et d'explainabilité des représentations causales. **Conclusion** : CaRTeD est un cadre novateur et efficace pour apprendre des représentations causales temporelles à partir de données de tenseurs irrégulières. Il répond aux défis de l'analyse de données à haute dimension et structurées de manière irrégulière, et de l'extraction de groupes significatifs et de relations causales. Le cadre a le potentiel d'être appliqué dans divers domaines, y compris les soins de santé, la génomique et la finance.


Articles Recommandés

Cadre d'analyse instrumentale basé sur la stratification pour l'analyse des effets non linéaires

Concentration of measure for non-linear random matrices with applications to neural networks and non-commutative polynomials Concentration de mesure pour les matrices aléatoires non linéaires avec applications aux réseaux de neurones et aux polynômes non commutatifs

Vers la vérification formelle du code généré par des LLM à partir de prompts naturels

ApproxGNN : Un GNN pré-entraîné pour la prédiction des paramètres dans l'exploration de l'espace de conception pour le calcul approché

Théorie quantique du piège opto-magnétique

Agentar-DeepFinance-300K : Un grand ensemble de données financières via une optimisation systématique de la synthèse de la chaîne de pensée

Un contrôleur de recherche d'extrême sans modèle avec application à la traçabilité d'une réaction chimique non linéaire

Oscillationsphasiques à multiples échelles induites par la synchronisation en grappe dans le réseau cérébral central humain

Conditions de saut de Rankine-Hugoniot-MHD pour les ondes de choc dans les gaz de van der Waals

Mesure des inégalités de temps et de Leggett-Garg par des méthodes non invasives sur des ordinateurs quantiques publics