Résumé - Hess-MC2 : Monte Carlo en séquence à la puissance deux utilisant des informations de Hessian et des propositions de second ordre

Titre
Hess-MC2 : Monte Carlo en séquence à la puissance deux utilisant des informations de Hessian et des propositions de second ordre

Temps
2025-07-10 06:26:54

Auteur
{"Joshua Murphy","Conor Rosato","Andrew Millard","Lee Devlin","Paul Horridge","Simon Maskell"}

Catégorie
{stat.ML,cs.LG}

Lien
http://arxiv.org/abs/2507.07461v1

PDF Lien
http://arxiv.org/pdf/2507.07461v1

Résumé

L'article "Hess-MC2 : Sequential Monte Carlo Squared utilisant des informations Hessian et des propositions de second ordre" de Joshua Murphy et al. présente une approche innovante pour l'inférence bayésienne en utilisant des méthodes de Monte Carlo séquentiel (SMC). Les auteurs visent à équilibrer l'efficacité computationnelle et l'exactitude des approximations postérieures dans les algorithmes SMC, en particulier dans le contexte de Sequential Monte Carlo Squared (SMC2). SMC2 est une méthode bien adaptée aux environnements de haute performance computationnelle et conçue pour estimer les états dynamiques et les paramètres des modèles d'espace d'état (SSM). L'article se concentre sur l'amélioration de la distribution de proposition au sein de SMC2 afin d'améliorer l'exactitude et l'exploration de la distribution postérieure. Les contributions clés de l'article sont : 1. L'intégration d'informations de second ordre, en particulier la Hessian du log-cible, dans la distribution de proposition. Cela permet l'utilisation à la fois des informations de gradient (dérivée première) et de courbure (dérivée seconde) de la distribution cible, conduisant à des propositions plus informées et plus efficaces. 2. L'introduction de propositions de second ordre dans le cadre SMC2 pour la première fois. Bien que les propositions de second ordre aient été explorées dans les méthodes de chaînes de Markov de Monte Carlo de particules (p-MCMC), c'est la première fois qu'elles sont appliquées dans le cadre SMC2. 3. La démonstration des avantages des propositions de second ordre en termes de sélection de la taille du pas et de l'exactitude de l'approximation postérieure par rapport à d'autres propositions, telles que les walks aléatoires (RW) et les propositions de premier ordre (FO). L'article fournit une description détaillée du filtre de particules (PF) avec log-likelihood, les gradients FO et SO. Il esquisse également le sampler SMC et différentes variantes de la proposition, y compris les propositions RW, FO et SO. Les auteurs présentent des résultats expérimentaux sur des modèles synthétiques, soulignant les avantages de leur approche en termes de sélection de la taille du pas et de l'exactitude de l'approximation postérieure. L'article conclut en discutant des limites de leur approche et en suggérant des travaux futurs, tels que l'exploration des avantages des propositions de second ordre dans des modèles à haute dimension complexe et l'intégration de propositions basées sur des gradients supplémentaires, telles que Hamiltonian Monte Carlo (HMC) et No-U-Turn Sampler (NUTS). En résumé, l'article présente une approche innovante pour l'inférence bayésienne en utilisant SMC2 qui intègre des informations de second ordre pour améliorer les distributions de proposition. Les résultats montrent les avantages de cette approche en termes de sélection de la taille du pas et de l'exactitude de l'approximation postérieure, ce qui en fait une contribution précieuse au domaine de l'inférence bayésienne.


Articles Recommandés

Refinement et coarsening adaptatifs pilotés par des forces de configuration dans l'optimisation topologique

Quantifier le ROI de l'intelligence sur les menaces cybernétiques : Une approche axée sur les données

Intérieur des arbres à distance sur des ensembles de Cantor fins

Grands taux d'apprentissage atteignent simultanément une robustesse aux corrélations spurielles et une compressibilité.

Pré-entraînement sur le jeu de test n'est plus tout ce qu'il faut : Une approche basée sur le débat pour les benchmarks de QAC

Étendre la gravité unifiée pour tenir compte de l'interaction graviton-graviton

Radiation de Cherenkov chiral à potentiel chimique chirale dépendant du temps

Exploration du matière sombre non froide dans un scénario d'énergie sombre dynamique avec les données DR2 du télescope DESI

Apprentissage amélioré de la récupération pour l'alignement et la fusion visuel-texte renforcés à l'intention de la génération de rapports de radiologie

Un modèle fondamental pour le précodage MIMO massif avec un compromis de débit-énergie adaptatif par utilisateur