Résumé - Double Descension Bayésienne
Titre
Double Descension Bayésienne
Temps
2025-07-09 23:47:26
Auteur
{"Nick Polson","Vadim Sokolov"}
Catégorie
{stat.ML,cs.LG,stat.CO}
Lien
http://arxiv.org/abs/2507.07338v1
PDF Lien
http://arxiv.org/pdf/2507.07338v1
Résumé
"Double Descension Bayésienne", par Nick Polson et Vadim Sokolov, examine le phénomène de double descension dans les modèles statistiques surexploités, en se concentrant en particulier sur les réseaux neuronaux, d'un point de vue bayésien. Cet article vise à éclairer le comportement des caractéristiques de risque dans ces modèles et à démontrer une interprétation bayésienne naturelle de ce phénomène.
Les auteurs commencent par expliquer le concept de double descension, qui se produit dans les modèles surexploités lorsque le risque d'un estimateur redescend lorsque le nombre de paramètres dépasse le seuil d'interpolation. Cet effet étend le classique compromis entre biais et variance et a été observé dans des modèles de régression de réseaux neuronaux à haute dimension et d'autres domaines de l'apprentissage automatique.
Le papier affirme que les estimateurs bayésiens peuvent également montrer un phénomène de double descension. Ils le démontrent en illustrant un exemple de sélection de modèle bayésien dans les réseaux neuronaux. La clé pour comprendre cela est la distribution de probabilité conditionnelle p(θM|M), qui joue un rôle crucial dans leur analyse de la double descension.
Les auteurs soulignent que le phénomène de double descension bayésien n'est pas en conflit avec le principe traditionnel de l'épée d'Ockham, qui favorise les modèles plus simples lorsque cela est possible. Cela est dû au fait que, même si les méthodes bayésiennes déplacent le posterior vers des modèles de moindre complexité, les modèles bayésiens à haute complexité peuvent toujours avoir de bonnes propriétés de risque en raison de la distribution de probabilité conditionnelle des paramètres donnée le modèle.
Le papier discute également des implications de la double descension bayésienne pour la sélection de modèle et la validation croisée. Il affirme que la vraisemblance marginale, qui est centrale dans la sélection de modèle bayésien, offre une approche plus efficace et plus facile à calculer par rapport aux méthodes traditionnelles telles que la validation croisée.
Les auteurs concluent en mettant en avant l'importance de leur travail pour comprendre le comportement des modèles surexploités d'un point de vue bayésien. Ils suggèrent également des directions pour la recherche future, telles que l'exploration du phénomène dans des dimensions plus élevées et l'investigation de la relation entre les spécifications des probabilités conditionnelles et les caractéristiques de risque.
En résumé, "Double Descension Bayésienne" offre une vision précieuse du comportement des modèles surexploités, en particulier des réseaux neuronaux, d'un point de vue bayésien. Il montre que le phénomène de double descension n'est pas en conflit avec l'épée d'Ockham et suggère que le paradigme bayésien offre un cadre cohérent pour comprendre et atténuer les risques associés à la surexploitation dans l'apprentissage automatique.
Articles Recommandés
Sur la contrôlabilité locale nulle d'un système de Burgers visqueux en temps fini
Composants connexes de l'espace des représentations de type préservé
Pseudogap dans un isolant cristallin dopé par des métaux désordonnés
L'Impact du Melange des Langues sur la Raisonnement des Modèles de Langue Multilingues
Algorithmes de regroupement généralisés pour la théorie de jauge de réseau de Potts
Nouvelles propriétés de l'inverse généralisée du noyau-EP pondéré dans les algèbres de Banach
Schéma de compilation quantique à l'état chiffré basé sur l'obfuscation de la circuit quantique
Inference de Structure Liquide Informatif en Physique à l'aide de Processus Gaussiens à partir de Données de Diffusion
Revisiting la fiabilité dans le cadre du benchmark d'estimation de pose basé sur le raisonnement
Envolu de conjonctions, variétés tordues et arbres cliques-conteneurs