Résumé - compromis entre statistique et informatique provenant de la complexité NP-dure

Titre
compromis entre statistique et informatique provenant de la complexité NP-dure

Temps
2025-07-17 15:35:36

Auteur
{"Guy Blanc","Caleb Koch","Carmen Strassle","Li-Yang Tan"}

Catégorie
{cs.CC,cs.DS,cs.LG}

Lien
http://arxiv.org/abs/2507.13222v1

PDF Lien
http://arxiv.org/pdf/2507.13222v1

Résumé

Ce papier explore la relation entre la complexité temporelle et la complexité d'échantillonnage dans les algorithmes d'apprentissage, en particulier dans le contexte de la NP-durcité. Il démontre qu'il existe des compromis entre ces deux ressources, ce qui signifie que l'amélioration d'une d'entre elles souvent se fait au détriment de l'autre. Les auteurs se concentrent sur le modèle d'apprentissage PAC (Learning with Probability and Accuracy), où l'objectif est d'apprendre une classe de concepts avec un petit nombre d'échantillons. Ils montrent que pour chaque fonction de complexité temporelle polynomiale p(n), il existe une classe de concepts C avec une dimension VC de 1 qui nécessite Θ(p(n)) d'échantillons pour être apprise efficacement. Le papier établit également une connexion entre la difficulté de l'apprentissage et la difficulté de NP. En particulier, il prouve que si RP = NP (c'est-à-dire que chaque langage en NP peut être décidé en temps polynomial avec un algorithme aléatoire), alors chaque classe NP-enumerable peut être apprise en temps polynomial avec O(VCdim(C)) d'échantillons. Conversely, si RP ≠ NP, alors il existe une classe NP-enumerable qui ne peut pas être apprise en temps polynomial avec Φ(VCdim(C)) d'échantillons pour toute fonction Φ. Les auteurs atteignent ces résultats en définissant un problème d'apprentissage basé sur le problème SAT et en montrant que les compromis entre complexité temporelle et complexité d'échantillonnage de ce problème héritent de ceux du SAT. Ils démontrent également que leurs techniques peuvent être étendues à d'autres contextes, tels que l'apprentissage avec distribution uniforme et l'apprentissage en ligne. Le papier fait plusieurs contributions importantes : 1. Il fournit les premières bornes inférieures basées sur la NP-durcité pour l'apprentissage, en contournant les barrières précédentes. 2. Il établit une connexion entre la difficulté de l'apprentissage et la difficulté de NP. 3. Il étend le concept de compromis computationnel-statistique à d'autres contextes d'apprentissage. Dans l'ensemble, ce papier contribue de manière significative à notre compréhension des limites des algorithmes d'apprentissage et de l'interaction entre la complexité temporelle et la complexité d'échantillonnage.


Articles Recommandés

Manœuvres à faible poussée sur une variété de systèmes d'orbites quasi-périodiques

Exploration des neutrinos d'énergie ultra-haute avec l'array radio in-ice IceCube-Gen2

Nouvelles propriétés de l'inverse généralisée du noyau-EP pondéré dans les algèbres de Banach

Compteage SMT Approximatif au-delà des Domains Discrètes

Dynamique des faisceaux non linéaire de particules isolées

Étude de cas de GW190425 pour la classification des collisions de binaries de néutron stars par rapport aux collisions de binaries de trous noirs et pour la contrainte de la matière noire asymétrique avec les détecteurs d'ondes gravitationnelles

DRWKV : Concentration sur les bords des objets pour l'amélioration des images dans des conditions de faible luminosité

Étudier les séquences d'auto-localisation et de synchronisation pour les Machines à États Finis Tempsés avec des délais de sortie

Conception d'un Système de Soumission et d'Évaluation en Ligne pour les Opérations de Concours

Exacte rénormalisation pour les fréquences de patch dans les systèmes d'inflation