Résumé - Prévision conforme conditionnelle à la classe pour plusieurs entrées par agrégation de valeurs p
Titre
Prévision conforme conditionnelle à la classe pour plusieurs entrées par agrégation de valeurs p
Temps
2025-07-09 09:17:17
Auteur
{"Jean-Baptiste Fermanian","Mohamed Hebiri","Joseph Salmon"}
Catégorie
{stat.ML,cs.LG,math.ST,stat.ME,stat.TH}
Lien
http://arxiv.org/abs/2507.07150v1
PDF Lien
http://arxiv.org/pdf/2507.07150v1
Résumé
L'article "Class conditional conformal prediction for multiple inputs by p-value aggregation" de Jean-Baptiste Fermanian, Mohamed Hebiri et Joseph Salmon présente une nouvelle approche de la prédiction conformale, spécifiquement conçue pour les scénarios où plusieurs observations (multi-entrées) d'une même instance sont disponibles au moment de la prédiction. Cette méthode est particulièrement motivée par des applications en sciences citoyennes, où plusieurs images de la même plante ou animal sont capturées par des particuliers.
Les auteurs proposent un cadre qui s'appuie sur le concept d'agrégation de valeurs p, en utilisant les valeurs p conformales calculées à partir de chaque observation d'une multi-entrée. En exploitant la distribution exacte de ces valeurs p, ils proposent un cadre d'agrégation général utilisant une fonction de notation abstraite, qui englobe de nombreux outils statistiques classiques.
Les contributions clés du document sont :
1. Le développement d'un ensemble de prédiction construit à partir de valeurs p conditionnelles en fonction de la classe des valeurs p conformales, qui fournit une distribution exacte et gère explicitement l'échangeabilité et les égalités entre les scores conformaux.
2. L'adaptation des récentes découvertes sur la distribution conjointe des valeurs p conformales, qui permet une version affinée des stratégies standards telles que le vote à la majorité.
3. La proposition d'une nouvelle manière efficace d'agréger les valeurs p conditionnelles en fonction de la classe en construisant une région de rejet basée sur la construction d'une note sur les valeurs p.
4. L'évaluation de la méthode sur des données simulées et réelles, en particulier sur la plateforme Pl@ntNet, qui facilite la collecte et l'identification d'espèces végétales grâce aux images soumises par les utilisateurs.
Les auteurs montrent que leur méthode réduit la taille de l'ensemble de labels prédits tout en préservant la garantie de couverture conditionnelle requise. Cela en fait une ressource particulièrement précieuse pour les applications en sciences citoyennes où de grands ensembles de prédiction peuvent être inpraticables.
En résumé, le document présente une méthode nouvelle et efficace pour la prédiction conformale conditionnelle en fonction de la classe, tirant parti du pouvoir de l'agrégation de valeurs p et fournissant un outil précieux pour gérer des scénarios de multi-entrée dans des applications en sciences citoyennes.
Articles Recommandés
3DGauCIM : Accélération du splatting gaussien statique/dynamique 3D via CIM numérique pour le rendu en temps réel haute fréquence des bords
Complexes simpliciaux déterministes
Vers une évaluation de la durabilité autonome par l'intermédiaire d'agents IA plurimodaux
Modèle IA Pré-Entraîné Assistant la Prise de Décision En Ligne en Présence de Variables Indépendantes Manquantes : Une Perspective Théorique
Des insights hydrodynamiques impulsent la dynamique du champ de vortices multimodal via l'ingénierie des trajectoires fluides
Extraction d'enzymes par le biais du Machine Learning : opportunités, défis et perspectives futures
Apprentissage contrastif Audio-Vision pour la reconnaissance des classes phonologiques
TRPrompt : Amorçage de l'optimisation des prompts-aware aux requêtes à partir des récompenses textuelles
Formant un ordre magnétique par la frustration locale pour des fermions itinérants sur un graphe
Barrières computationnelles pour les problèmes basés sur les permutations, et cumulants des variables aléatoires faiblement dépendantes