Résumé - Perte asymétrique conjointe pour l'apprentissage avec des étiquettes bruitées
Titre
Perte asymétrique conjointe pour l'apprentissage avec des étiquettes bruitées
Temps
2025-07-23 16:57:43
Auteur
{"Jialiang Wang","Xianming Liu","Xiong Zhou","Gangfeng Hu","Deming Zhai","Junjun Jiang","Xiangyang Ji"}
Catégorie
{cs.LG,cs.CV}
Lien
http://arxiv.org/abs/2507.17692v1
PDF Lien
http://arxiv.org/pdf/2507.17692v1
Résumé
Le papier présente une nouvelle approche pour l'apprentissage avec des étiquettes bruitées appelée Pertes Asymétriques Jointes (JAL). Il aborde le problème du bruit des étiquettes dans les réseaux neuronaux profonds en introduisant une fonction de perte asymétrique et en l'élargissant à un scénario de perte passive plus complexe.
### Points Clés :
* **Bruit des Étiquettes** : Le bruit des étiquettes est un défi significatif dans les ensembles de données réels, souvent dû à des erreurs humaines ou aux limites des compétences domaines.
* ** Pertes Symétriques** : Des recherches précédentes ont mis l'accent sur les fonctions de perte symétriques telles que l'erreur absolue moyenne (MAE) pour atténuer le bruit des étiquettes. Cependant, les pertes symétriques souffrent d'underfitting en raison de leurs contraintes strictes.
* **Cadre des Pertes Actives et Passives (APL)** : Le cadre APL combine les pertes actives et passives pour améliorer les processus d'optimisation mutuels, améliorant ainsi les performances globales de l'ajustement.
* **Fonctions de Pertes Asymétriques (ALFs)** : Les ALFs offrent une tolérance au bruit sous des conditions plus relâchées par rapport aux fonctions de perte symétriques. Cependant, les ALFs existantes ne sont pas compatibles avec l'APL.
* **Perte Quadratique Asymétrique (AMSE)** : Le papier propose l'AMSE, une nouvelle fonction de perte passive asymétrique qui satisfait la condition asymétrique et est théoriquement solide.
* **Perte Asymétrique Jointe (JAL)** : JAL combine l'AMSE avec l'APL, améliorant le cadre APL traditionnel tout en préservant la tolérance au bruit et une apprentissage suffisant.
* **Expériences** : Des expériences extensives sur divers ensembles de données démontrent l'efficacité de JAL dans la réduction du bruit des étiquettes et l'atteinte de performances supérieures par rapport à d'autres méthodes.
### Contributions :
1. **Extension des Pertes Asymétriques** : Le papier étend les pertes asymétriques au scénario de perte passive, qui est plus difficile à analyser.
2. **AMSE** : Le papier propose l'AMSE, une nouvelle fonction de perte passive asymétrique qui satisfait la condition asymétrique et est théoriquement solide.
3. **JAL** : Le papier introduit JAL, un cadre de perte robuste novateur qui combine l'AMSE avec l'APL, améliorant le cadre APL traditionnel tout en préservant la tolérance au bruit et une apprentissage suffisant.
### Impact :
Le cadre JAL proposé fournit une solution robuste et efficace pour l'apprentissage avec des étiquettes bruitées, offrant des performances améliorées et une tolérance au bruit par rapport aux méthodes existantes. Il a le potentiel de modifier significativement diverses applications, y compris la vision par ordinateur, le traitement du langage naturel et d'autres domaines où le bruit des étiquettes est un défi commun.
Articles Recommandés
Réponse optique dépendante de la température des films minces de YBa2Cu3O7-δ (Ybco) à haute Tc
Une nouvelle preuve de théorèmes de type Liouville pour une classe d'équations elliptiques semi-linéaires
Pré-entraînement sur le jeu de test n'est plus tout ce qu'il faut : Une approche basée sur le débat pour les benchmarks de QAC
Laisser tomber ? Pas tout à fait : Aborder le problème du démarrage difficile des articles dans les recommandations séquentielles avec une initialisation basée sur le contenu
Réseau de neurones convolutifs quantiques hybrides assisté par l'assignation de pilotes dans les systèmes Cell-Free Massive MIMO
Meilleures bornes pour les chemins les plus courts semi-flous à source unique
Échantillonnage Monte Carlo multidimensionnel avec intégration parallèle-temps pour la quantification des incertitudes dans la simulation des machines électriques
ApproxGNN : Un GNN pré-entraîné pour la prédiction des paramètres dans l'exploration de l'espace de conception pour le calcul approché
Fonctions de deux points et les densités de vide dans l'effet Casimir pour le champ de Proca.
VideoITG : Compréhension multimodale de vidéos avec ancrage temporel instructif