Résumé - Rapport Système pour la tâche 10 CCL25-Eval : SRAG-MAV pour la reconnaissance de discours d'hostilité chinois à granularité fine

Titre
Rapport Système pour la tâche 10 CCL25-Eval : SRAG-MAV pour la reconnaissance de discours d'hostilité chinois à granularité fine

Temps
2025-07-24 16:56:38

Auteur
{"Jiahao Wang","Ramen Liu","Longhui Zhang","Jing Li"}

Catégorie
{cs.CL}

Lien
http://arxiv.org/abs/2507.18580v1

PDF Lien
http://arxiv.org/pdf/2507.18580v1

Résumé

Ce document présente un cadre innovant SRAG-MAV pour la reconnaissance fine-grainée des discours de haine chinois (FGCHSR) dans la tâche 10 du CCL25-Eval. Ce cadre intègre la reformulation de la tâche (TR), la génération augmentée par auto-récherche (SRAG) et le vote cumulatif en plusieurs tours (MAV) pour aborder les défis de la FGCHSR, tels que la nature subtile et dépendante du contexte des discours de haine chinois et la disponibilité limitée de données annotées de haute qualité. Le cadre SRAG-MAV simplifie la tâche d'extraction de quaternions en extraction de triplets, améliore la compréhension contextuelle grâce à une recherche dynamique inspirée de la génération augmentée par recherche (RAG) et assure des sorties stables via une inférence en plusieurs tours basée sur les principes de la loi d'échelle parallèle (PARSCALE). Le cadre proposé atteint une note de difficulté de 26,66, une note douce de 48,35 et une note moyenne de 37,505 sur le dataset STATE ToxiCN, surpassant nettement les baselines telles que GPT-4o (note moyenne de 15,63) et Qwen2.5-7B affinée (note moyenne de 35,365). Les composants clés du cadre SRAG-MAV incluent : 1. Reformulation de la tâche (TR) : Le cadre reformule la tâche d'extraction de quaternions en extraction de triplets, réduit la complexité de la génération structurée et améliore l'efficacité et l'exactitude des modèles de langage grand (LLM). 2. Génération augmentée par auto-récherche (SRAG) : Le cadre utilise le jeu de données d'entraînement lui-même en tant que corpus de recherche, exploitant des exemples annotés similaires au niveau sémantique pour guider la génération de triplets et assurer des sorties contextuellement pertinentes sans nécessiter de ressources externes. 3. Vote cumulatif en plusieurs tours (MAV) : Le cadre génère diverses invites avec des exemples récupérés par SRAG et sélectionne le triplet de sortie optimal via un mécanisme de vote, assurant des résultats stables et précis. Les expériences démontrent l'efficacité et la robustesse du cadre proposé, avec des améliorations significatives par rapport aux baselines. L'implémentation open-source du cadre favorise la reproductibilité et facilite des recherches supplémentaires dans le domaine de la détection des discours de haine et d'autres domaines liés au NLP. Les limites du cadre proposé incluent la performance spécifique au domaine du modèle, la dépendance aux données textuelles uniquement et les seuils de vote élevés de MAV, qui augmentent les coûts de calcul. Les travaux futurs exploreront l'apprentissage de transfert inter-domaines, des approches multimodales et l'optimisation de l'efficacité computationnelle de MAV pour élargir l'applicabilité du cadre.


Articles Recommandés

ThermoRL : Apprentissage par renforcement structurément conscient pour la conception de mutations de protéines pour améliorer la thermorésistance

Dispositifs de mémoire non volatils basés sur des hétérostructures de graphène avec programmation de la porte flottante supérieure

Sur la complexité du problème de Skolem à basse ordre

Spectroscopie de refroidissement pour les bosons de Lieb-Liniger en présence de piégeage harmonique

Simuler plusieurs perspectives humaines dans les systèmes socio-écologiques à l'aide de grands modèles de langage

Flattening en $L^2$ des mesures auto-similaires sur des courbes non-dégénérées

Étape-3 : Grand mais abordable : Co-conception du modèle-système pour un décodage efficace en termes de coût

MC$^2$A : Activer le co-conception algorithme-hardware pour l'accélération efficace des chaînes de Markov Monte Carlo

Apprentissage contrastif Audio-Vision pour la reconnaissance des classes phonologiques

DENSE : Génération de notes de progression longitudinales avec modélisation temporelle de notes cliniques hétérogènes sur l'ensemble des visites hospitalières