Résumé - Avancer la prévision des événements par le biais de l'entraînement massif de grandes modèles de langage : défis, solutions et impacts plus larges
Titre
Avancer la prévision des événements par le biais de l'entraînement massif de grandes modèles de langage : défis, solutions et impacts plus larges
Temps
2025-07-25 17:59:13
Auteur
{"Sang-Woo Lee","Sohee Yang","Donghyun Kwak","Noah Y. Siegel"}
Catégorie
{cs.LG,cs.AI,cs.CL}
Lien
http://arxiv.org/abs/2507.19477v1
PDF Lien
http://arxiv.org/pdf/2507.19477v1
Résumé
Ce document argumente que les progrès récents dans les modèles de langage à grande échelle (LLMs) ont créé des conditions favorables pour l'entraînement à grande échelle de modèles de prévision d'événements LLM pour atteindre un niveau de performance de superprévisionneur. Les auteurs identifient et formalisent des défis d'entraînement uniques spécifiques à la prévision d'événements et proposent des solutions méthodologiques pour aborder ces défis.
**Défis Clés et Solutions** :
* **Bruit et rareté** : En raison de l'incertitude inhérente aux résultats de la prévision d'événements et de la rareté des événements similaires, l'apprentissage peut être difficile. Les auteurs proposent l'utilisation de réseaux bayesiens d'événements hypothétiques pour modéliser ces problèmes et discutent de différentes stratégies d'attribution d'étiquettes basées sur les prévisions et les résultats du marché.
* **Connaissance coupée** : Il est difficile d'entraîner ou d'évaluer des questions de prévision d'événements concernant des connaissances que les LLMs possèdent déjà internement. Les auteurs suggèrent l'utilisation d'événements mal retenus et d'événements counterfactuals pour atténuer ce problème.
* **Structure de récompense simple** : Les modèles peuvent obtenir des récompenses plus facilement que dans d'autres tâches de RL sans développer des capacités de raisonnement appropriées. Les auteurs proposent l'utilisation de signaux de récompense auxiliaires et de sous-questions pour aborder ce problème.
**Acquisition de Données** :
Les auteurs proposent l'utilisation d'un ensemble diversifié de jeux de données pour l'entraînement et l'évaluation à grande échelle :
* **Jeux de données du marché** : Données provenant de marchés de prévision comme Polymarket et Metaculus.
* **Jeux de données publics** : Données structurées provenant de bases de données publiques comme le PIB et les indicateurs économiques.
* **Jeux de données de crawling** : Données non structurées collectées et traitées à partir du web comme des articles de nouvelles.
**Impacts Plus Large** :
Les auteurs discutent des impacts potentiels plus larges des LLMs de prévision d'événements sur la société, y compris :
* **Élargissement du champ de la prévision par l'IA** : Répondre à des questions sans conditions de résolution clairement définies et fournir des réponses automatisées à diverses questions non traitées par les marchés de prévision.
* **Systèmes de trading assistés par l'IA** : Améliorer l'efficacité des marchés de prévision et des marchés financiers traditionnels.
* **Capacités de simulation futures** : Générer des scénarios séquentiels interconnectés pour aider les individus et la société à mieux comprendre les futurs potentiels.
* **Intégration de capacités de raisonnement probabiliste dans les agents IA généraux et les scientifiques en IA** : Permettre aux systèmes IA de faire des raisonnements probabilistes principiels sur des futurs incertains.
**Défis et Risques** :
Les auteurs identifient également des défis clés et des risques potentiels associés aux LLMs de prévision d'événements, y compris :
* **Évaluation de la confiance dans les prévisions** : Développer des méthodes pour évaluer la fiabilité des prévisions de l'IA et communiquer cette information de manière efficace aux utilisateurs.
* **Effets de prévision auto-réalisatrice** : Atténuer le potentiel pour que les prévisions de l'IA influencent les résultats réels du monde en des manières non intentionnelles.
* **Vulnerabilité aux attaques malveillantes** : Assurer la robustesse des systèmes IA contre les tentatives de manipulation des prévisions.
* **Biais du modèle** : Aborder les biais potentiels dans les prévisions de l'IA qui pourraient conduire à des résultats inéquitables ou discriminatoires.
**Conclusion** :
Les auteurs concluent que les LLMs de prévision d'événements ont le potentiel de transformer la société en fournissant des prévisions plus précises et plus fiables et en élargissant le champ de la prévision par l'IA. Cependant, il est crucial de résoudre les défis et les risques associés à ces technologies pour assurer leur développement et leur déploiement responsables.
Articles Recommandés
pilotage politique latent avec des modèles mondiaux prédéfinis agnostiques à l'égard de l'incarnation
Déséquilibre dans l'Équilibre : Équilibrage des Concepts En Ligne dans les Modèles de Génération
Orientation des spins des galaxies par rapport aux filaments de la structure à grande échelle de l'Univers
SafeWork-R1 : Évolution conjointe de la sécurité et de l'intelligence sous la loi AI-45°
Publicité sur les recherches Google après l'affaire Dobbs c. Jackson
Réponse optique dépendante de la température des films minces de YBa2Cu3O7-δ (Ybco) à haute Tc
L'Impact des coups de naissance sur les binaries de trous noirs
Une méthode de descente gradient fractionnaire de Caputo adaptative pour les problèmes d'optimisation multi-objectifs
Aspects computatoires du coefficient de contraction de la norme trace
Cadre de Phase pour les Réseaux Neuraux Optiques Quantiques à Échelle Intermédiaire Bruyants