Résumé - Modèle IA Pré-Entraîné Assistant la Prise de Décision En Ligne en Présence de Variables Indépendantes Manquantes : Une Perspective Théorique

Titre
Modèle IA Pré-Entraîné Assistant la Prise de Décision En Ligne en Présence de Variables Indépendantes Manquantes : Une Perspective Théorique

Temps
2025-07-10 15:33:27

Auteur
{"Haichen Hu","David Simchi-Levi"}

Catégorie
{cs.LG,stat.ML}

Lien
http://arxiv.org/abs/2507.07852v1

PDF Lien
http://arxiv.org/pdf/2507.07852v1

Résumé

L'article "Pre-Trained AI Model Assisted Online Decision-Making under Missing Covariates: A Theoretical Perspective" de Haichen Hu et David Simchi-Levi explore l'utilisation de modèles d'IA pré-entraînés dans des problèmes de prise de décision séquentielle où certains covariats sont manquants. Les auteurs introduisent un concept novateur appelé "élasticité du modèle" pour analyser comment la présence d'un modèle pré-entraîné influence le regret du processus de prise de décision. Dans un problème de prise de décision séquentielle contextuelle, un décideur observe un vecteur de contexte et sélectionne une action, recevant un signal de récompense. Cependant, dans de nombreuses applications pratiques, certains covariats associés à la décision ne sont pas observés, ce qui peut conduire à une apprentissage biaisé et une performance dégradée. Pour aborder ce problème, les auteurs proposent d'utiliser un modèle d'IA pré-entraîné pour prédire les covariats manquants et les intégrer dans le processus de prise de décision. L'article se concentre sur les contributions suivantes : 1. Introduction du concept d'"élasticité du modèle" pour quantifier la sensibilité de la fonction de récompense à la discrepancy entre le covariate réel et son contrepartie imputée. Ce concept fournit une manière unifiée de caractériser le regret subi en raison de l'imputation du modèle, indépendamment du mécanisme sous-jacent de la manquantitude. 2. Analyse du risque d'estimation de la récompense utilisant l'imputation par un modèle pré-entraîné, qui se décompose en un terme de risque d'oracle standard et un terme supplémentaire reflétant la qualité du modèle de substitution (élasticité du modèle). 3. Proposition d'une procédure de calibration pour le modèle pré-entraîné dans le cadre de la manquantitude à la condition (MAR). Cette calibration améliore considérablement la qualité des covariats imputés, conduisant à des garanties de regret beaucoup meilleures. 4. Mettant en avant la valeur pratique d'avoir un modèle pré-entraîné précis dans des tâches de prise de décision séquentielle et suggérant que l'élasticité du modèle pourrait servir de métrique fondamentale pour comprendre et améliorer l'intégration des modèles pré-entraînés dans une large gamme de problèmes de prise de décision basés sur les données. L'article fournit un cadre théorique pour intégrer des modèles d'IA pré-entraînés dans des tâches de prise de décision séquentielle avec des covariats manquants. Les auteurs montrent que des modèles pré-entraînés calibrés correctement peuvent améliorer considérablement la qualité des décisions dans de telles situations. L'article identifie également des directions de recherche futures potentielles, telles que l'intégration de mécanismes de manquantitude non à la condition (MNAR) et l'extension du cadre à plusieurs modèles pré-entraînés.


Articles Recommandés

Heures de Réunion Attendues Supérieures pour des Agents Stochastiques Interdépendants

Extraction d'informations sur le catalyseur ORR pour les piles à combustible à partir de la littérature scientifique

Caractérisation de la p-Simulation entre Théories

Sous le titre "Chuchotements de l'Univers Primitif : L'Écroulement des trous noirs primordiaux"

Amélioration de l'architecture de von Neumann pour un futur intelligent

Amélioration de l'intensité des courants photogalvaniques dans une cavité plasmonique van der Waals par l'effet Purcell

Utilisation des estimations d'incertitude prédictive pour apprendre les structures des états hadroniques par pôle

Étendre la gravité unifiée pour tenir compte de l'interaction graviton-graviton

Accélérateurs NTT à pipeline haute performance avec une arithmétique modulo numériques séquentielle homogène

Échelle sans invariance conforme à partir des déformations intégrables des CFT des cosets