Résumé - Courir en Cercle ? Un simple point de référence pour la sécurité des interprètes de code des LLM

Titre
Courir en Cercle ? Un simple point de référence pour la sécurité des interprètes de code des LLM

Temps
2025-07-25 16:06:16

Auteur
{"Gabriel Chua"}

Catégorie
{cs.CR,cs.AI}

Lien
http://arxiv.org/abs/2507.19399v1

PDF Lien
http://arxiv.org/pdf/2507.19399v1

Résumé

Le benchmark CIRCLE évalue les vulnérabilités de cybersécurité des modèles de langage grandement évolués (MLGE) intégrant des interpréteurs de code. Il se concentre sur l'identification des risques liés à l'épuisement des ressources CPU, mémoire et disque. Le benchmark utilise une taxonomie de risque complète avec des variantes de prompt double (malveillant et benign) et un harnais d'évaluation automatisé multi-fournisseurs. Les constatations clés de l'évaluation de sept MLGE commerciaux (OpenAI et Google) révèlent des vulnérabilités significatives et incohérentes. Par exemple, o4-mini d'OpenAI refuse correctement les demandes à risque à un taux plus élevé que GPT-4.1. L'étude met en avant la nécessité de benchmarks de cybersécurité spécifiques aux interpréteurs, d'outils de mitigation et de normes industrielles pour garantir un déploiement sécurisé des intégrations d'interpréteurs MLGE. Les jeux de données du benchmark et le code d'évaluation sont publiés publiquement pour encourager la recherche further. Le benchmark CIRCLE remplit un lacune critique dans l'évaluation des attaques de type épuisement de ressources centrées sur les interpréteurs dans les MLGE. Il fournit une taxonomie de risque complète, un harnais d'évaluation automatisé et un accès open-source. Les résultats mettent en lumière la nécessité d'améliorer les mesures de cybersécurité dans les MLGE intégrant des interpréteurs de code.


Articles Recommandés

"Échelle de la vallée du rayon parmi les étoiles de faible masse avec TESS"

Nouveaux alertes de neutrinos publics pour les groupes d'événements IceCube

Une suite d'espaces métriques compacts et une immersion isométrique dans l'espace de Gromov-Hausdorff.

Équivalence élémentaire et groupes de diffeomorphismes des variétés différentiables

Rôtors électroniques et cristaux de Wigner dans un liquide dipolaire deux dimensions

Découverte manquante en physique grâce à l'apprentissage automatique basé sur des éléments finis à différentiabilité complète

Rapidité de la thermalisation profonde computationnelle

Sparsification forte pour 1-in-3-SAT via le théorème de Freiman-Ruzsa polynomial

Classer les anneaux d'entiers de Grothendieck jusqu'au rang 5 et au-delà

Capturer la transition de phase quantique dans la région ultraviolette par holographie