Résumé - Conception d'un Système de Soumission et d'Évaluation en Ligne pour les Opérations de Concours
Titre
Conception d'un Système de Soumission et d'Évaluation en Ligne pour les Opérations de Concours
Temps
2025-07-23 17:44:10
Auteur
{"Zhe Chen","Daniel Harabor","Ryan Hechnenberger","Nathan R. Sturtevant"}
Catégorie
{cs.AI}
Lien
http://arxiv.org/abs/2507.17730v1
PDF Lien
http://arxiv.org/pdf/2507.17730v1
Résumé
Ce document présente un système de compétition en ligne conçu pour automatiser le processus de soumission et d'évaluation des compétitions algorithmiques. Ces compétitions sont cruciales pour suivre les progrès dans divers domaines de recherche, mais elles peuvent être opérationnellement coûteuses en raison de la nécessité de gérer et d'évaluer un grand nombre de soumissions, de gérer les problèmes de compatibilité et de fournir des retours aux participants.
Le système proposé, appelé Système de Soumission et d'Évaluation En Ligne, permet aux participants de soumettre leurs solutions à tout moment avant la date limite. Il utilise des environnements isolés pour évaluer les soumissions, assurant ainsi la compatibilité et la sécurité. Le système fournit des retours instantanés, permettant aux participants d'itérer leurs solutions efficacement.
Les principales fonctionnalités du système incluent :
- Des dépôts Git pour la gestion du code et le suivi de l'historique des soumissions.
- Une interface web pour l'interaction des utilisateurs, y compris l'enregistrement, la gestion des profils, la gestion des soumissions, la gestion des compétitions et le suivi du classement.
- Une base de données pour stocker les profils des utilisateurs, les détails des soumissions et les données d'évaluation.
- Un serveur d'évaluation qui surveille les nouvelles soumissions et initie les tâches d'évaluation.
- Des unités de calcul exécutant des conteneurs Docker pour exécuter les tâches d'évaluation dans des environnements isolés.
Le système a été appliqué avec succès à trois applications différentes :
1. Enseignement pour un Unité de Planification IA : Un système de soumission et d'évaluation de devoirs en ligne pour un cours universitaire enseignant les algorithmes et les techniques pour résoudre des problèmes de planification et de raisonnement.
2. Concours de Planification de Chemin Basée sur une Grille (GPPC2) : Un concours annuel évaluant les performances des algorithmes de planification sur des cartes basées sur une grille. Le système gère de grandes quantités de soumissions simultanées et fournit des mesures de performance précises.
3. Concours de Ligue des Courseurs de Robots : Un concours où les participants coordonnent une équipe de robots mobiles pour accomplir des tâches de manière efficace. Le système utilise le calcul en nuage et un classement plus éclairé pour gérer la complexité du concours.
Le document discute de plusieurs défis rencontrés lors de la conception et de l'implémentation du système, tels que la gestion de multiples épreuves, la gestion des limitations de calcul, le classement des solutions sur la base de multiples critères et la prévention du trichage. Des solutions à ces défis sont présentées, et la potentiel application du système à d'autres compétitions est discutée.
Les travaux futurs incluent la modularisation et la généralisation de l'implémentation du système, facilitant ainsi sa maintenance et l'ajout de fonctionnalités. Le système sera ouvert à la source en tant que ressource communautaire pour aider les chercheurs dans les domaines connexes à organiser des compétitions.
Articles Recommandés
KMT-2024-BLG-0404L : Un système de microlentille triple composé d'une étoile, d'un nain brune et d'une planète
États d'énergie élevée des trajectoires chaotiques récurrentes dans un puits potentiel dépendant du temps
Approche de prévision d'événements extrêmes dans les séries temporelles de systèmes dynamiques chaotiques en utilisant des techniques d'apprentissage automatique
Production d'entropie aux parois des bulles électrofaibles à partir des fluctuations du champ scalaire
CASCADE : Déboucheur JavaScript déobfusqué alimenté par un LLM chez Google
Croissance de l'échelle de longueur structurale dans les mélanges binaires de Kob Andersen : rôle de l'ordre à moyenne portée
Clo-HDnn : Un accélérateur deapprentissage continu sur appareil avec calcul hyperdimensionnel économe en énergie à 4,66 TFLOPS/W et 3,78 TOPS/W, grâce à une recherche progressive
Théorème de Fagin pour les machines de Turing des semi-réels
Structures de données compressées pour les coupures de Heegaard
Résidus de puissances primaires et ensembles bloquants