Résumé - Détection et classification d'objets en temps réel à l'aide de YOLO pour les FPGAs de bord

Titre
Détection et classification d'objets en temps réel à l'aide de YOLO pour les FPGAs de bord

Temps
2025-07-24 08:17:37

Auteur
{"Rashed Al Amin","Roman Obermaisser"}

Catégorie
{cs.CV,cs.AR}

Lien
http://arxiv.org/abs/2507.18174v1

PDF Lien
http://arxiv.org/pdf/2507.18174v1

Résumé

Ce document présente un système de détection et de classification d'objets en temps réel, efficace en ressources, basé sur l'architecture YOLOv5, optimisé pour l'exécution sur des plateformes FPGA de bord. Le système proposé utilise le jeu de données COCO pour la détection d'objets à usage général et le jeu de données GTSRB pour la détection et la classification des signaux de circulation spécifiques. Le système est mis en œuvre sur la carte FPGA Xilinx Kria KV260 et atteint une précision de classification de 99% avec une consommation d'énergie de 3,5W et une vitesse de traitement de 9 images par seconde (IPS). Le document discute des défis liés à l'atteinte d'une efficacité en ressources et au maintien d'une performance élevée lors de la mise en œuvre de systèmes de détection et de classification d'objets sur des FPGA de bord. Il met en avant les avantages de l'utilisation des FPGA pour accélérer les tâches d'inférence de l'apprentissage profond en raison de leur reprogrammabilité, de leur haute parallélisme et de leur efficacité énergétique. Le document présente également une mise en œuvre détaillée du système proposé, y compris la préparation des ensembles de données, l'entraînement du modèle, la quantification et la compilation. Le modèle YOLOv5 est entraîné à l'aide du cadre PyTorch et optimisé pour la mise en œuvre sur la carte FPGA Xilinx Kria KV260 en utilisant l'environnement de développement Vitis AI. Le processus de quantification convertit les poids et les activations de 32 bits flottants du modèle en représentations d'entiers sur 8 bits (INT8), réduisant considérablement la taille de la mémoire du modèle et améliorant l'efficacité de transfert des données. Le document évalue le système proposé à l'aide de jeux de données de benchmark standard, COCO pour la détection et la classification d'objets généraux, et GTSRB pour la détection et la classification des signaux de circulation. Les résultats d'évaluation montrent que le système proposé atteint une haute précision de classification (98,6%) tout en maintenant une consommation d'énergie faible de 3,5W et une vitesse de traitement de 9 IPS. La performance du système est comparée avec des systèmes de détection d'objets basés sur des FPGA existants utilisant différentes variantes du modèle YOLO. Le système proposé montre une amélioration de l'exactitude et de l'efficacité énergétique par rapport aux travaux existants, le rendant une solution viable pour les appareils de bord à ressources limitées. Le document conclut en discutant des contributions clés du système proposé, qui incluent le développement d'un système de détection et de classification d'objets efficace en ressources utilisant YOLO v5 pour les FPGA, l'optimisation du modèle YOLO pour la compatibilité avec les plateformes FPGA de bord, et l'évaluation du système proposé par rapport aux systèmes de détection et de classification d'objets basés sur des FPGA les plus avancés. Le document esquisse également les travaux futurs, qui incluent l'amélioration de la vitesse d'inférence du système tout en préservant l'exactitude et l'efficacité en ressources, ainsi que l'extension du modèle pour prendre en charge des tâches de détection multi-classe et son évaluation dans des scénarios de déploiement réels plus divers.


Articles Recommandés

Problèmes de consensus des chaînes avec des échanges et des substitutions

Modèle IA Pré-Entraîné Assistant la Prise de Décision En Ligne en Présence de Variables Indépendantes Manquantes : Une Perspective Théorique

Modèles continuels de premier ordre pour les ondes dispersives non linéaires dans la lattice de cristal granulaire

Rôtors électroniques et cristaux de Wigner dans un liquide dipolaire deux dimensions

Détection des anneaux galactiques dans les études d'imagerie de succession du DESI avec un apprentissage profond semi-supervisé

4T2R X-ReRAM CiM Array pour une opération MAC massivement parallèle tolérante aux variations et à faible consommation d'énergie

Un seuil inférieur inconditionnel pour la méthode de l'ensemble actif en maximisation quadratique convexe

CA-Cut : Coupe-Aligned pour l'Augmentation des Données pour une Navigation sous Canopée Plus Robuste

Une méthode pour corriger la sous-structure des jets à multiples branches en utilisant le plan de jet de Lund

Apprentissage amélioré de la récupération pour l'alignement et la fusion visuel-texte renforcés à l'intention de la génération de rapports de radiologie