Résumé - Optimisation de la segmentation HSI basée sur le DNN pour un SoC FPGA destiné aux ADS : Une approche pratique
Titre
Optimisation de la segmentation HSI basée sur le DNN pour un SoC FPGA destiné aux ADS : Une approche pratique
Temps
2025-07-22 13:09:04
Auteur
{"Jon Gutiérrez-Zaballa","Koldo Basterretxea","Javier Echanobe"}
Catégorie
{cs.CV,cs.AI,cs.AR,cs.LG,eess.IV}
Lien
http://arxiv.org/abs/2507.16556v1
PDF Lien
http://arxiv.org/pdf/2507.16556v1
Résumé
Cette recherche explore l'utilisation des réseaux de neurones profonds (RNP) pour la segmentation d'images hyperspectrales (HSI) dans les systèmes de conduite automatisée (SCA), en se concentrant sur l'optimisation des performances et de l'efficacité du système. L'étude vise à répondre aux défis du traitement en temps réel et des contraintes de ressources dans les systèmes embarqués en s'appuyant sur des techniques de co-conception matériel/logiciel et des méthodes de compression des RNP.
### Points clés :
1. **HSI et RNP** : La recherche utilise des HSI pour surmonter les limites des images traditionnelles en RGB, telles que la métamerie, en capturant des informations spectrales sur une plus large gamme de longueurs d'onde. Les RNP sont employés pour la segmentation HSI, offrant une précision et une robustesse améliorées.
2. **Techniques d'optimisation** :
- **Co-conception matériel/logiciel** : L'étude propose une approche de co-conception pour intégrer efficacement la prétraitement, le stockage des données, la communication et l'inférence des RNP sur une plate-forme SoC basée sur FPGA.
- **Compression du modèle** : Des techniques telles que la quantification et l'élagage itératif sont employées pour réduire la complexité computationnelle du modèle RNP, tout en maintenant l'exactitude.
- **Optimisation de prétraitement** : La recherche se concentre sur l'optimisation du pipeline de prétraitement, y compris la conversion des données, la normalisation et la gestion de la mémoire, pour améliorer l'efficacité.
3. **Plate-forme SoC basée sur FPGA** :
- L'étude utilise la carte AMD-Xilinx KV260, qui intègre un Zynq UltraScale+ MPSoC avec de la logique programmable, fournissant une plate-forme appropriée pour déployer le système de segmentation HSI basé sur un RNP optimisé.
4. **Résultats** :
- Le modèle RNP optimisé a atteint une réduction significative de la complexité computationnelle, avec une réduction de 24,34 % des opérations et une réduction de 1,02 % des paramètres.
- La méthode d'élagage itératif combine l'analyse statique et dynamique pour identifier et élaguer les paramètres inutiles, réduisant ainsi la taille du modèle sans compromettre l'exactitude.
- Le système optimisé a démontré une accélération de 2,86x des tâches d'inférence, tout en maintenant une haute précision de segmentation.
### Implications :
La recherche met en lumière le potentiel des HSI et des RNP pour améliorer les capacités des SCA, en particulier en termes de compréhension de la scène et de détection d'objets. Les techniques d'optimisation proposées et la plate-forme SoC basée sur FPGA fournissent une approche pratique pour déployer des systèmes de segmentation HSI en temps réel et efficaces dans des environnements à ressources limitées. Cette recherche contribue au développement de systèmes de vision intelligents avancés pour la navigation autonome et d'autres applications.
Articles Recommandés
Déséquilibre dans l'Équilibre : Équilibrage des Concepts En Ligne dans les Modèles de Génération
Moving Out : Collaboration humain-AI ancrée dans la réalité physique
Apprentissage amélioré de la récupération pour l'alignement et la fusion visuel-texte renforcés à l'intention de la génération de rapports de radiologie
Ironman : Accélérer l'extension de la transmission oblivieuse pour l'IA à la protection de la vie privée avec le traitement en mémoire proche
Temporisation de la génération harmonique secondaire dans les ferrélectriques par un champ électrique impulsionnel
Imagerie hyperspectrale à milieu de l'IR avec des photons non détectés
Courir en Cercle ? Un simple point de référence pour la sécurité des interprètes de code des LLM
Pierre vers un démonstrateur d'accélérateur ECRIPAC
Mélange vestigial de l'ordre dans un superfluide atomique chirale dans un réseau optique à deux vallées
Contributions non holomorphes dans les GMSB avec des messagers adjoints