Resumen - Detección y clasificación de objetos en tiempo real utilizando YOLO para FPGAs de borde
Título
Detección y clasificación de objetos en tiempo real utilizando YOLO para FPGAs de borde
Tiempo
2025-07-24 08:17:37
Autor
{"Rashed Al Amin","Roman Obermaisser"}
Categoría
{cs.CV,cs.AR}
Enlace
http://arxiv.org/abs/2507.18174v1
PDF Enlace
http://arxiv.org/pdf/2507.18174v1
Resumen
Este documento presenta un sistema eficiente en recursos de detección y clasificación de objetos en tiempo real basado en la arquitectura YOLOv5, optimizado para implementarse en plataformas de FPGA de borde. El sistema propuesto utiliza el conjunto de datos COCO para detección de objetos de propósito general y el conjunto de datos GTSRB para detección y clasificación de señales de tráfico especializadas. El sistema se implementa en la placa FPGA Xilinx Kria KV260 y alcanza una precisión de clasificación del 99% con un consumo de energía de 3.5W y una velocidad de procesamiento de 9 cuadros por segundo (FPS).
El documento discute los desafíos de lograr una eficiencia en recursos y mantener un alto rendimiento al desplegar sistemas de detección y clasificación de objetos en FPGAs de borde. Se destacan las ventajas de usar FPGAs para acelerar tareas de inferencia de aprendizaje profundo debido a su reprogramabilidad, alta paralelismo y eficiencia energética.
El documento también presenta una implementación detallada del sistema propuesto, incluyendo la preparación de conjuntos de datos, entrenamiento del modelo, cuantificación y compilación. El modelo YOLOv5 se entrena utilizando el framework PyTorch y se optimiza para implementarse en la placa FPGA Xilinx Kria KV260 utilizando el entorno de desarrollo Vitis AI. El proceso de cuantificación convierte los pesos y activaciones de punto flotante de 32 bits del modelo en representaciones enteras de 8 bits (INT8), reduciendo significativamente el tamaño de memoria del modelo y mejorando la eficiencia de transferencia de datos.
El documento evalúa el sistema propuesto utilizando conjuntos de datos de referencia estándar, COCO para detección y clasificación de objetos generales, y GTSRB para detección y clasificación de señales de tráfico. Los resultados de la evaluación demuestran que el sistema propuesto alcanza una alta precisión de clasificación (98.6%) manteniendo un bajo consumo de energía de 3.5W y una velocidad de procesamiento de 9 FPS. El rendimiento del sistema se compara con sistemas de detección de objetos basados en FPGA existentes utilizando diferentes variantes del modelo YOLO. El sistema propuesto muestra una mayor precisión y eficiencia energética en comparación con trabajos existentes, convirtiéndose en una solución viable para dispositivos de borde con recursos limitados.
El documento concluye discutiendo las contribuciones clave del sistema propuesto, que incluyen desarrollar un sistema eficiente en recursos de detección y clasificación de objetos utilizando YOLO v5 para FPGAs, optimizar el modelo YOLO para su compatibilidad con plataformas de FPGA de borde y evaluar el sistema propuesto contra sistemas de detección y clasificación basados en FPGA de vanguardia. El documento también esboza el trabajo futuro, que incluye mejorar la velocidad de inferencia del sistema preservando la precisión y la eficiencia en recursos, y extender el modelo para soportar tareas de detección de múltiples clases y evaluarlo en escenarios de despliegue real más diversos.
Artículos Recomendados
Observables de árboles de ramificación aleatoria en entorno aleatorio
Medición selectiva de estados de borde de dispersión de la corona cuántica
Biquandles Virtuales y Nudos Virtuales
SafeWork-R1: Evolución Coevolucionada de la Seguridad e Inteligencia bajo la Ley AI-45$^{\circ}$
Investigación de modelo de dos Higgs-doblete bajo custodia en耦合耦合微弱四元数下通过晶格
OWLS I: La Encuesta de Legado de Olin Wilson
Crecimiento de la Escala de Longitud Estructural en Mezclas Binarias de Kob Andersen: Rol del Orden a Mediana Distancia
Propiedades asintóticas de los ceros de la función zeta de Riemann
Diagnóstico de anormalidades mediante restricción de simetría en sistemas de láminas bidimensionales
Caos confinado y desconfinado en sistemas de spin clásicos