Zusammenfassung - Echtzeit-Objekterkennung und -klassifikation mit YOLO für Edge-FPGAs

Titel

Echtzeit-Objekterkennung und -klassifikation mit YOLO für Edge-FPGAs

Zeit

2025-07-24 08:17:37

Autor

{"Rashed Al Amin","Roman Obermaisser"}

Kategorie

{cs.CV,cs.AR}

Link
http://arxiv.org/abs/2507.18174v1

PDF Link
http://arxiv.org/pdf/2507.18174v1

Zusammenfassung

Dieses Papier präsentiert ein ressourcenschonendes Echtzeit-Objekterkennungs- und Klassifikationssystem basierend auf der YOLOv5-Architektur, optimiert für die Implementierung auf Edge-FPGA-Plattformen. Das vorgeschlagene System nutzt das COCO-Datenset für allgemeine Objekterkennung und das GTSRB-Datenset für spezialisierte Verkehrszeichen-Erkennung und -Klassifikation. Das System wird auf der Xilinx Kria KV260 FPGA-Platine implementiert und erreicht eine Klassifikationsgenauigkeit von 99% bei einem Energieverbrauch von 3,5W und einer Verarbeitungsgeschwindigkeit von 9 Bildern pro Sekunde (BPS). Das Papier diskutiert die Herausforderungen der Erreichung von Ressourceneffizienz und der Aufrechterhaltung hoher Leistung bei der Implementierung von Objekterkennungs- und Klassifikationssystemen auf Edge-FPGAs. Es hebt die Vorteile der Verwendung von FPGAs zur Beschleunigung von Deep-Learning-Inferenzaufgaben aufgrund ihrer Umschreibbarkeit, hoher Parallelität und Energieeffizienz hervor. Das Papier zeigt auch eine detaillierte Implementierung des vorgeschlagenen Systems auf, einschließlich Datensatzvorbereitung, Modelltraining, Quantisierung und Kompilierung. Das YOLOv5-Modell wird unter Verwendung des PyTorch-Frameworks trainiert und auf die Xilinx Kria KV260 FPGA-Platine optimiert, wobei das Vitis AI Entwicklungsumfeld verwendet wird. Der Quantierungsprozess wandelt die 32-bit-Floating-Point-Gewichte und Aktivierungen des Modells in 8-bit-Integer (INT8)-Darstellungen um, was die Speicherauslastung des Modells erheblich verringert und die Datenübertragungseffizienz verbessert. Das Papier bewertet das vorgeschlagene System mithilfe von Standard-Benchmark-Datenbanken, COCO für allgemeine Objekterkennung und -Klassifikation, und GTSRB für die Erkennung und Klassifikation von Verkehrszeichen. Die Bewertungsresultate zeigen, dass das vorgeschlagene System eine hohe Klassifikationsgenauigkeit (98,6%) erreicht, während ein geringer Energieverbrauch von 3,5W und eine Verarbeitungsgeschwindigkeit von 9 BPS beibehalten werden. Die Leistung des Systems wird mit bestehenden FPGA-basierten Objekterkennungssystemen verschiedener YOLO-Modellvarianten verglichen. Das vorgeschlagene System zeigt eine verbesserte Genauigkeit und Energieeffizienz im Vergleich zu bestehenden Arbeiten und ist daher eine praktikable Lösung für ressourcenarme Edge-Geräte. Das Papier schließt mit einer Diskussion der wesentlichen Beiträge des vorgeschlagenen Systems, die die Entwicklung eines ressourcenschonenden Objekterkennungs- und Klassifikationssystems unter Verwendung von YOLO v5 für FPGAs, die Optimierung des YOLO-Modells für die Kompatibilität mit Edge-FPGA-Plattformen und die Bewertung des vorgeschlagenen Systems gegenüber aktuellen FPGA-basierten Objekterkennungs- und Klassifikationssystemen umfassen. Es skizziert ebenfalls zukünftige Arbeiten, die die Verbesserung der Inference-Geschwindigkeit des Systems unter Beibehaltung von Genauigkeit und Ressourceneffizienz beinhalten, und erweitert das Modell, um Multi-Klassen-Erkennungsaufgaben zu unterstützen, wobei es unter diverseren realen Implementierungsszenarien bewertet wird.

Empfohlene Papiere

Vorrücken im Ereignisvorhersagen durch massive Schulung großer Sprachmodelle: Herausforderungen, Lösungen und breitere Auswirkungen

Warum Triebkraft und Sternentstehung in aktiven Galaxien unkorreliert sind

Beschreibung der p-Simulation zwischen Theorien

Bodenabstimmung zur Verringerung elektromagnetischer Störungen für in ungeschirmten Umgebungen arbeitende MRT-Geräte

Monolithische Interferometermodule für mehrachsiges Koordinatenpositionieren mit Sub-Nanometergenauigkeit

Beschränkte Quantisierung für diskrete Verteilungen

NNQS-AFQMC: Neuronale Netzwerk-Quantenzustände verbessertes Fermionen-Quanten-Monte-Carlo-Verfahren

Fristenbewusste gemeinsame Aufgabenplanung und Offloading in mobilen Edge-Computing-Systemen

Numerische Untersuchung der Wellenausbreitung in Granulärem Medium: Kornskalige Inversion und die Rolle der Randeffekte

Amplitude Walk in schnellem Timing: Die Rolle von doppelten Schwellenwerten