Zusammenfassung - Echtzeit-Objekterkennung und -klassifikation mit YOLO für Edge-FPGAs
Titel
Echtzeit-Objekterkennung und -klassifikation mit YOLO für Edge-FPGAs
Zeit
2025-07-24 08:17:37
Autor
{"Rashed Al Amin","Roman Obermaisser"}
Kategorie
{cs.CV,cs.AR}
Link
http://arxiv.org/abs/2507.18174v1
PDF Link
http://arxiv.org/pdf/2507.18174v1
Zusammenfassung
Dieses Papier präsentiert ein ressourcenschonendes Echtzeit-Objekterkennungs- und Klassifikationssystem basierend auf der YOLOv5-Architektur, optimiert für die Implementierung auf Edge-FPGA-Plattformen. Das vorgeschlagene System nutzt das COCO-Datenset für allgemeine Objekterkennung und das GTSRB-Datenset für spezialisierte Verkehrszeichen-Erkennung und -Klassifikation. Das System wird auf der Xilinx Kria KV260 FPGA-Platine implementiert und erreicht eine Klassifikationsgenauigkeit von 99% bei einem Energieverbrauch von 3,5W und einer Verarbeitungsgeschwindigkeit von 9 Bildern pro Sekunde (BPS).
Das Papier diskutiert die Herausforderungen der Erreichung von Ressourceneffizienz und der Aufrechterhaltung hoher Leistung bei der Implementierung von Objekterkennungs- und Klassifikationssystemen auf Edge-FPGAs. Es hebt die Vorteile der Verwendung von FPGAs zur Beschleunigung von Deep-Learning-Inferenzaufgaben aufgrund ihrer Umschreibbarkeit, hoher Parallelität und Energieeffizienz hervor.
Das Papier zeigt auch eine detaillierte Implementierung des vorgeschlagenen Systems auf, einschließlich Datensatzvorbereitung, Modelltraining, Quantisierung und Kompilierung. Das YOLOv5-Modell wird unter Verwendung des PyTorch-Frameworks trainiert und auf die Xilinx Kria KV260 FPGA-Platine optimiert, wobei das Vitis AI Entwicklungsumfeld verwendet wird. Der Quantierungsprozess wandelt die 32-bit-Floating-Point-Gewichte und Aktivierungen des Modells in 8-bit-Integer (INT8)-Darstellungen um, was die Speicherauslastung des Modells erheblich verringert und die Datenübertragungseffizienz verbessert.
Das Papier bewertet das vorgeschlagene System mithilfe von Standard-Benchmark-Datenbanken, COCO für allgemeine Objekterkennung und -Klassifikation, und GTSRB für die Erkennung und Klassifikation von Verkehrszeichen. Die Bewertungsresultate zeigen, dass das vorgeschlagene System eine hohe Klassifikationsgenauigkeit (98,6%) erreicht, während ein geringer Energieverbrauch von 3,5W und eine Verarbeitungsgeschwindigkeit von 9 BPS beibehalten werden. Die Leistung des Systems wird mit bestehenden FPGA-basierten Objekterkennungssystemen verschiedener YOLO-Modellvarianten verglichen. Das vorgeschlagene System zeigt eine verbesserte Genauigkeit und Energieeffizienz im Vergleich zu bestehenden Arbeiten und ist daher eine praktikable Lösung für ressourcenarme Edge-Geräte.
Das Papier schließt mit einer Diskussion der wesentlichen Beiträge des vorgeschlagenen Systems, die die Entwicklung eines ressourcenschonenden Objekterkennungs- und Klassifikationssystems unter Verwendung von YOLO v5 für FPGAs, die Optimierung des YOLO-Modells für die Kompatibilität mit Edge-FPGA-Plattformen und die Bewertung des vorgeschlagenen Systems gegenüber aktuellen FPGA-basierten Objekterkennungs- und Klassifikationssystemen umfassen. Es skizziert ebenfalls zukünftige Arbeiten, die die Verbesserung der Inference-Geschwindigkeit des Systems unter Beibehaltung von Genauigkeit und Ressourceneffizienz beinhalten, und erweitert das Modell, um Multi-Klassen-Erkennungsaufgaben zu unterstützen, wobei es unter diverseren realen Implementierungsszenarien bewertet wird.
Empfohlene Papiere
Vorrücken im Ereignisvorhersagen durch massive Schulung großer Sprachmodelle: Herausforderungen, Lösungen und breitere Auswirkungen
Warum Triebkraft und Sternentstehung in aktiven Galaxien unkorreliert sind
Beschreibung der p-Simulation zwischen Theorien
Bodenabstimmung zur Verringerung elektromagnetischer Störungen für in ungeschirmten Umgebungen arbeitende MRT-Geräte
Monolithische Interferometermodule für mehrachsiges Koordinatenpositionieren mit Sub-Nanometergenauigkeit
Beschränkte Quantisierung für diskrete Verteilungen
NNQS-AFQMC: Neuronale Netzwerk-Quantenzustände verbessertes Fermionen-Quanten-Monte-Carlo-Verfahren
Fristenbewusste gemeinsame Aufgabenplanung und Offloading in mobilen Edge-Computing-Systemen
Numerische Untersuchung der Wellenausbreitung in Granulärem Medium: Kornskalige Inversion und die Rolle der Randeffekte
Amplitude Walk in schnellem Timing: Die Rolle von doppelten Schwellenwerten