Résumé - Clo-HDnn : Un accélérateur deapprentissage continu sur appareil avec calcul hyperdimensionnel économe en énergie à 4,66 TFLOPS/W et 3,78 TOPS/W, grâce à une recherche progressive
Titre
Clo-HDnn : Un accélérateur deapprentissage continu sur appareil avec calcul hyperdimensionnel économe en énergie à 4,66 TFLOPS/W et 3,78 TOPS/W, grâce à une recherche progressive
Temps
2025-07-23 21:50:28
Auteur
{"Chang Eun Song","Weihong Xu","Keming Fan","Soumil Jain","Gopabandhu Hota","Haichao Yang","Leo Liu","Kerem Akarvardar","Meng-Fan Chang","Carlos H. Diaz","Gert Cauwenberghs","Tajana Rosing","Mingu Kang"}
Catégorie
{cs.AR,cs.LG}
Lien
http://arxiv.org/abs/2507.17953v1
PDF Lien
http://arxiv.org/pdf/2507.17953v1
Résumé
Clo-HDnn est un accélérateur d'apprentissage sur appareil (ODL) conçu spécifiquement pour les tâches d'apprentissage continu (CL). Il utilise des techniques de calcul hyperdimensionnel (HDC) pour optimiser l'exactitude et l'efficacité tout en assurant une efficacité énergétique.
### Caractéristiques clés :
1. **Intégration du Calcul Hyperdimensionnel (HDC) :** Clo-HDnn intègre le HDC avec un encodeur HD Kronecker à faible coût et une fonction d'extraction de caractéristiques par regroupement de poids (WCFE) pour améliorer les performances et l'efficacité.
2. **Formation sans gradient :** Il utilise des méthodes de CL sans gradient pour mettre à jour et stocker efficacement les connaissances apprises sous forme de hypervecteurs de classe, permettant une adaptation fluide à de nouvelles tâches.
3. **Double mode d'opération :** Cette fonction permet de contourner l'extraction coûteuse des caractéristiques pour les ensembles de données plus simples, tandis que la recherche progressive réduit la complexité en encodant et en comparant uniquement des hypervecteurs de requête partiels.
4. **Recherche progressive :** Cette technique encode les caractéristiques d'entrée dans un segment partiel de l'hypervecteur de requête et le compare avec des CHVs associatifs partiels, réduisant la complexité de 61 % avec une perte d'exactitude négligeable.
5. **Ensemble d'instructions personnalisé (ISA) :** Clo-HDnn intègre une ISA personnalisée pour améliorer la programmabilité et améliorer les performances.
### Conception proposée :
L'architecture de Clo-HDnn se compose de deux composants principaux :
1. **Extracteur de caractéristiques par regroupement de poids (WCFE) :** Ce composant extrait des caractéristiques en utilisant le regroupement de poids, ce qui aide à réduire les surcoûts de calcul et les besoins en mémoire.
2. **Module Hyperdimensionnel :** Ce module effectue l'encodage, la formation et l'inference en utilisant des techniques de HDC. Il utilise un encodeur HD Kronecker pour encoder efficacement les caractéristiques d'entrée et un mécanisme de recherche progressive pour réduire la complexité pendant l'inference.
### Résultats de performance :
Clo-HDnn montre des améliorations de performance significatives par rapport aux accélérateurs ODL existants. Il atteint :
- **Efficacité énergétique :** 4,66 TFLOPS/W (FE) et 3,78 TOPS/W (classificateur), offrant une efficacité énergétique 7,77× et 4,85× supérieure aux accélérateurs les plus avancés.
- **Exactitude :** Obtient une perte d'exactitude négligeable par rapport à la base en point flottant.
- **Latence :** Réduit la latence en utilisant efficacement la fonction de contournage WCFE pour les ensembles de données plus simples.
### Conclusion :
Clo-HDnn est un accélérateur ODL extrêmement efficace et précis pour les tâches de CL. En intégrant des techniques de HDC et en utilisant une ISA personnalisée, il atteint des améliorations de performance significatives tout en maintenant une efficacité énergétique. Sa double mode d'opération et son mécanisme de recherche progressive le rendent adapté à diverses applications de CL, fournissant une solution précieuse pour les appareils d'extrémité et les environnements dynamiques.
Articles Recommandés
Modulation des propriétés du PEDOT par des nanoparticules de ferocobalt : morphologie, longueur de conjugaison, niveau de dopage, structure et conductivité électrique
FormulaOne : Mesurer la profondeur de la raison algorithmique au-delà de la programmation compétitive
Revisiting la fiabilité dans le cadre du benchmark d'estimation de pose basé sur le raisonnement
Introduction à distance généralisée dans les génomes des graminées
Contributions non holomorphes dans les GMSB avec des messagers adjoints
Matériaux non conventionnels pour la détection du matière sombre et de la matière lumière
Instabilité hydrodynamique des courbes de particules motiles sur un substrat
Sur la géométrie classique des fonctions vertes chaotiques et des fonctions de Wigner
Amélioration de l'architecture de von Neumann pour un futur intelligent
Un cadre bayésien pour l'association des sources des CRUHA et l'inférence des paramètres