Resumen - Clo-HDnn: Un acelerador de aprendizaje continuo en el dispositivo con una eficiencia energética de 4.66 TFLOPS/W y 3.78 TOPS/W mediante cómputo hiperdimensional eficiente en energía a través de búsqueda progresiva
Título
Clo-HDnn: Un acelerador de aprendizaje continuo en el dispositivo con una eficiencia energética de 4.66 TFLOPS/W y 3.78 TOPS/W mediante cómputo hiperdimensional eficiente en energía a través de búsqueda progresiva
Tiempo
2025-07-23 21:50:28
Autor
{"Chang Eun Song","Weihong Xu","Keming Fan","Soumil Jain","Gopabandhu Hota","Haichao Yang","Leo Liu","Kerem Akarvardar","Meng-Fan Chang","Carlos H. Diaz","Gert Cauwenberghs","Tajana Rosing","Mingu Kang"}
Categoría
{cs.AR,cs.LG}
Enlace
http://arxiv.org/abs/2507.17953v1
PDF Enlace
http://arxiv.org/pdf/2507.17953v1
Resumen
Clo-HDnn es un acelerador de aprendizaje en dispositivo (ODL) diseñado específicamente para tareas de aprendizaje continuo (CL). Utiliza técnicas de computación hiperdimensional (HDC) para optimizar la precisión y la eficiencia, al tiempo que garantiza la eficiencia energética.
### Características Clave:
1. **Integración de Computación Hiperdimensional (HDC)**: Clo-HDnn integra HDC con un codificador HD de Kronecker de bajo costo y la extracción de características de agrupamiento de pesos (WCFE) para mejorar el rendimiento y la eficiencia.
2. **Entrenamiento Sin Gradientes**: Utiliza métodos de CL sin gradientes para actualizar y almacenar eficientemente el conocimiento aprendido en la forma de hiper vectores de clase, permitiendo una adaptación sin problemas a nuevas tareas.
3. **Operación en Doble Modo**: Esta función permite saltarse la extracción de características costosa para conjuntos de datos más simples, mientras que la búsqueda progresiva reduce la complejidad mediante la codificación y comparación de solo segmentos parciales de hiper vectores de consulta.
4. **Búsqueda Progresiva**: Esta técnica codifica las características de entrada en un segmento parcial del hiper vector de consulta y lo compara con CHVs asociativos parciales, reduciendo la complejidad en un 61% con una pérdida de precisión inapreciable.
5. **Conjunto de Instrucciones Personalizado (ISA)**: Clo-HDnn incorpora una ISA personalizada para mejorar la programabilidad y mejorar el rendimiento.
### Diseño Propuesto:
La arquitectura de Clo-HDnn consta de dos componentes principales:
1. **Extractor de Características de Agrupamiento de Pesos (WCFE)**: Este componente extrae características utilizando agrupamiento de pesos, lo que ayuda a reducir la sobrecarga computacional y los requisitos de memoria.
2. **Módulo Hiperdimensional**: Este módulo realiza la codificación, el entrenamiento e la inferencia utilizando técnicas HDC. Utiliza un codificador HD de Kronecker para codificar eficientemente las características de entrada y un mecanismo de búsqueda progresiva para reducir la complejidad durante la inferencia.
### Resultados de Rendimiento:
Clo-HDnn muestra mejoras significativas en el rendimiento en comparación con los aceleradores ODL existentes. Logra:
- **Eficiencia Energética**: 4.66 TFLOPS/W (FE) y 3.78 TOPS/W (clasificador), proporcionando 7.77× y 4.85× mayor eficiencia energética que los aceleradores de vanguardia.
- **Precisión**: Logra una caída de precisión inapreciable en comparación con la base de flotación.
- **Latencia**: Reduce la latencia al utilizar eficazmente la función de bypass del WCFE para conjuntos de datos más simples.
### Conclusión:
Clo-HDnn es un acelerador ODL altamente eficiente y preciso para tareas de CL. Al integrar técnicas HDC y utilizar una ISA personalizada, logra mejoras significativas en el rendimiento mientras mantiene la eficiencia energética. Su operación en doble modo y mecanismo de búsqueda progresiva lo hacen adecuado para diversas aplicaciones de CL, proporcionando una solución valiosa para dispositivos de borde y entornos dinámicos.
Artículos Recomendados
Cuantificación restringida para distribuciones discretas
BetterCheck: Hacia la Protección de los Sistemas de Percepción Automotriz VLM
Adhesión Dependiente de la Geometría en Elastómeros de Cristal Líquido Monodominio Transparente
Estados de pared cuántica para mitigación de ruido y límites de pureza eterna
Programación conjunta de tareas y descarga inteligente en sistemas de computación en la nube móvil con conciencia de plazos límite
La sensibilidad de los detectores de escintilador líquido a la violación de CP con neutrinos atmosféricos
Conjuntos regulares en grafos de suma de Cayley sobre grupos generalizados dicíclicos
GENIAL: Exploración del Espacio de Diseño de Diseño Genérico mediante Inversión de Red para Unidades de Lógica Algorítmica de Baja Potencia
Superconductividad chirales cerca de un aislante de Chern fraccional
Conjuntos evasivos, variedades entrelazadas, y árboles de clique contenedor