Zusammenfassung - Energieeffiziente p-Circuits für generative neuronale Netze
Titel
Energieeffiziente p-Circuits für generative neuronale Netze
Zeit
2025-07-10 13:41:28
Autor
{"Lakshmi A. Ghantasala","Ming-Che Li","Risi Jaiswal","Archisman Ghosh","Behtash Behin-Aein","Joseph Makin","Shreyas Sen","Supriyo Datta"}
Kategorie
{cond-mat.dis-nn}
Link
http://arxiv.org/abs/2507.07763v1
PDF Link
http://arxiv.org/pdf/2507.07763v1
Zusammenfassung
Dieser Aufsatz diskutiert die Entwicklung und Implementierung energieeffizienter p-Kreise für generative neuronale Netze. Ein p-Kreis, der aus einem Netzwerk von N p-Bits besteht, kann Ausgaben aus einer Wahrscheinlichkeitsverteilung mit 2^N Möglichkeiten generieren, ähnlich wie ein Netzwerk von q-Bits. Allerdings gibt es grundlegende Unterschiede zwischen den beiden.
Der Aufsatz introduces das Konzept eines p-Bits, das ein binäres stochastisches Neuron in Boltzmann-Maschinen darstellt. Jedes p-Bit untersucht den Zustand von 'n' anderen p-Bits, berechnet die Wahrscheinlichkeit, 0 oder 1 zu sein, und wählt entsprechend seinen nächsten Zustand. Der Energieaufwand, ϵ(n), dieser elementaren Operation wird als wichtiger Maßstab betrachtet.
Die Autoren argumentieren, dass dieselbe elementare Operation in der generativen künstlichen Intelligenz verwendet werden kann, wobei standardisierte kontinuierliche oder mehrbitige digitale Neuronen durch p-Bits ersetzt werden. Obwohl dies erhebliche Fehler verursachen könnte, zeigen sie, dass durch das Mittelung einer kleinen Anzahl von Mustern (1 bis 100) die Bildqualität wiederhergestellt werden kann.
Der Aufsatz präsentiert eine Energieanalyse einer Boltzmann-Maschine, die sich auf die Energie pro elementarer Operation konzentriert. Er diskutiert die verschiedenen Energiekomponenten des Bausteins, wie z.B. die Energie für den Zugriff auf das Speichermedium, die Energie für die Berechnung und die Energie für das Sampling. Die Autoren untersuchen auch die Machbarkeit, denselben Baustein in der generativen künstlichen Intelligenz zu verwenden, wobei kontinuierliche oder mehrbitige digitale Neuronen durch p-Bits ersetzt werden.
In den experimentellen Ergebnissen des Aufsatzes verwenden die Autoren ein 12-lagiges Variations-Autoencoder DNN, um aus zufälligen Eingaben Promi-Bilder zu generieren. Sie ersetzen die 32-bit-Aktivierungen durch p-Bits, was zu rauhen Bildern führt. Allerdings erzeugt das Mittelung über 100 Muster erkennbare Gesichtsausdrücke. Das Neuausbilden der Gewichte mit dem tatsächlichen nichtlinearen Element anstatt der kontinuierlichen Version verbessert die Bildqualität erheblich.
Der Aufsatz vergleicht die Energiekosten von deterministischen und p-bit-basierten Bausteinen für DNNs. Er schließt, dass p-Bits einen Vorteil bei der Vereinfachung des Berechnungssteps und der Verringerung der Energie für den Zugriff auf das Speichermedium bieten können. Allerdings wird der gesamte Energievorteil von p-Bits gegenüber Standardimplementierungen von anderen Faktoren abhängen, wie z.B. der Energie für den Zugriff auf das Speichermedium und der Anzahl der verwendeten Muster.
Empfohlene Papiere
Übergang von flachbandiger Supraleitfähigkeit zur konventionellen Supraleitfähigkeit
Graphen-heterostrukturbasierte nichtflüchtige Speichergeräte mit oberster Floating-Gate-Programmierung
Ultra3D: Effiziente und hochauflösende 3D-Generierung mit Teilerkennung
Doppelte Aufgabe: FPGA-Architektur zur Enable Concurrent LUT and Adder Chain Usage
Pseudoperiodische sphärische Randbedingungen: Effiziente und anisotrope 3D-Partikelsimulationen ohne Gitter Artefakte
Allgemeine Modelle für die Chemiewissenschaften
Ein mehrstrategischer verbesserten Schlangen-Optimierer für dreidimensionale Drohnen-Pfadplanung und ingenieurwissenschaftliche Probleme
Von Feedback zu Checklisten: Fundierte Bewertung von künstlich generierten klinischen Notizen
Beschreibung der Leistung von Hybriden Sprachmodellen basierend auf dem Zustandsraummodell (SSM) und dem SSM-Transformer mit langer Kontextlänge
Minimal Rollen des solaren Subsurface-Meridionalflusses im verteilten-Schub-Babcock-Leighton-Dynamo