Zusammenfassung - Energieeffiziente p-Circuits für generative neuronale Netze

Titel
Energieeffiziente p-Circuits für generative neuronale Netze

Zeit
2025-07-10 13:41:28

Autor
{"Lakshmi A. Ghantasala","Ming-Che Li","Risi Jaiswal","Archisman Ghosh","Behtash Behin-Aein","Joseph Makin","Shreyas Sen","Supriyo Datta"}

Kategorie
{cond-mat.dis-nn}

Link
http://arxiv.org/abs/2507.07763v1

PDF Link
http://arxiv.org/pdf/2507.07763v1

Zusammenfassung

Dieser Aufsatz diskutiert die Entwicklung und Implementierung energieeffizienter p-Kreise für generative neuronale Netze. Ein p-Kreis, der aus einem Netzwerk von N p-Bits besteht, kann Ausgaben aus einer Wahrscheinlichkeitsverteilung mit 2^N Möglichkeiten generieren, ähnlich wie ein Netzwerk von q-Bits. Allerdings gibt es grundlegende Unterschiede zwischen den beiden. Der Aufsatz introduces das Konzept eines p-Bits, das ein binäres stochastisches Neuron in Boltzmann-Maschinen darstellt. Jedes p-Bit untersucht den Zustand von 'n' anderen p-Bits, berechnet die Wahrscheinlichkeit, 0 oder 1 zu sein, und wählt entsprechend seinen nächsten Zustand. Der Energieaufwand, ϵ(n), dieser elementaren Operation wird als wichtiger Maßstab betrachtet. Die Autoren argumentieren, dass dieselbe elementare Operation in der generativen künstlichen Intelligenz verwendet werden kann, wobei standardisierte kontinuierliche oder mehrbitige digitale Neuronen durch p-Bits ersetzt werden. Obwohl dies erhebliche Fehler verursachen könnte, zeigen sie, dass durch das Mittelung einer kleinen Anzahl von Mustern (1 bis 100) die Bildqualität wiederhergestellt werden kann. Der Aufsatz präsentiert eine Energieanalyse einer Boltzmann-Maschine, die sich auf die Energie pro elementarer Operation konzentriert. Er diskutiert die verschiedenen Energiekomponenten des Bausteins, wie z.B. die Energie für den Zugriff auf das Speichermedium, die Energie für die Berechnung und die Energie für das Sampling. Die Autoren untersuchen auch die Machbarkeit, denselben Baustein in der generativen künstlichen Intelligenz zu verwenden, wobei kontinuierliche oder mehrbitige digitale Neuronen durch p-Bits ersetzt werden. In den experimentellen Ergebnissen des Aufsatzes verwenden die Autoren ein 12-lagiges Variations-Autoencoder DNN, um aus zufälligen Eingaben Promi-Bilder zu generieren. Sie ersetzen die 32-bit-Aktivierungen durch p-Bits, was zu rauhen Bildern führt. Allerdings erzeugt das Mittelung über 100 Muster erkennbare Gesichtsausdrücke. Das Neuausbilden der Gewichte mit dem tatsächlichen nichtlinearen Element anstatt der kontinuierlichen Version verbessert die Bildqualität erheblich. Der Aufsatz vergleicht die Energiekosten von deterministischen und p-bit-basierten Bausteinen für DNNs. Er schließt, dass p-Bits einen Vorteil bei der Vereinfachung des Berechnungssteps und der Verringerung der Energie für den Zugriff auf das Speichermedium bieten können. Allerdings wird der gesamte Energievorteil von p-Bits gegenüber Standardimplementierungen von anderen Faktoren abhängen, wie z.B. der Energie für den Zugriff auf das Speichermedium und der Anzahl der verwendeten Muster.


Empfohlene Papiere

Übergang von flachbandiger Supraleitfähigkeit zur konventionellen Supraleitfähigkeit

Graphen-heterostrukturbasierte nichtflüchtige Speichergeräte mit oberster Floating-Gate-Programmierung

Ultra3D: Effiziente und hochauflösende 3D-Generierung mit Teilerkennung

Doppelte Aufgabe: FPGA-Architektur zur Enable Concurrent LUT and Adder Chain Usage

Pseudoperiodische sphärische Randbedingungen: Effiziente und anisotrope 3D-Partikelsimulationen ohne Gitter Artefakte

Allgemeine Modelle für die Chemiewissenschaften

Ein mehrstrategischer verbesserten Schlangen-Optimierer für dreidimensionale Drohnen-Pfadplanung und ingenieurwissenschaftliche Probleme

Von Feedback zu Checklisten: Fundierte Bewertung von künstlich generierten klinischen Notizen

Beschreibung der Leistung von Hybriden Sprachmodellen basierend auf dem Zustandsraummodell (SSM) und dem SSM-Transformer mit langer Kontextlänge

Minimal Rollen des solaren Subsurface-Meridionalflusses im verteilten-Schub-Babcock-Leighton-Dynamo