Microsoft Research hat einen analogen optischen Computer (AOC) entwickelt, der auf Grundlage von Licht arbeitet, um komplexe Probleme zu lösen. Der Ansatz schafft neue Anwendungsmöglichkeiten im Bereich der Künstlichen Intelligenz (KI) und der Optimierung.
Technische Grundlagen des AOC
Im Gegensatz zu herkömmlichen digitalen Computern, die mit binären Codes (0 und 1) arbeiten, verwendet der AOC physikalische Systeme – nämlich Licht – für seine Berechnungen. Das Grundprinzip ist, dass Lichtteilchen (Photonen) durch Sensoren geleitet werden und dort in Berechnungen einfließen. Der AOC ist in der Lage, Zahlen durch Variation der Lichtintensität zu addieren und zu multiplizieren, was die Basis für die Lösung komplexer Optimierungsprobleme bildet.
Ein zentrales Merkmal des AOC ist seine Fähigkeit zur sogenannten „Fixed-Point Search" (Fixpunkt-Suche). Das ist ein iterativer Prozess, der digitale Umwandlungen vermeidet und dadurch energieeffiziente und rauschrobuste Berechnungen ermöglicht.
Das Team hinter dem AOC hatte von Anfang an das Ziel, ein Gerät zu entwickeln, das für bestimmte Probleme deutlich schneller und energieeffizienter ist als aktuelle Systeme. Zudem ist es so konzipiert, dass es bei Raumtemperatur betrieben werden kann, ähnlich wie ein Desktop-Computer.
Technische Hintergründe zum AOC werden vertiefend in einem Beitrag des Magazins "Nature" beschrieben.
Hardware-Komponenten und Aufbau
Die Hardware des AOC wurde bewusst aus handelsüblichen Teilen konstruiert, um die Kosten niedrig zu halten und eine zukünftige Massenproduktion über bestehende Lieferketten zu ermöglichen. Dazu gehören Micro-LED-Leuchten, optische Linsen und Sensoren, die aus Smartphone-Kameras stammen.
Die wichtigsten Komponenten sind:
- Micro-LEDs: Die winzigen Leuchtdioden, die um ein Vielfaches feiner sind als ein menschliches Haar, dienen als Lichtquelle und repräsentieren neuronale Netzwerkaktivierungen oder Optimierungsvariablen.
- Spatial Light Modulator (SLM): Dieses Bauteil speichert die Gewichte neuronaler Netze oder Koeffizienten von Optimierungsproblemen und multipliziert diese mit dem einfallenden Licht.
- Photodetektor-Array: Es summiert die optischen Signale und wandelt sie in den analogen elektronischen Bereich um.
- Analoge Elektronik: Diese übernimmt weitere Berechnungen wie nicht-lineare Operationen, Subtraktionen und sogenannte „Annealing"-Prozesse.
Das aktuelle Modell des AOC ist ein Prototyp und noch relativ klein. Es arbeitet mit 256 Gewichten oder Parametern, was eine deutliche Steigerung gegenüber der vorherigen Generation mit 64 Gewichten darstellt. Zukünftige Generationen sollen durch weitere Miniaturisierung der Teile und das Hinzufügen von mehr Micro-LEDs Millionen oder sogar Milliarden von Gewichten verarbeiten können und dabei immer kleiner werden. Die Verwendung von 3D-Optik ist entscheidend für die effiziente Verteilung des Lichts und ermöglicht parallele und skalierbare Multiplikationsoperationen großer Matrizen. Microsoft plant, die Entwicklung modular zu gestalten, sodass der AOC auf 0,1 bis 2 Milliarden Gewichte skalieren könnte, indem er 50 bis 1.000 optische Module verwendet.
Ihr Wartungsspezialist im DataCenter
Durch Jahrzehnte lange Erfahrung wissen wir worauf es in Ihrem Data Center ankommt. Profitieren Sie nicht nur von unserer Erfahrung, sondern auch von unseren ausgezeichneten Preisen. Holen Sie sich ein unverbindliches Angebot und vergleichen Sie selbst.
Software: Der Digitale Zwilling und Algorithmen
Ein Schlüsselelement des Microsoft AOC-Projekts ist der „digitale Zwilling" (AOC-DT), ein computerbasiertes Modell, welches das Verhalten der realen AOC-Hardware nachahmt. Es simuliert Eingaben, Prozesse und Ausgaben in einer digitalen Umgebung – quasi eine Softwareversion der Hardware. Der digitale Zwilling ist entscheidend, weil er den Forschern ermöglicht hat, Optimierungsprobleme in einem Maßstab zu lösen, der in realen Situationen nützlich wäre, aber über die Kapazität der aktuellen Prototyp-Hardware hinausgeht. Er wird auch benötigt, um die Machbarkeit zukünftiger Versionen der Maschine zu beweisen.
Der AOC-DT bildet bis zu sieben Nicht-Idealitäten des physischen AOC-Geräts ab und erreicht dabei eine Übereinstimmung von über 99 % mit der Hardware. Microsoft will den Optimierungslöser-Algorithmus und den digitalen Zwilling der Öffentlichkeit zugänglich machen, um die Forschungsgemeinschaft zur Entwicklung neuer Lösungen anzuregen.
Die Kernsoftware des AOC basiert auf einer „Fixed-Point Abstraktion", die das maschinelle Lernen (ML) und Optimierungsparadigmen durch eine iterative Fixpunkt-Suche vereint. Spezielle Algorithmen, die von Forschern wie Jannes Gladrow und Jiaqi Chu entwickelt wurden, ermöglichen es dem AOC, einfache Machine-Learning-Aufgaben auszuführen. Das Training dieser KI-Modelle erfolgt digital mithilfe des AOC-DT, während die eigentliche Inferenz (die Anwendung des trainierten Modells) auf der AOC-Hardware durchgeführt wird.
Einsatzmöglichkeiten im Zusammenhang mit KI
Die Vision für den AOC geht weit über die aktuelle Forschung hinaus, insbesondere im Bereich der Künstlichen Intelligenz. Der AOC hat das Potenzial, KI-Workloads mit einem Bruchteil der benötigten Energie und wesentlich höherer Geschwindigkeit auszuführen, als es die heutigen Grafikprozessoren (GPUs) leisten, die beispielsweise große Sprachmodelle (LLMs) betreiben. Microsoft sieht darin einen „Game Changer".
Der AOC eignet sich besonders gut für iterative KI-Modelle wie beispielsweise Deep-Equilibrium-Netzwerke die rekursives Denken ermöglichen. Bereits jetzt konnten die Forscher den Einsatz des AOC für grundlegende ML-Aufgaben demonstrieren:
- Bildklassifizierung: Der AOC konnte erfolgreich Bilder aus Datensätzen wie MNIST und Fashion-MNIST klassifizieren.
- Nicht-lineare Regression: Das System zeigte vielversprechende Ergebnisse bei der Modellierung nicht-linearer Kurven wie Gauß- oder Sinuskurven.
Für die Zukunft wird erwartet, dass der AOC in der Lage sein könnte, große Sprachmodelle (LLMs) zu betreiben. Insbesondere könnte er energieintensive Denkaufgaben wie das sogenannte „State Tracking" (vergleichbar mit dem strategischen Denken beim Schach) mit einem deutlich geringeren Energieaufwand bewältigen, als dies bei aktuellen GPUs der Fall ist. Die geschätzte Verbesserung der Energieeffizienz für KI-Anwendungen liegt bei etwa dem Hundertfachen. Dies könnte die Entwicklung nachhaltigerer und leistungsfähigerer KI-Systeme maßgeblich vorantreiben.
Anwendungen in der Optimierung (mit Relevanz für KI)
Neben der reinen KI-Forschung ist der AOC auch darauf ausgelegt, Optimierungsprobleme zu lösen, die in vielen realen Prozessen der Finanzwelt, Logistik und des Gesundheitswesens eine Rolle spielen. Hierbei geht es darum, die beste Lösung aus einer unvorstellbar großen Anzahl möglicher Antworten zu finden.
Zwei konkrete Anwendungsfälle wurden bereits erfolgreich demonstriert:
- Finanzsektor: In Zusammenarbeit mit der Barclays Bank PLC wurde ein komplexes Optimierungsproblem für die Abwicklung von Finanztransaktionen (Delivery-versus-Payment-Wertpapierproblem) gelöst. Das Ziel war, den effizientesten Weg zur Begleichung finanzieller Verpflichtungen zu finden, um Kosten und Risiken zu minimieren. Der AOC konnte einen komplexen Testfall mit hoher Genauigkeit lösen.
- Gesundheitswesen: Der AOC zeigte Potenzial bei der medizinischen Bildrekonstruktion, insbesondere bei MRT-Scans. Die Forschungsergebnisse deuten darauf hin, dass die Zeit für solche Scans von 30 auf potenziell fünf Minuten reduziert werden könnte, was die Nutzung von MRT-Geräten deutlich effizienter machen würde.
Diese Optimierungsprobleme werden auf dem AOC als „Quadratic Unconstrained Mixed Optimization" (QUMO)-Probleme formuliert, die sowohl binäre als auch kontinuierliche Variablen enthalten und dadurch sehr flexibel sind, um reale Szenarien abzubilden. Während die derzeitige Hardware QUMO-Probleme mit bis zu 64 Variablen lösen kann, wurde der digitale Zwilling genutzt, um eine Gehirnscan-Rekonstruktion mit über 200.000 Variablen erfolgreich zu demonstrieren. Die Ergebnisse zeigen, dass der AOC-DT für bestimmte Probleme bis zu drei Größenordnungen schneller sein kann als kommerzielle Solver und sogar neue Bestlösungen entdecken konnte.
Ausblick
Hitesh Ballani von Microsoft Research bezeichnet den aktuellen Erfolg als wichtigen Meilenstein, aber auch als Beginn eines anspruchsvollen Weges zu einem kommerziell nutzbaren optischen Analogrechner. Der AOC ist zwar kein Allzweckcomputer, aber die Forscher sind überzeugt, ein breites Spektrum an Anwendungen und realen Problemen zu finden, wo er äußerst erfolgreich sein kann. Die langfristige Vision ist, dass der AOC ein fester Bestandteil der zukünftigen Computertechnologie wird und Microsoft sowie die gesamte Industrie diese rechnergestützte Transformation der Gesellschaft auf nachhaltige Weise vorantreiben.
Ihr Wartungsspezialist für alle großen Hardware Hersteller
Durch Jahrzehnte lange Erfahrung wissen wir worauf es bei der Wartung Ihrer Data Center Hardware ankommt. Profitieren Sie nicht nur von unserer Erfahrung, sondern auch von unseren ausgezeichneten Preisen. Holen Sie sich ein unverbindliches Angebot und vergleichen Sie selbst.
Weitere Artikel
Fujitsu präsentiert Technologie zur Effizienzsteigerung und Spezialisierung von KI-Modellen
Fujitsu hat eine neue Technologie zur Rekonstruktion generativer KI vorgestellt, um Modelle effizienter und genauer zu gestalten. Die Entwicklung
Urheberrechtsverfahren: Anthropic einigt sich auf 1,5 Milliarden Dollar Vergleichszahlung
Das KI-Unternehmen Anthropic hat sich am Freitag bereit erklärt, eine Summe von 1,5 Milliarden US-Dollar zu zahlen, um eine
OpenAI erklärt, warum es bei LLMs zu Halluzinationen kommt
Obwohl Sprachmodelle immer leistungsfähiger werden, bleibt eine Herausforderung bestehen, die sich nur schwer vollständig lösen lässt: Halluzinationen. Damit sind