News articles

Künstliche Intelligenz für die Teilchenphysik

Kann man mit machine learning den Geheimnissen des Quark-Gluon-Plasmas auf die Spur kommen? Ja – aber nur mit ausgeklügelten neuen Methoden.

Zwei auseinanderstrebende Farbflecken stellen die Überreste zweier Atomkerne nach der Kollision dar.

1 of 2 images or videos

vier Personen, Screenshot einer Online-Konferenz

1 of 2 images or videos

Komplizierter geht es kaum: Mit extrem hoher Energie schwirren winzige Teilchen wild umher, in dem wirren Durcheinander von Quantenteilchen kommt es zu unzähligen Interaktionen, und so ergibt sich ein Materiezustand, den man als „Quark-Gluon-Plasma“ bezeichnet. Unmittelbar nach dem Urknall war das ganze Universum in diesem Zustand, heute stellt man ihn durch hochenergetische Atomkernkollisionen her, etwa am CERN. 

Wenn man solche Prozesse analysieren will, ist man auf Hochleistungscomputer angewiesen – und auf hochkomplexe Computersimulationen, deren Ergebnisse schwierig auszuwerten sind. Daher liegt die Idee nahe, künstliche Intelligenz bzw. machine learning dafür zu verwenden. Gewöhnliche machine-learning-Algorithmen sind für diese Aufgabe allerdings nicht geeignet. Die mathematischen Eigenschaften der Teilchenphysik machen eine ganz besondere Struktur von neuronalen Netzen notwendig. An der TU Wien konnte nun gezeigt werden, wie man neuronale Netze mit Erfolg für diese herausfordernden Aufgaben der Teilchenphysik nutzen kann.

Neuronale Netze

„Ein Quark-Gluon-Plasma möglichst realistisch zu simulieren nimmt extrem viel Rechenzeit in Anspruch“, sagt Dr. Andreas Ipp vom Institut für Theoretische Physik der TU Wien. „Selbst die größten Supercomputer der Welt sind damit rasch überfordert.“ Es wäre daher wünschenswert, wenn man nicht jedes Detail präzise berechnen müsste, sondern mit Hilfe einer künstlichen Intelligenz gewisse Eigenschaften erkennen und vorhersagen könnte. 

Man verwendet daher neuronale Netze, wie sie etwa auch für die Bilderkennung verwendet werden: Virtuelle „Zellen“ werden am Computer auf ähnliche Weise vernetzt wie Neuronen im Gehirn – und so entsteht ein Netz, das zum Beispiel erkennen kann, ob auf einem bestimmten Bild eine Katze zu sehen ist oder nicht. 

Wenn man diese Technik auf das Quark-Gluon-Plasma anwendet, stößt man allerdings auf ein schwerwiegendes Problem: Die Felder, mit denen man die Teilchen und die Kräfte zwischen ihnen mathematisch beschreibt, können auf unterschiedliche Arten dargestellt werden. „Man spricht hier von Eichsymmetrien“, sagt Ipp. „Das Grundprinzip kennen wir aus dem Alltag: Wenn ich ein Messgerät anders eiche, etwa wenn ich bei meinem Thermometer statt der Celsius-Skala die Kelvin-Skala verwende, dann erhalte ich völlig andere Zahlen, auch wenn ich denselben physikalischen Zustand beschreibe. Bei Quantentheorien ist es ähnlich – nur dass dort die erlaubten Eichungen mathematisch viel komplizierter sind.“ Mathematische Objekte, die auf den ersten Blick völlig unterschiedlich aussehen, können denselben physikalischen Zustand beschreiben.

Eichsymmetrien in die Struktur des Netzes eingebaut

„Wenn man diese Eichsymmetrien nicht berücksichtigt, kann man die Ergebnisse der Computersimulationen nicht sinnvoll interpretieren“, sagt Dr. David I. Müller. „Einem neuronalen Netz beizubringen, diese Eichsymmetrien von sich aus zu erkennen, wäre extrem schwierig. Viel besser ist es, von vornherein die Struktur des neuronalen Netzes so zu gestalten, dass die Eichsymmetrie automatisch berücksichtigt wird – dass also unterschiedliche Darstellungen desselben physikalischen Zustands im neuronalen Netz auch dieselben Signale hervorrufen. Genau das ist uns jetzt gelungen: Wir haben ganz neue Netzwerk-Schichten entwickelt, die von sich aus die Eichinvarianz berücksichtigen.“ In einigen Beispielanwendungen wurde gezeigt, dass diese Netze tatsächlich viel besser lernen können, mit den Simulationsdaten des Quark-Gluon-Plasmas umzugehen.

„Mit solchen neuronalen Netzwerken wird es möglich, Vorhersagen über das System zu treffen – etwa abzuschätzen, wie das Quark-Gluon-Plasma zu einem späteren Zeitpunkt aussehen wird, ohne wirklich jeden einzelnen zeitlichen Zwischenschritt im Detail ausrechnen zu müssen“, sagt Andreas Ipp. „Und gleichzeitig ist sichergestellt, dass nur solche Ergebnisse herauskommen können, die der Eichsymmetrie nicht widersprechen – die also prinzipiell physikalisch sinnvoll sind.“

Bis man etwa Atomkernkollisionen am CERN mit solchen Methoden vollständig simulieren kann, wird noch einige Zeit vergehen, aber die neue Art neuronaler Netze liefert ein völlig neues und vielversprechendes Werkzeug um physikalische Phänomene zu beschreiben, bei denen alle anderen Rechenmethoden sehr rasch völlig überfordert sind. 


Originalpublikation

M. Favoni, A. Ipp, D. I. Müller, and D. Schuh, Lattice Gauge Equivariant Convolutional Neural Networks, Phys. Rev. Lett. 128, 032003 (2022)., opens an external URL in a new window

 

Kontakt

Dr. Andreas Ipp
Technische Universität Wien
Institut für Theoretische Physik
+43 1 58801 13635
andreas.ipp@tuwien.ac.at

Aussender:
Dr. Florian Aigner
Technische Universität Wien
PR und Marketing
Resselgasse 3, 1040 Wien
43 1 58801 41027
florian.aigner@tuwien.ac.at