News

So bleiben Grafikkarten jung

Für viele Hochleistungsaufgaben setzt man heute Grafikkarten ein. Ihren Alterungsprozess kann man durch kluges Aufgaben-Management bremsen, zeigen TU Wien und University of California (Irvine).

Der aktuelle Zustand der einzelnen Grafikkarten wird beurteilt, dementsprechend wird die Last verteilt. [1]

1 von 3 Bildern oder Videos

Der aktuelle Zustand der einzelnen Grafikkarten wird beurteilt, dementsprechend wird die Last verteilt. [1]

Der aktuelle Zustand der einzelnen Grafikkarten wird beurteilt, dementsprechend wird die Last verteilt. [1]

Muhammad Shafique

1 von 3 Bildern oder Videos

Muhammad Shafique

Muhammad Shafique

Ein Cluster aus Grafikkarten [2]

1 von 3 Bildern oder Videos

Ein Cluster aus Grafikkarten [2]

Ein Cluster aus Grafikkarten [2]

Grafikkarten werden längst nicht mehr nur für die Darstellung von Grafik verwendet. Gerne nutzt man sie heute auch für besonders rechenintensive Aufgaben aus ganz anderen Bereichen – etwa in der wissenschaftlichen Forschung oder auch für Bitcoin-Mining.

Allerdings verschlechtert sich die Leistung der Grafikkarten normalerweise mit der Zeit, weil die einzelnen Prozessorkerne der Grafikkarte aufgrund von Alterungseffekten nicht mehr optimal zusammenspielen. An der TU Wien wurde nun in Zusammenarbeit mit der University of California (Irvine) eine verbesserte Chip-Management-Methode entwickelt, mit der die Rechenlast klüger verteilt werden kann. In über 95 % der Fälle wird die Grafikkarten-Alterung dadurch eingebremst.

Hochparalleles Rechnen
„Gewöhnliche Computer, wie man sie zu Hause stehen hat, haben einige wenige Prozessorkerne. Eine Grafikkarte hingegen hat eine gewaltige Anzahl von Prozessorkernen – typischerweise hunderte oder tausende“, erklärt Prof. Muhammad Shafique vom Institut für Computer Engineering an der TU Wien. Man kann Grafikkarten daher sehr gut für Berechnungen einsetzen, die parallelisierbar sind, bei denen also eine Aufgabe in viele unabhängige Teilschritte zerlegt werden kann, die gleichzeitig von unterschiedlichen Prozessorkernen durchgeführt werden.

Allerdings sind die Prozessorkerne niemals völlig identisch. „Die Strukturen sind sehr klein, produktionsbedingt kommt es immer zu gewissen Abweichungen“, sagt Muhammad Shafique. Daher wirkt sich auch die Alterung des Chips unterschiedlich auf die unterschiedlichen Prozessorkerne aus. Unter hoher Belastung liefern die einzelnen Kerne irgendwann unterschiedliche Leistung.
Das ist ein Problem für die Qualität der Parallelisierung: Wenn man eine Aufgabe auf viele Prozessorkerne verteilt und für den nächsten Schritt warten muss, bis alle fertig gerechnet haben, dann bestimmt der langsamste Prozessorkern zwangsläufig, wie schnell es weitergeht. Dadurch ergibt sich bald ein deutlicher Rückgang der Gesamtperformance.

Lasten fair verteilen
Dieses Problem wollen Muhammad Shafique und das Team um Prof. Mohammad Al Faruque von der University of California (Irvine) nun durch ein besseres Management lösen: „Entscheidend ist es, zuerst den aktuellen Status der einzelnen Prozessorkerne zu kennen“, sagt Muhammad Shafique. „Dann kann man die Rechenaufgaben so zuweisen, dass der physische Stress möglichst gleichmäßig auf die unterschiedlichen Kerne verteilt wird.“

Prozessorkerne mit ähnlichen Eigenschaften werden zu „Clustern“ zusammengefasst, die dann auf genau vorherberechnete Weise mehr oder weniger stark belastet werden. So lässt sich der Alterungsprozess bremsen, die Gesamtleistung des Systems verbessert sich. „Es gab bereits Überlegungen, die Alterung von Grafikkarten auf Compiler-Ebene einzubremsen, doch unsere Methode ist deutlich effektiver, sie bringt in über 95 % der Fälle einen Vorteil“, sagt Muhammad Shafique.


Die Publikation (im Journal IEEE Transactions on Computers) wurde von Nature Electronics als "Research Highlight" aufgegriffen: <link https: www.nature.com natelectron volumes issues>"Just about managing"

Originalpublikation:
<link http: ieeexplore.ieee.org document>H. Lee, M. Shafique, M. Al Faruque, Aging-aware Workload Management on Embedded GPU Under Process Variation, IEEE Transactions on Computers, PP 99 (2018). DOI: 10.1109/TC.2018.2789904

[1] Bild: IEEE
[2] Foto: Chris Dag (Wikimedia Commons), Creative Commons Attribution 2.0 Generic


Kontakt:
Prof. Muhammad Shafique
Institut für Computer Engineering
Technische Universität Wien
Treitlstraße 3, 1040 Wien
T: +43-1-58801-18252
<link>muhammad.shafique@tuwien.ac.at

Aussender:
Technische Universität Wien
Dr. Florian Aigner
PR & Marketing
Resselgasse 3, 1040 Wien
T: +43-1-58801-41027
<link>florian.aigner@tuwien.ac.at