.digital blog

Deep Learning und dataLAB - eine Erfolgsstory

21. November 2019 | Irene Reichl, Christine Cimzar-Egger

Wachsende Datenmengen, neue Fragestellungen in Forschung und Lehre – das alles braucht wachsende Hardware- und Software-Ressourcen, entsprechendes Design und Administration. Mit dem TU.it -dataLAB und der Gründung der DL-Community ist dazu ein enges Netzwerk zwischen Forschenden, Lehrenden und TU.it (HPC-Gruppe) entstanden.

Gemeinsam stärker

Prinzipiell könnte sich jedes Institut oder jede Forschungsgruppe, die über die finanziellen Mittel und das technische Know-how verfügt, einen entsprechenden Rechencluster aufbauen. Der effizientere Weg ist aber, mit der High Performenance Computing-Gruppe (HPC) und dem dataLAB der TU.it Kontakt aufzunehmen und deren Services in Anspruch zu nehmen, da dort die entsprechende Infrastruktur vorhanden ist, um innovative Projekte z.B. in den Bereichen Big Data, Data Analysis oder Deep Learning umzusetzen. Das Team setzt sich aus Kolleg_innen mit wissenschaftlichem Hintergrund oder IT-Ausbildung zusammen, dadurch haben sie ein gutes Verständnis für die Bedürfnisse ihrer Nutzer_innen, an welche die verfügbaren Produkte und Applikationen angepasst werden. Davon profitieren beide Seiten: Die HPC-Gruppe lernt aus dem Feedback, der Vorteil für die Nutzer_innen ist das durch die Bündelung der Ressourcen entstandene attraktive Gesamtpaket. Sie können auf einen deutlich größeren Cluster zugreifen, der laufend weiterentwickelt wird und brauchen dabei kein eigenes IT-Personal. Als TU-Mitarbeiter_innen können sie auch jederzeit an Kursen und Fortbildungen des Vienna Scientific Cluster (VSC) teilnehmen, der neuerdings auch Kurse zu DL und GPU-Programmierung anbietet.

Vernetzung ohne Grenzen – fakultätsübergreifende Zusammenarbeit

Das dataLAB-Team veranstaltet seit heuer auch regelmäßige Vernetzungstreffen, wo Wissenschafler_innen von unterschiedlichen Instituten und Fakultäten zusammenkommen und so Erfahrungsaustausch ermöglicht und die Zusammenarbeit gefördert wird. Die beiden ersten Netzwerktreffen waren gut besucht, es gab Talks des HPC-Teams über zur Verfügung stehende und geplante Hardware und spannende Impulstalks der Nutzer_innen über laufende Projekte. Ein Follow-up ist für Anfang 2020 geplant.

Eine Anwendung am Cluster ist das Masterprogramm Data Science. Es werden nicht nur das Handwerkszeug von DL und Data Science vermittelt, auch die Reflexion ethischer Fragen und Chancengleichheit zieht sich als roter Faden durch den gesamten Lehrgang, wie Florina Piroi berichtete. Dies ist sehr wichtig, da durch Bias in den Daten falsche oder sogar gefährliche Schlüsse gezogen werden könnten, man denke an Justiz oder Medizin. Jiří Hladůvka sprach von seiner Lehrveranstaltung, in der ein Tool (Jupyter) verwendet wird, in dem sich für Studierende und Lehrende Abgabe von Programmieraufgaben, Feedback und Beurteilung vollkommen natürlich gestalten. Sogar die Übernahme in eine Beurteilungsplattform (ngrader) ist nahtlos. Im Allgemeinen schätzen sowohl Lehrende als auch Studierende, dass die Software für alle am Cluster in derselben Version zur Verfügung steht und nicht jede_r einzelne sie selbst installieren muss.

Sind Sie neugierig geworden? Zögern Sie nicht das dataLAB-Team zu kontaktieren, falls Sie auch Interesse an der Nutzung unseres Clusters oder dem Besuch des nächsten DL- und dataLAB-Community-Vernetzungstreffens haben. 

Weitere Informationen:

dataLAB: https://it.tuwien.ac.at/datalab

Ansprechpartnerin für DL und dataLAB Community Vernetzungstreffen:
Irene Reichl (Irene.Reichl@tuwien.ac.at)

VSC Kurs Webseite: http://vsc.ac.at/training/