Nutzungsideen für einen Cluster an einer Universität

Nutzungsideen für einen Cluster an einer Universität

Ich bin derzeit studentischer Hilfsarbeiter an einer mittelgroßen Universität. Ich arbeite für die Fakultät für Naturwissenschaften (umfasst Mathematik, Statistik, Informatik, Physik, Chemie und Biologie) und als „Techniker“. Dies umfasst im Wesentlichen die grundlegende Fehlerbehebung und Reparatur von Fakultätscomputern, das Einrichten von Computerlaboren, das Schreiben benutzerdefinierter Programme und die Verwaltung von Web- und Datenbankservern.

Wir haben derzeit drei Gruppen relativ neuer Computer für Cluster eingerichtet, die jedoch nicht verwendet und aufgegeben werden. Ich würde gerne eine Art Clusterprojekt durchführen, aber meine größte Hürde ist, was ich mit den Clustern machen soll. Wenn ich wüsste, welche Anwendungen oder Projekte einen Cluster nutzen könnten, könnte ich von dort aus weitermachen. Ich habe gelesen, dass Cluster für Video-Rendering, die Generierung von Rainbow Tables/Passwort-Cracking und hochverfügbare Webserver verwendet werden. Aber ich suchte nach etwas Akademischerem; etwas, das den Professoren und Dekanen als etwas präsentiert werden könnte, das tatsächlich akademisch nutzbar ist. Nicht etwas, das nie verwendet wird.

Ich möchte eigentlich kein Video-Rendering durchführen, da es keinen Bedarf dafür gibt. Das Knacken von Passwörtern würde dem College nicht viel nützen. Ein hochverfügbarer Webcluster ist nutzlos, da wir nur ein paar statische Fakultätsseiten und unsere Site hosten (Netzwerk und die Websites der Universität sind eine andere Abteilung). Tools, die ich der Mathematik-, Physik- oder Chemieabteilung präsentieren könnte, wären ideal. Ich bin jedoch offen für Ideen oder Beispiele.

Das Einrichten/Verwalten von Linux oder einem anderen Betriebssystem oder Programm ist nicht das Problem. Das Problem ist, was mit dem Cluster geschehen soll.

tl/dr: Was tun mit einem Cluster in einem akademischen Umfeld?

Antwort1

Sie könnten Debian plus die verschiedenenDebian-WissenschaftPakete auf diesen Maschinen. Dazu gehört eine recht große Sammlung kostenloser Softwareprogramme für verschiedene gängige Rechenprobleme in der Wissenschaft sowie allgemeine Bibliotheken und Toolkits wie OpenMPI.

siehe auchhttp://blends.alioth.debian.org/science/tasks/. es enthält eine Liste der Unterprojekte oder Aufgaben des DebianScience-Projekts sowie Auflistungen der verfügbaren Softwarepakete mit Beschreibungen ihrer Funktion/ihres Zwecks und dem Status der Pakete. Die oben aufgeführte Haupt-DS-Wikiseite hat einen defekten Link zu dieser Seite, daher hier ein reparierter Link.

Ich arbeite derzeit als Systemadministrator an der chemischen Fakultät einer Universität hier in .au und habe vor kurzem mehrere Maschinen für die Lehrkräfte gebaut, auf denen die DebianScience/Chemistry-Pakete sowie kommerzielle/proprietäre Software wie Gaussian03, QCHEM und WebMO (ein Web-/Java-Frontend für Gaussian, QCHEM, MOPAC und andere Computerchemieprogramme) installiert sind.

Ich bin besser mit den Chemieprogrammen in den Debian Science-Paketen vertraut, weiß aber, dass es auch eine riesige Menge an Software für andere Bereiche wie Physik, Astronomie, Biologie, Mathematik usw. gibt. Außerdem gibt es „allgemeinere“ Pakete für Datenerfassung, Schriftsatz (TeX usw.), Berechnungsbibliotheken für Fortran, C, Python und mehr.

zumindest gibt Ihnen die obige Debian-Science-Wiki-Seite einen guten Überblick über die Arten von Software, die für Wissenschaftler auf Computerclustern von Interesse sein könnten. Sie sagten, Sie hätten drei Maschinengruppen für Cluster. Wenn Sie also erst einmal einen Überblick über die verfügbaren Softwarearten haben, können Sie mit einigen Professoren sprechen und mit der Planung des Umbaus/der Umnutzung der Maschinen beginnen.

Antwort2

Als ich Sysadmin für ein Universitätslabor war, war ich mit einer enormen Rechenleistung (etwa 50 iMacs) konfrontiert, die weitgehend nicht ausgelastet war, also wollte ich dasselbe tun, was Sie vorschlagen. Um den ersten Anstoß zu bekommen, fand ich einen Doktoranden, der ein parallelisierbares Problem hatte - das war Physik, also hatte er eineGitter-QCDSimulation - und begann, seinen Code auf den Mac zu portieren, damit er unter Xgrid lief. Als er die Ergebnisse in einem Drittel der Zeit zurückbekam, die er auf dem gemeinsam genutzten Sun-Cluster gebraucht hätte, also in der tatsächlich „freien“ CPU-Zeit, schenkte ihm der Rest der Abteilung Aufmerksamkeit.

Antwort3

AhadoopBei Bedarf könnten Cluster zur Verarbeitung riesiger Datenmengen verwendet werden.

Antwort4

Dieser Artikel ist mir gerade in einem meiner RSS-Feeds aufgefallen und ich habe über diese Frage nachgedacht. Er listet 25 Open-Source-HPC-Anwendungen auf. Und er umfasst eine Reihe wissenschaftlicher Anwendungen aus einer Reihe von Disziplinen.

http://www.hpccommunity.org/f55/clusters-produce-25-open-hpc-applications-591/

verwandte Informationen