大学におけるクラスターの活用アイデア

大学におけるクラスターの活用アイデア

私は現在、中規模大学の学生スタッフです。理学部(数学、統計、コンピューター科学、物理学、化学、生物学を含む)で「技術者」として働いています。これは基本的に、教員のコンピューターの基本的なトラブルシューティングと修理、コンピューター ラボの設定、カスタム プログラムの作成、Web サーバーとデータベース サーバーの管理など、あらゆる業務を包括するものです。

現在、クラスター用にセットアップされた比較的新しいコンピューターのグループが 3 つありますが、それらは使用されず、放置されています。何らかのクラスター プロジェクトを実施したいのですが、最大のハードルはクラスターで何をするか、クラスターで何をするかです。クラスターを利用できるアプリケーションやプロジェクトがわかれば、そこから進めることができます。クラスターがビデオ レンダリング、レインボー テーブルの生成/パスワード クラッキング、高可用性 Web サーバーに使用されているという記事を読みました。しかし、私が探していたのはもっと学術的なもの、つまり教授や学部長に実際の学術的有用性として提示できるもの、決して使用されないものではありません。

ビデオをレンダリングする必要がないので、ビデオ レンダリングはやりたくありません。パスワード クラッキングは大学にとってあまり役に立ちません。高可用性 Web クラスターは、静的な学部ページとサイト (ネットワークと大学の Web サイトは別の部門) しかホストしていないため役に立ちません。数学、物理学、または化学部門に提供できるツールが理想的です。ただし、アイデアや例があれば歓迎します。

Linux やその他の OS やプログラムの設定や管理は問題ではありません。問題は、クラスターをどうするかです。

tl/dr: 学術的な環境でクラスターをどうするか。

答え1

Debianと様々なものをインストールすることができますdebian-サイエンスこれらのマシン上のパッケージ。これには、科学におけるいくつかの一般的な計算問題に対応するフリー ソフトウェア プログラムの大規模なコレクションのほか、openmpi などの一般的なライブラリやツールキットが含まれています。

参照http://blends.alioth.debian.org/science/tasks/. これには、DebianScience プロジェクトのサブプロジェクトまたはタスクのリストと、利用可能なソフトウェア パッケージのリスト、それらの機能/目的の説明、およびパッケージの状態が含まれています。上記のメイン DS wiki ページにはこのページへのリンクが壊れているため、ここに修正されたリンクを示します。

私は現在、オーストラリアにある大学の化学学部でシステム管理者として働いており、最近、DebianScience/Chemistry パッケージと、Gaussian03、QCHEM、WebMO (Gaussian、QCHEM、MOPAC、その他の計算化学プログラムへの Web/Java フロントエンド) などの商用/独自ソフトウェアをインストールした、研究者向けのマシンをいくつか構築しています。

私は Debian Science パッケージの化学プログラムに詳しいのですが、物理学、天文学、生物学、数学など他の分野向けのソフトウェアも大量にあることを知っています。また、データ取得、タイプセッティング (TeX など)、Fortran、C、Python などの計算ライブラリなどのための、より「一般的な」パッケージもあります。

少なくとも、上記の debian-science wiki ページには、科学の学者がコンピューティング クラスターで興味を持つ可能性のあるソフトウェアの種類の概要が記載されています。クラスター用に 3 つのグループのマシンがあるとおっしゃっていましたが、どのようなソフトウェアが利用可能かの概要がわかったら、教授の何人かと話し合って、マシンの再構築/再利用の計画を立て始めることができます。

答え2

私が大学の研究室でシステム管理者をしていたとき、ほとんど使われていない膨大な処理能力(約50台のiMac)に直面したので、あなたが提案しているのと同じことをしたいと思いました。最初のきっかけを得るために、並列化可能な問題を抱えている博士課程の学生を見つけました。これは物理学だったので、格子QCDシミュレーションを行い、コードを Mac に移植して Xgrid で実行できるようにしました。共有 Sun クラスタで実行した場合の 3 分の 1 の時間で、実質的に「空いている」 CPU 時間で結果が返ってきたので、部門の他のメンバーも注目しました。

答え3

ハドゥープ必要に応じて、クラスターを使用して大量のデータを処理できます。

答え4

この記事はちょうど私の RSS フィードの 1 つに偶然出くわし、この質問について考えました。そこには 25 個のオープンソース HPC アプリケーションがリストされています。また、さまざまな分野の科学関連のアプリケーションも多数含まれています。

http://www.hpccommunity.org/f55/clusters-produce-25-open-hpc-applications-591/

関連情報