HPCコンピュータを選ぶには 
                  HPC:High Performance Computing


CAEで使われるコンピュータの選択に関する参考情報を載せます。
詳しくは弊社までご質問ください。

1. 性能 (シングルノードでの性能)
     CPUの高速性
        CPU単体での性能が一番性能に影響します。
        1980年代、90年代前半まではベクターマシンといわれたスーパーコンピューターが
        全盛でしたが、高価で一般のユーザは手に入りませんでした。 90年代からはUNIX
        WSという事でAlphaServerやOrigin3000等が盛んに使われました。
        しかし2000年代になると市販のIntelのPentium、Xeonが優れたCost/Performanceを
        発揮し、2003年からはAMDがOpteronを出すに至っては64ビットも扱え、多くのユーザで
        IntelやAMDを使うようになってきました。
        この性能評価の指標としては実際のアプリケーションの実行が確実ですが標準的な
        評価手法としてSEPCint、SPECfpがあります。 以前はLinpackもかなり使われており
        ましたが最近の資料ではTOP500に関連結果が載っているくらいでLinpackのホーム
        ページの情報は最新のものが載っていません。 
        (グラフは SPECfp2000の結果にリンク


     メモリー領域とアクセス性能
        CAEでは当然、大規模な計算を行いデータはメモリーに格納されます。このメモリーに
        アクセスするのに32ビットマシンだと2GBの領域しかアクセスできません。 現在のCAE
        アプリケーションでは大規模モデルを解く為にインコアで計算すると高速に計算できます
        が大きなメモリ領域を必要とします。これを実現する為にはOSが64ビットである必要が
        あり、その上にハード的に多くのメモリーを積む必要があります。
        計算をアウトコアで計算した場合は非常に計算時間がかかります。
        また、このメモリー上のデータをいかに高速に処理できるかがシュミレーションの計算能力
        に関ってきます。 メモリアクセスを高速にする為には
            ・ 多段の1次キャッシュ、2次キャッシュを搭載する
            ・ 多くのバンクを用意して、一度に大量のメモリーをアクセスする。
            ・ OpteronのようにメモリーとCPUを直結し、チップセットのMCHのようなもの
              を介さない
        等があります。

     I/Oの高速化
        構造解析では大規模な固有値解析があると数百GBレベルの非常に大量のI/Oを行います。
        このI/Oを高速化するための仕組みをシステムが持つ必要があります。
        具体的には、現在だと15,000回転の高速Diskの利用。ハードウェア、ソフトウェアの多段の
        RAID0を利用したストライピングによる高速化等があります。

2. 性能(クラスターでの性能)
     単体システムでの高速化
        上記1項にも書いたように単体CPUがシュミレーションでの高速性に大きく影響します。
        クラスターの場合は4、8、16CPUから、大きい場合は64CPU、128CPU、256CPUの様に
        大量のCPUを使いますのでコストパフォーマンスの良いシステムが最適です。

     ノード間通信の高速化
        クラスターではノードを跨って通信し計算が進行していきます。この為にノード間の通信が
        高速でないとクラスタートしての性能を発揮しません。

     ノード間通信での小さな遅延時間
        ノード間の通信で大量の通信を発揮しても、連繋して計算する複数のプロセス間での
        情報の交換が遅いと全体的な計算時間が遅くなります。 これに大きく影響するのが
        遅延時間でEthernetでは100μsec位、専用のMyrinetやInfinibandだと数μ〜10μsec
        位になります。

3. アプリケーションの特性
     クラスター向きアプリケーション
        流体解析や衝突解析はCPUとメモリー間の高速性が重要ですが、メモリーサイズや
        I/O性能は構造解析ほど高速性を要求されません。 また、高速化のための分散メモリー
        版のモジュールが比較的早くから出されており、クラスターでの実装が進んでおります。
        この為にクラスターでの構成で実行性能を効果的に伸ばすことが可能です。
        この性能の伸びは
            ・ ノード間を接続するインターコネクト
            ・ データの内容
                  小規模のデータでクラスターを利用しても性能が出ません。
        に依存します。
        4〜8CPUはリニアに性能が伸びますが、16CPU以上ではインターコネクトの性能が大きく
        影響してきます。 また高性能なインターコネクトでは小規模クラスターでも効果があります。

    単一ノード向きアプリケーション(SMPシステム)
        Nastranでの振動騒音解析やABAQUSのような大規模なメモリーと大量I/Oが発生する
        アプリケーションでは単一ノードで大量のメモリーと高速I/Oを考えたシステムが効果的です。
        しかし最近ではAdventureのようにクラスター向きの構造計算アプリケーションも出てきて
        おります。

この他、実際のベンチマーク結果がインターネット上で公開されておりますので、その情報を参考に
できます。  ここには書かなかった事項にはOSの選択、ディスクの選択、ファイルのロケーション、
キューイングシステム等の多くの要素があります。

                                                   2004年11月23日作成        

[ホームページへ] [システム製品へ] [前のページへ]