TensorFlow ベンチーマークテスト(1)GeFoce 2080Ti
Tensorflow公式のGitHubにあるベンチマーク
今回から数回に分けて、TensorFlow の GitHub にアップされている benchmark を使って GPU の性能を検証していきます。
今回は、GeForce 2080 Ti をシングルとデュアルで検証していきます。
GeForce 2080 Ti は、 Turing アーキテクチャとまったく新しい RTX グラフィックス プラットフォームが採用されています。
AI コンピューティングの威力をもたらす Tensor コアを搭載した Turing GPU は、強力な AI アルゴリズムをリアルタイムで実行して、
はっきりとした鮮明かつリアルな画像を構築し、今までは不可能だった特殊効果を適用できます。
検証用ワークステーションのスペック
今回の検証には、弊社の科学技術計算向けワークステーション「CERVO Gasta ES2S」を使用します。
<ワークステーション仕様>
オペレーティング・システム:Ubuntu 18.04 LTS
フレームワーク:NVIDIA GPU Cloud(TensrFlow)
プロセッサー:[2基] Xeon Silver 4210
メモリー:32GB(8GB x4)Registered-ECC
1TB 高耐久HDD
「CERVO Grasta Type-ES2S」は、科学技術計算向け(プロセッサー演算)に設計された HPC 専用ワークステーションです。コア数重視のデュアル・プロセッサーを採用しているため、本格的な並列計算に最適です。有償オプションのレールキットを利用して、サーバー・ラックへの収納も可能です。ディープラーニング用途にも活用でき、最大で 2 枚の GPU ボードを搭載可能です。
TensorFlow の benchmark を Git を使いダウンロード
TensorFlow の GitHub にアップされている benchmark を使ってGPUの性能を検証していきます。まずは、TensorFlow の benchmark を Git を使いダウンロードしていきます。
検証にあたり、事前に Git のインストールが必要で、「sudo apt install git」を実行しておきましょう。続いて、Tensorflow 公式 の GitHub にあるベンチマークをダウンロードします。(git clone https://github.com/tensorflow/benchmarks.git)
それでは準備が整いましたので、実際にベンチマークを使っていきたいと思います。
まずは、前回・前々回等でご紹介した Docker や Singularity 等を利用して NGC(Nvidia GPU Cloud) から TensorFlow のイメージを取得し実行します。今回のイメージVersionは「20.03-tf2-py3」を使用します。
それでは TensorFlow を起動し、ベンチマークを実行します。ベンチマークの実行は、先程 Git で取得したディレクトリの中に入っています。(例:例:cd benchmarks/scripts/tf_cnn_benchmarks)
では実際に動かしてみます。
python tf_cnn_benchmarks.py –num_gpus=1 –batch_size=32 –model=resnet50 –variable_update=parameter_server
ここで指定するオプションは次のとおりです。
–num_gpus=1
(複数枚搭載しており1枚のみの場合は「1」を2枚以上で実行する場合はその枚数の数字を入力します)
–batch_size=32
(2のn乗の値を指定することが多いようです。ここでは「32」もしくは「64」で指定します)
–model=resnet50
Deeplearningの使用モデルを指定します。モデルには以下の種類があります。
・resnet50
・resnet101
・resnet101_v2
・resnet152
・resnet152_v2
・inception3
・inception4
・vgg16
・vgg19
・alexnet
–variable_update=parameter_server
変数の管理方法の設定になり、以下の種類があります。
・parameter_server
・replicated
・distributed_replicated
・independent
ここでは「parameter_server」を指定しています。
実際に動かしてみると次の画像のように数字が現れ、学習しています。この数字が大きいほどGPUの性能が良い事になります。それぞれのモデルを実行した数字をまとめたものは上記の画像になります。
次回は、NVIDIA Quadro RTX 5000 で検証したいと思います