Ryzen 7 2700X PC ―― ベンチマーク(その2)

きょうは、きのうの日記にチョロっと書いたけど、ベンチマークの残り三つ(④写真現像・⑤動画編集・⑥機械学習)についてです。
最初の三つはド定番のベンチマークソフトを使いました。①CINEBENCH、②CrystalDiskMark、③FINAL FANTASY XVね ^^; 少し前の日記になるけど、こちらからどうぞ。

 
きょうの三つはベンチマークソフトを使うのではなく、私が仕事や趣味でよく使うソフトウェアにおける 例題の実行時間を測定するってもの。旧母艦PCと新母艦PCでの実行時間を比較しようってわけです ^^;

旧・新母艦PCのスペックの違いは次のとおり。

20180711_新母艦PCスペック スペック比較表

 

ベンチマーク④ 写真現像:Lightroom Classic

まずは写真現像。使用したソフトウェアはAdobe Lightroom Classic CCです。
Canon EOS 7D Mark IIで撮影した写真のRAW画像データ(5,472×3,468≒2,000万画素, 1枚約22MB)1,000枚に同一の補正(部分的な露出補正、色補正、部分的なぼかし、回転、切り抜き)を適用し、出力しました。この補正処理のビフォー・アフターはこんな感じです(左が元画像、右が補正適用後)。

20180528_写真現像のベンチマークテストの例題 補正処理のビフォー・アフター

結果は次のとおり。括弧内の数値は旧母艦PCに対する処理速度の比で、何倍高速かを表しています。

1,000枚のRAW画像の現像

  • 旧母艦PC:70分15秒(1.00)
  • 新母艦PC:31分25秒(2.24

2倍以上高速。現像だけでなく、作業しているときも高速であることは実感できました。旧母艦PCではLightroomでの作業すべてがモッサリ動作って感じでしたが、新母艦PCではかなり改善されたことが実感できました。

改善が実感できたとは言え、キビキビ・サクサク動作かというと、この程度では まだまだ不満なのよ。Adobe CCのソフトウェアはGPU最適化があまり進んでいないようなので、CPUの違いが速度の違いとなって現れると期待していたのよね。つまり、CINEBENCHのCPUスコアの違い(旧母艦PC=510cb、新母艦PC=1,752cb)くらいに。CINEBENCHのスコアは3.44倍の違いがあるのにって考えれば、ほら、不満に思えてきたでしょ ^^;

 

ベンチマーク⑤ 動画編集:Premiere Pro

次は動画編集。正確には「編集」ではなくて編集後の「エンコード」かな。使用したソフトウェアはAdobe Premiere Pro CCです。
SONY FDR-AX40で撮影した10分間の4K動画(3,840×2,160ピクセル, 30fps, 60Mbps)を編集した後、フルHD解像度(1,920×1,080, 30fps, 4Mbps)で出力したときの処理時間を比較しました。編集で使った補正は、露出補正、色補正、回転、スケール(切り抜き)です。

20180711_動画編集 編集作業の例

結果は次のとおり。

4K動画(10分間)をフルHD動画にエンコード

  • 旧母艦PC:7分47秒(1.00)
  • 新母艦PC:3分31秒(2.21

写真現像の場合とほぼ同じ結果となりました。編集作業はGPU支援が効くので旧母艦PCのときよりも快適でした。特に4K動画を編集する場合は、旧母艦PCではプロキシ機能を使わないと実用的ではなかったのですが、新母艦PCではプロキシ機能を使わなくても何とかなりそうでした。

ほぼ同じって、写真現像の場合が2.24倍、動画エンコードの場合は2.21倍。まったく同じと言っていい結果ですね。GPU最適化の程度、CPU依存の程度が両者で同じってことなんでしょうかね。それに、現像時・エンコード時にタスクマネージャで確認すると、どちらの場合もCPU使用率が高く、GPU使用率が低いんですよね。Adobeには、もっともっと

GPU最適化に 真剣に取り組んでほしい

 
ですよ、マジで (~_~;)

 

ベンチマーク⑥ 機械学習:TensorFlow, CIFAR-10

最後は機械学習。有名な機械学習ライブラリであるTensorFlowを使い、CIFAR-10(画像分類)を例題にしました。
機械学習ではトレーニング(学習)、テスト(評価)、実地適用の三つの段階がありますが、最初の 設計したモデルをトレーニングする段階で 最も計算機の能力が必要になります。CIFAR-10の画像分類はTensorFlowのチュートリアルにも掲載されているので、公開されているトレーニング段階のプログラムを使い、その実行時間を比較しました。

20180601_cifar10 (X470Taichi) (2)改 cifar10_train.pyの実行例

チュートリアルのプログラムでは100万ステップで学習させていたけど、ここでは実行時間を計るだけなので30万ステップに変更しました。
結果は次のとおり。

CIFAR-10のモデルの学習(30万ステップ)

  • 旧母艦PC(GPU版TensorFlow):124分・5,161examples/sec(1.00)
  • 新母艦PC(GPU版TensorFlow):79分・8,101examples/sec(1.57
  • 新母艦PC(CPU版TensorFlow):20時間・530examples/sec(0.10

うぅぅぅ、1.57倍高速… たったそれだけ? そりゃぁ~期待は大きかったですよ。だってね、ハイエンドの部類のグラフィックボードを買ったんだからさ (T_T)
まぁそれでも、GPUを使う意味はあるのよ。新母艦PCのGPUで79分かかった処理を 同じ新母艦PCのCPUにやらせたら、なんと20時間かかった。つまり、CPUの場合よりGPUの方が15倍高速ってことになるね。
思ったような性能向上はなかったとは言え、20時間の待ち時間が GPUを使えば79分になるわけだから、これはこれで嬉しい結果よね \(^o^)/

※注意事項: きのうの日記で触れたように、GPU版TensorFlowを使うために必要なCUDAライブラリを 新母艦PCにインストールできなかったので、裏技を使ってインストールしました。したがって、上記の新母艦PC(GPU版TensorFlow)に関する計算結果は、参考程度と考えるべきかもしれませんね m(._.)m

ゲームをやるなら新母艦PCのパワーをもっと感じられるかもしれないね。少し前の日記に書いたベンチマーク③(FINAL FANTASY XV)の結果を見れば明らか。ただなぁ、私はゲームをしないからなぁ (~_~;)

 

簡単なまとめ

私の使い方の場合、ザックリとですが 旧・新母艦PCの実行速度の違いは、CPU使用率が高ければ2倍程度GPU依存度が高ければ1.5倍程度だってことが分かりました。使い心地には総じて満足はしているんだけど、30万円投資してその程度なのかって考えちゃうのよね。
まぁ、それだけ待ち時間が減ったっていうことなんだけど、もうちょっと高い倍率だと もっと嬉しかったんだけどなぁ ^^;

そうそう、AppleはGPU用のグラフィックスAPI「Metal」で足回りをコツコツと・しっかりと固めてきているのよね。そういうところは流石だなぁって思うよ。
そんでね、もしAppleが採用するGPU(AMD Radeonシリーズ)でもと言うか、もしmacOSでもGPU版TensorFlowが使えるようになったら、5月に処分しちゃったmacOSマシンを再導入したいと思ってるのよ。まぁ、macOSでGPU版TensorFlowが使えるようになるには、まだまだ時間がかかりそうだけどね ^^;
macOSマシンにしろWindowsマシンにしろ、最近ではeGPUが熱くなりつつあるから、GPU界隈は また楽しみが増えたのよ (^^)v

 

 

さぁってと、きょうは久しぶりに私の鹿島アントラーズの試合があるんだよ。アウェーでの天皇杯3回戦(FC町田ゼルビア戦)なのよ。

日本代表組のCB二人が不在だし、2ヶ月間試合がなかったし、相手を格下だと思って舐めてかかると痛い目にあうよ! 引き締めて行きましょう!
攻守ともにガッチガチのガチでぶつかり、勝利を手にすることを期待しているよ (^^)v