きょうは、きのうの日記にチョロっと書いたけど、ベンチマークの残り三つ(④写真現像・⑤動画編集・⑥機械学習)についてです。
最初の三つはド定番のベンチマークソフトを使いました。①CINEBENCH、②CrystalDiskMark、③FINAL FANTASY XVね ^^; 少し前の日記になるけど、こちらからどうぞ。
koboLog: ブログを更新しました → https://t.co/iIKFSXZyU0
『Ryzen 7 2700X PC、セットアップ完了 ―― ベンチマークもちょっとだけ』
コツコツ・ゆっくりと作業してきたけど、やっと新Windows母艦PCの組立からセットアップまで完了したよ。無駄に光ってるんだよ… って話です。#AMD #Ryzen #X470
— 小久保 裕 (@kokubo164) 2018年5月27日
きょうの三つはベンチマークソフトを使うのではなく、私が仕事や趣味でよく使うソフトウェアにおける 例題の実行時間を測定するってもの。旧母艦PCと新母艦PCでの実行時間を比較しようってわけです ^^;
旧・新母艦PCのスペックの違いは次のとおり。
ベンチマーク④ 写真現像:Lightroom Classic
まずは写真現像。使用したソフトウェアはAdobe Lightroom Classic CCです。
Canon EOS 7D Mark IIで撮影した写真のRAW画像データ(5,472×3,468≒2,000万画素, 1枚約22MB)1,000枚に同一の補正(部分的な露出補正、色補正、部分的なぼかし、回転、切り抜き)を適用し、出力しました。この補正処理のビフォー・アフターはこんな感じです(左が元画像、右が補正適用後)。
結果は次のとおり。括弧内の数値は旧母艦PCに対する処理速度の比で、何倍高速かを表しています。
1,000枚のRAW画像の現像
- 旧母艦PC:70分15秒(1.00)
- 新母艦PC:31分25秒(2.24)
2倍以上高速。現像だけでなく、作業しているときも高速であることは実感できました。旧母艦PCではLightroomでの作業すべてがモッサリ動作って感じでしたが、新母艦PCではかなり改善されたことが実感できました。
改善が実感できたとは言え、キビキビ・サクサク動作かというと、この程度では まだまだ不満なのよ。Adobe CCのソフトウェアはGPU最適化があまり進んでいないようなので、CPUの違いが速度の違いとなって現れると期待していたのよね。つまり、CINEBENCHのCPUスコアの違い(旧母艦PC=510cb、新母艦PC=1,752cb)くらいに。CINEBENCHのスコアは3.44倍の違いがあるのにって考えれば、ほら、不満に思えてきたでしょ ^^;
ベンチマーク⑤ 動画編集:Premiere Pro
次は動画編集。正確には「編集」ではなくて編集後の「エンコード」かな。使用したソフトウェアはAdobe Premiere Pro CCです。
SONY FDR-AX40で撮影した10分間の4K動画(3,840×2,160ピクセル, 30fps, 60Mbps)を編集した後、フルHD解像度(1,920×1,080, 30fps, 4Mbps)で出力したときの処理時間を比較しました。編集で使った補正は、露出補正、色補正、回転、スケール(切り抜き)です。
結果は次のとおり。
4K動画(10分間)をフルHD動画にエンコード
- 旧母艦PC:7分47秒(1.00)
- 新母艦PC:3分31秒(2.21)
写真現像の場合とほぼ同じ結果となりました。編集作業はGPU支援が効くので旧母艦PCのときよりも快適でした。特に4K動画を編集する場合は、旧母艦PCではプロキシ機能を使わないと実用的ではなかったのですが、新母艦PCではプロキシ機能を使わなくても何とかなりそうでした。
ほぼ同じって、写真現像の場合が2.24倍、動画エンコードの場合は2.21倍。まったく同じと言っていい結果ですね。GPU最適化の程度、CPU依存の程度が両者で同じってことなんでしょうかね。それに、現像時・エンコード時にタスクマネージャで確認すると、どちらの場合もCPU使用率が高く、GPU使用率が低いんですよね。Adobeには、もっともっと
GPU最適化に 真剣に取り組んでほしい
ですよ、マジで (~_~;)
ベンチマーク⑥ 機械学習:TensorFlow, CIFAR-10
最後は機械学習。有名な機械学習ライブラリであるTensorFlowを使い、CIFAR-10(画像分類)を例題にしました。
機械学習ではトレーニング(学習)、テスト(評価)、実地適用の三つの段階がありますが、最初の 設計したモデルをトレーニングする段階で 最も計算機の能力が必要になります。CIFAR-10の画像分類はTensorFlowのチュートリアルにも掲載されているので、公開されているトレーニング段階のプログラムを使い、その実行時間を比較しました。
チュートリアルのプログラムでは100万ステップで学習させていたけど、ここでは実行時間を計るだけなので30万ステップに変更しました。
結果は次のとおり。
CIFAR-10のモデルの学習(30万ステップ)
- 旧母艦PC(GPU版TensorFlow):124分・5,161examples/sec(1.00)
- 新母艦PC(GPU版TensorFlow):79分・8,101examples/sec(1.57)※
- 新母艦PC(CPU版TensorFlow):20時間・530examples/sec(0.10)
うぅぅぅ、1.57倍高速… たったそれだけ? そりゃぁ~期待は大きかったですよ。だってね、ハイエンドの部類のグラフィックボードを買ったんだからさ (T_T)
まぁそれでも、GPUを使う意味はあるのよ。新母艦PCのGPUで79分かかった処理を 同じ新母艦PCのCPUにやらせたら、なんと20時間かかった。つまり、CPUの場合よりGPUの方が15倍高速ってことになるね。
思ったような性能向上はなかったとは言え、20時間の待ち時間が GPUを使えば79分になるわけだから、これはこれで嬉しい結果よね \(^o^)/
※注意事項: きのうの日記で触れたように、GPU版TensorFlowを使うために必要なCUDAライブラリを 新母艦PCにインストールできなかったので、裏技を使ってインストールしました。したがって、上記の新母艦PC(GPU版TensorFlow)に関する計算結果は、参考程度と考えるべきかもしれませんね m(._.)m
ゲームをやるなら新母艦PCのパワーをもっと感じられるかもしれないね。少し前の日記に書いたベンチマーク③(FINAL FANTASY XV)の結果を見れば明らか。ただなぁ、私はゲームをしないからなぁ (~_~;)
簡単なまとめ
私の使い方の場合、ザックリとですが 旧・新母艦PCの実行速度の違いは、CPU使用率が高ければ2倍程度、GPU依存度が高ければ1.5倍程度だってことが分かりました。使い心地には総じて満足はしているんだけど、30万円投資してその程度なのかって考えちゃうのよね。
まぁ、それだけ待ち時間が減ったっていうことなんだけど、もうちょっと高い倍率だと もっと嬉しかったんだけどなぁ ^^;
そうそう、AppleはGPU用のグラフィックスAPI「Metal」で足回りをコツコツと・しっかりと固めてきているのよね。そういうところは流石だなぁって思うよ。
そんでね、もしAppleが採用するGPU(AMD Radeonシリーズ)でもと言うか、もしmacOSでもGPU版TensorFlowが使えるようになったら、5月に処分しちゃったmacOSマシンを再導入したいと思ってるのよ。まぁ、macOSでGPU版TensorFlowが使えるようになるには、まだまだ時間がかかりそうだけどね ^^;
macOSマシンにしろWindowsマシンにしろ、最近ではeGPUが熱くなりつつあるから、GPU界隈は また楽しみが増えたのよ (^^)v
さぁってと、きょうは久しぶりに私の鹿島アントラーズの試合があるんだよ。アウェーでの天皇杯3回戦(FC町田ゼルビア戦)なのよ。
日本代表組のCB二人が不在だし、2ヶ月間試合がなかったし、相手を格下だと思って舐めてかかると痛い目にあうよ! 引き締めて行きましょう!
攻守ともにガッチガチのガチでぶつかり、勝利を手にすることを期待しているよ (^^)v
【7/11 町田戦】
GK
曽ケ端準
DF
内田篤人 西大伍 犬飼智也 安西幸輝
MF
三竿健斗 永木亮太 遠藤康 安部裕葵
FW
鈴木優磨 土居聖真サブ:
GK
川俣慎一郎
DF
山本脩斗 町田浩樹
MF
中村充孝 田中稔也
FW
金崎夢生 山口一真 #antlers #kashima速報は:https://t.co/gzHYC5NRRp pic.twitter.com/vhnfTIGSrY
— 鹿島アントラーズ 公式 (@atlrs_official) 2018年7月11日
◇