2018年7月11日

きょうは、きのうの日記にチョロっと書いたけど、ベンチマークの残り三つ（④写真現像・⑤動画編集・⑥機械学習）についてです。
最初の三つはド定番のベンチマークソフトを使いました。①CINEBENCH、②CrystalDiskMark、③FINAL FANTASY XVね ^^;　少し前の日記になるけど、こちらからどうぞ。

koboLog: ブログを更新しました → https://t.co/iIKFSXZyU0

『Ryzen 7 2700X PC、セットアップ完了 ―― ベンチマークもちょっとだけ』

コツコツ・ゆっくりと作業してきたけど、やっと新Windows母艦PCの組立からセットアップまで完了したよ。無駄に光ってるんだよ… って話です。#AMD #Ryzen #X470

— 小久保　裕 (@kokubo164) 2018年5月27日

　
きょうの三つはベンチマークソフトを使うのではなく、私が仕事や趣味でよく使うソフトウェアにおける例題の実行時間を測定するってもの。旧母艦PCと新母艦PCでの実行時間を比較しようってわけです ^^;

旧・新母艦PCのスペックの違いは次のとおり。

　スペック比較表

ベンチマーク④　写真現像：Lightroom Classic

まずは写真現像。使用したソフトウェアはAdobe Lightroom Classic CCです。
Canon EOS 7D Mark IIで撮影した写真のRAW画像データ（5,472×3,468≒2,000万画素, 1枚約22MB）1,000枚に同一の補正（部分的な露出補正、色補正、部分的なぼかし、回転、切り抜き）を適用し、出力しました。この補正処理のビフォー・アフターはこんな感じです（左が元画像、右が補正適用後）。

　補正処理のビフォー・アフター

結果は次のとおり。括弧内の数値は旧母艦PCに対する処理速度の比で、何倍高速かを表しています。

1,000枚のRAW画像の現像

旧母艦PC：70分15秒（1.00）
新母艦PC：31分25秒（2.24）

2倍以上高速。現像だけでなく、作業しているときも高速であることは実感できました。旧母艦PCではLightroomでの作業すべてがモッサリ動作って感じでしたが、新母艦PCではかなり改善されたことが実感できました。

改善が実感できたとは言え、キビキビ・サクサク動作かというと、この程度ではまだまだ不満なのよ。Adobe CCのソフトウェアはGPU最適化があまり進んでいないようなので、CPUの違いが速度の違いとなって現れると期待していたのよね。つまり、CINEBENCHのCPUスコアの違い（旧母艦PC＝510cb、新母艦PC＝1,752cb）くらいに。CINEBENCHのスコアは3.44倍の違いがあるのにって考えれば、ほら、不満に思えてきたでしょ ^^;

ベンチマーク⑤　動画編集：Premiere Pro

次は動画編集。正確には「編集」ではなくて編集後の「エンコード」かな。使用したソフトウェアはAdobe Premiere Pro CCです。
SONY FDR-AX40で撮影した10分間の4K動画（3,840×2,160ピクセル, 30fps, 60Mbps）を編集した後、フルHD解像度（1,920×1,080, 30fps, 4Mbps）で出力したときの処理時間を比較しました。編集で使った補正は、露出補正、色補正、回転、スケール（切り抜き）です。

　編集作業の例

結果は次のとおり。

4K動画（10分間）をフルHD動画にエンコード

旧母艦PC：7分47秒（1.00）
新母艦PC：3分31秒（2.21）

写真現像の場合とほぼ同じ結果となりました。編集作業はGPU支援が効くので旧母艦PCのときよりも快適でした。特に4K動画を編集する場合は、旧母艦PCではプロキシ機能を使わないと実用的ではなかったのですが、新母艦PCではプロキシ機能を使わなくても何とかなりそうでした。

ほぼ同じって、写真現像の場合が2.24倍、動画エンコードの場合は2.21倍。まったく同じと言っていい結果ですね。GPU最適化の程度、CPU依存の程度が両者で同じってことなんでしょうかね。それに、現像時・エンコード時にタスクマネージャで確認すると、どちらの場合もCPU使用率が高く、GPU使用率が低いんですよね。Adobeには、もっともっと

GPU最適化に真剣に取り組んでほしい

　
ですよ、マジで (~_~;)

ベンチマーク⑥　機械学習：TensorFlow, CIFAR-10

最後は機械学習。有名な機械学習ライブラリであるTensorFlowを使い、CIFAR-10（画像分類）を例題にしました。
機械学習ではトレーニング（学習）、テスト（評価）、実地適用の三つの段階がありますが、最初の設計したモデルをトレーニングする段階で最も計算機の能力が必要になります。CIFAR-10の画像分類はTensorFlowのチュートリアルにも掲載されているので、公開されているトレーニング段階のプログラムを使い、その実行時間を比較しました。

　cifar10_train.pyの実行例

チュートリアルのプログラムでは100万ステップで学習させていたけど、ここでは実行時間を計るだけなので30万ステップに変更しました。
結果は次のとおり。

CIFAR-10のモデルの学習（30万ステップ）

旧母艦PC（GPU版TensorFlow）：124分・5,161examples/sec（1.00）
新母艦PC（GPU版TensorFlow）：79分・8,101examples/sec（1.57）※
新母艦PC（CPU版TensorFlow）：20時間・530examples/sec（0.10）

うぅぅぅ、1.57倍高速… たったそれだけ？　そりゃぁ～期待は大きかったですよ。だってね、ハイエンドの部類のグラフィックボードを買ったんだからさ (T_T)
まぁそれでも、GPUを使う意味はあるのよ。新母艦PCのGPUで79分かかった処理を同じ新母艦PCのCPUにやらせたら、なんと20時間かかった。つまり、CPUの場合よりGPUの方が15倍高速ってことになるね。
思ったような性能向上はなかったとは言え、20時間の待ち時間が GPUを使えば79分になるわけだから、これはこれで嬉しい結果よね＼(^o^)／

※注意事項：　きのうの日記で触れたように、GPU版TensorFlowを使うために必要なCUDAライブラリを新母艦PCにインストールできなかったので、裏技を使ってインストールしました。したがって、上記の新母艦PC（GPU版TensorFlow）に関する計算結果は、参考程度と考えるべきかもしれませんね m(._.)m

ゲームをやるなら新母艦PCのパワーをもっと感じられるかもしれないね。少し前の日記に書いたベンチマーク③（FINAL FANTASY XV）の結果を見れば明らか。ただなぁ、私はゲームをしないからなぁ (~_~;)

簡単なまとめ

私の使い方の場合、ザックリとですが旧・新母艦PCの実行速度の違いは、CPU使用率が高ければ2倍程度、GPU依存度が高ければ1.5倍程度だってことが分かりました。使い心地には総じて満足はしているんだけど、30万円投資してその程度なのかって考えちゃうのよね。
まぁ、それだけ待ち時間が減ったっていうことなんだけど、もうちょっと高い倍率だともっと嬉しかったんだけどなぁ ^^;

そうそう、AppleはGPU用のグラフィックスAPI「Metal」で足回りをコツコツと・しっかりと固めてきているのよね。そういうところは流石だなぁって思うよ。
そんでね、もしAppleが採用するGPU（AMD Radeonシリーズ）でもと言うか、もしmacOSでもGPU版TensorFlowが使えるようになったら、5月に処分しちゃったmacOSマシンを再導入したいと思ってるのよ。まぁ、macOSでGPU版TensorFlowが使えるようになるには、まだまだ時間がかかりそうだけどね ^^;
macOSマシンにしろWindowsマシンにしろ、最近ではeGPUが熱くなりつつあるから、GPU界隈はまた楽しみが増えたのよ (^^)v

さぁってと、きょうは久しぶりに私の鹿島アントラーズの試合があるんだよ。アウェーでの天皇杯3回戦（FC町田ゼルビア戦）なのよ。

日本代表組のCB二人が不在だし、2ヶ月間試合がなかったし、相手を格下だと思って舐めてかかると痛い目にあうよ！引き締めて行きましょう！
攻守ともにガッチガチのガチでぶつかり、勝利を手にすることを期待しているよ (^^)ｖ

【7/11 町田戦】
GK
曽ケ端準
DF
内田篤人西大伍犬飼智也安西幸輝
MF
三竿健斗永木亮太遠藤康安部裕葵
FW
鈴木優磨土居聖真

サブ：
GK
川俣慎一郎
DF
山本脩斗町田浩樹
MF
中村充孝田中稔也
FW
金崎夢生山口一真 #antlers #kashima

速報は：https://t.co/gzHYC5NRRp pic.twitter.com/vhnfTIGSrY

— 鹿島アントラーズ　公式 (@atlrs_official) 2018年7月11日

◇

日: 2018年7月11日

Ryzen 7 2700X PC ―― ベンチマーク（その2）

ベンチマーク④　写真現像：Lightroom Classic

ベンチマーク⑤　動画編集：Premiere Pro

GPU最適化に真剣に取り組んでほしい

ベンチマーク⑥　機械学習：TensorFlow, CIFAR-10

簡単なまとめ

2018年7月
月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

ベンチマーク④ 写真現像：Lightroom Classic

ベンチマーク⑤ 動画編集：Premiere Pro

GPU最適化に 真剣に取り組んでほしい

ベンチマーク⑥ 機械学習：TensorFlow, CIFAR-10

簡単なまとめ

ベンチマーク④　写真現像：Lightroom Classic

ベンチマーク⑤　動画編集：Premiere Pro

GPU最適化に真剣に取り組んでほしい

ベンチマーク⑥　機械学習：TensorFlow, CIFAR-10