Ryzen 1800X 、 Core-i7 7700K 可逆圧縮ベンチマーク

3月3日に発売された、いま話題のAMD社製CPUであるRyzen 7 1800Xと今年初めに発売された最新のIntel社製CPU Core i7-7700K(Kaby Lake)で可逆圧縮コーデッを使ったベンチマークテストを行いました。
シングルスレッド処理における各CPUの性能やSSE命令およびAVX2命令の挙動を見ていきます。


■テスト方法
動画ファイル Mystery of the Nile (こちらのサンプル動画1)を1280 x 720、YUY2の未圧縮に変換。
その動画ファイルをAMV4ビデオコーデックのDY3設定でエンコード、デコードした際の処理時間(FPS:一秒間に何フレーム処理できるか)を計測します。
両CPU共、動作クロックはRyzenの定格である3.6GHzになるよう設定。
メモリの動作クロックも両方とも2133MHzに設定し、なるべく同じ条件でテストします。


■テスト環境
PC1 Ryzen 1800X
OS  Microsoft Windows 10 Home 64-bit
CPU    AMD Ryzen 7 1800X 3.6GHz (100MHz x 36)
MB  MSI B350 TOMAHAWK
Memory  DDR4 16GB (8GB x 2 Dual channel) 2133MHz
備考  CPUは8コア、16スレッド、AVX2対応。動作クロックをBIOSにて全コア3.6GHz(定格)に設定しましたが
 アイドル状態になると3.1GHzまで低下します。テスト中はほぼ3.6GHzで動作しますが完全にクロックを固定できていません。


PC2 Kabylake 7700K
OS  Microsoft Windows 10 Home 64-bit
CPU  Intel(R) Core(TM) i7-7700K
 定格4.20GHz テスト時は3.6GHz (100MHz x 36)
MB  ASUS PRIME Z270-K
Memory  DDR4 16GB (8GB x 2 Dual channel) 2133MHz
備考  CPUは4コア、8スレッド、AVX2対応。動作クロックをRyzenと同じ全コア3.6GHzで固定し、省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。


Software
 AMV4 Video Codec Ver4.02
 CodecBench64.exe Ver1.01 自作のベンチマークソフト(非公開)



■結果
Ryzen 1800X 3.6GHz  HD画質 シングルスレッド処理
CodecMode ModuleEncode
FPS
 Decode
FPS
AMV4DY3AVX2.0643 704 
AMV4DY3SSE4.1643 880 


Kabylake Core i7 7700K 3.6GHz  HD画質 シングルスレッド処理
CodecMode ModuleEncode
FPS
 Decode
FPS
AMV4DY3AVX2.01106 1169 
AMV4DY3SSE4.1747 646 



■考察
AVX2を使ったKabylakeが突出した性能を発揮していることが解ります。ちなみにこのFPSが540を超えると 理論上4K動画を秒間60フレーム以上処理する能力があります。
一方、RyzenはAVX2とSSE4どちらでもエンコード処理はほぼ同じ性能となっています。AVX2命令を使っても性能が向上しないためこのテストではKabylakeと比べると少し見劣りする結果となりました。

PC Watchのこちらの記事によると

Ryzenの場合256bitのAVX命令は128bitのマイクロオペレーションコード2つに分解して処理するためAVX命令、SSE命令どちらを使っても単位時間あたりに処理できるデータ数(Byte数)に違いが出ないようです。

また、Ryzenのデコード処理に注目するとAVX2版よりSSE4版の方が2割以上良い結果が出ています。
さらに言えば、KabylakeのSSE4版よりもRyzenの方がいい結果となっています。

これは単にAVX命令とSSE命令による違いではなく、プログラムの実装方法による違いが影響していると思われます。
まだ調べていないので予想となりますが、AMV4ビデオコーデックは条件分岐処理を排除することで処理速度の向上を図っているけど、SSE4版のデコード処理だけは条件分岐処理を使って処理するようになっているので、そのことがRyzenでは良い結果につながっているのかもしれません。


・RyzenはAVX命令を使ってもSSE命令を使ってもパフォーマンスは変わらない(プログラムによっては、AVXを使うとパフォーマンスが低下する場合がある)
・Ryzenは分岐処理を使っても高いパフォーマンスを維持できるかもしれない(未検証)
・KabylakeのAVX命令は額面通りの圧倒的な性能を発揮する(ただしAVX命令を活かせるプログラムは皆無に近い)
・AVX命令を活かせないプログラムの場合にどちらが有利かはプログラム次第、IPCは互角と言って良いのではないでしょうか。ただし、空冷で簡単に5GHzを達成するので動作クロックを考慮するとやはり1コアあたりの性能はKabylakeに軍配が上がることが多いと思います。


最後に、RyzenでAMV4ビデオコーデックを使う場合はSSE4を使うように設定した方が良いです(自動設定だとAVX2を使ってしまいます)。AMV4ビデオコーデック以外でもAVX命令を使うかどうか設定できるプログラムの場合にAVXを使わないように設定することで性能が向上する場合があるようなので、Ryzenにおける豆知識かもしれません。

AMV4setting.png


テーマ : PCパーツ     ジャンル : コンピュータ

AVX2対応 AMVデコーダー デモ版の追試

以前行った「3倍高速 AVX2対応 AMVデコーダー デモ版」のテスト結果がさらに前に行った古いPCによるテスト結果より悪かったため、Haswellの性能ってそんなものなのかなと調査しました。

 古いPC Win7
Ivy Bridge
i5-3470S CPU @ 2.90GHz
新しいPC Win8
Haswell
i7-4770 CPU @ 3.40GHz
AMV2MT Ver2.20i
32bit
HDデコード処理時間
Y2:標準可逆設定
2.47 ms (404 fps)2.59 ms (384 fps)
※ 新しいPCであるHaswellの方が動作クロックが17%高いにも関わらず、わずかですが悪い結果となっています。



なかなか原因はわからないのですが、一つ影響が出たのがOSの電源オプションでした。
電源オプション 

いままでCPUのパフォーマンスを安定させるため「高パフォーマンス」を選択してテストしてきましたが、新しいPCでは「高パフォーマンス」を選択するとPC全体のパフォーマンスが低下します(おそらくテストに使ったPC固有の問題)。「バランス」を選択すると本来の性能と思われる結果が出ましたので「バランス」に設定して再テストした結果を掲載します。


1.ベンチマークテスト
1.1.テスト環境


パソコンのスペック
OSWindows8 x64 Professional
CPUIntel(R) Core(TM) i7-4770 CPU @ 3.40GHz Haswell
MBASRock H87 Performance (Intel H87)
MemoryDDR3 1600 16GB(8GBx2 Dual Cannel)read=25.4GB/s write=14.8GB/s
SoftwareDecBench86.exe Ver1.01
DecBench64.exe Ver1.01
備考CPUは4コア、8スレッド、HTT対応、AVX2対応。動作クロックを3.4GHz(定格)で固定し、
省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。

テスト用動画(動きの激しい動画)
タイトルMystery of the Nile
情報1280*720、2082frames、1分26秒
備考AviUtlと各コーデックを使ってエンコードしてテスト用の動画ファイルを作成



1.2.結果
AMV2MT Y2(標準可逆) 1コア、1スレッド  デコードテスト
コーデック高パフォーマンスバランス高パフォーマンスに対する
バランス設定の性能
時間FPS時間FPS
32bit2.59 ms384 fps1.90 ms524 fps136%
64bit2.23 ms446 fps1.68 ms594 fps133%
64bit AVX20.88 ms1131 fps0.66 ms1515 fps133%
※ FPSは処理時間をもとに算出した値です。数値が大きいほど優れています。
※ 高パフォーマンスは前回のテスト結果をそのまま記載しています。バランスは今回テストした結果です。

電源オプションを「バランス」にしたことで「高パフォーマンス」にたいし全体的に約33%ほど良い結果がでました。
Ivy Bridgeの32bitのテスト結果2.47 ms (404 fps)にたいしても、Haswellのバランス設定では1.90ms(524 fps)と約29%良い結果です。これは動作クロックの増加分17%を超えるのでHaswell自体がIvy Bridgeより10%程度高性能と言ったところでしょうか。

AMVビデオコーデックにおいては後発のHaswellがそれ以前のCPUより遅くなるということは無いようで安心しました。


 
 
あまラボへようこそ
このブログでは自作ソフトの最新情報やtips、PC動画に関する話題を掲載していきます。各記事へは下にあるカテゴリからアクセスして下さい。

ファイルのダウンロードはホームページの方でお願い致します。

質問・要望・不具合報告はこちら
アマレコTV
アマミキ!
アマレココ
アマレコ・ライト
ファンタジーリモート
AMVコーデック



ホームページ
カテゴリ
最新コメント
カレンダー
10 | 2017/11 | 12
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 - -
最新記事
最新トラックバック
ブログ内タグ

アマレコTV ビデオキャプチャ AMVコーデック アマレココ アマミキ! コーデック SC500 動画配信 ファンタジーリモート アマレコライト プラグイン AMV4 SC512 デスクトップキャプチャ AVX2 ライブ機能 リモートソフト FAQ 質問コーナー HDキャプチャ DirectShow ニコニコ動画 レゴ 組み換え LEGO 解説動画 4K 可変再生速度 遅延 XL2420T GV-USB2 倍速液晶 120Hz アマステ 液晶モニター デインターレース Pro ベンチマーク Intensity PS4 MonsterX3A AMV2MT 32ZP2 31024 Shadow Play RGBキャプチャ AVX RDT233WX-Z GV-USB RYZEN Alternate designs 31006 SD-USB2CAP4 XCAPTURE-1 ffmpeg VideoKeeper2 キャプチャーツール プレビュー Livetube DirectShowFilter IntensityPro AtomでHDキャプチャ イベント 擬似NTSCキャプチャ シンクライアント SD-USB2CUP4 REGZA ハイパースレッディングテクノロジー HT 31021 MPC インストール QSV NVEnc OBS フィギュア 音ズレ SSE SKnet GV-USB3 Kabelake XCapture-1 録画 オーバーレイ HDMI HDCP 32ZP32 額縁遅延 キャプチャカード 液晶テレビ 倍速駆動 リプレイ機能 モノステ ZP3 倍速補完処理 MP3 Haswell 電源オプション LameACM 音遅延 ゲームスムーズモード MonsterXU3.0R DC-HD1 

ブログ内検索
月別アーカイブ
アマレココに関するリンク
お世話になっているソフトのリンク
RSSリンクの表示
管理画面
  • 管理画面