fc2ブログ
 

Ryzen 1800X 、 Core-i7 7700K 可逆圧縮ベンチマーク

3月3日に発売された、いま話題のAMD社製CPUであるRyzen 7 1800Xと今年初めに発売された最新のIntel社製CPU Core i7-7700K(Kaby Lake)で可逆圧縮コーデッを使ったベンチマークテストを行いました。
シングルスレッド処理における各CPUの性能やSSE命令およびAVX2命令の挙動を見ていきます。


■テスト方法
動画ファイル Mystery of the Nile (こちらのサンプル動画1)を1280 x 720、YUY2の未圧縮に変換。
その動画ファイルをAMV4ビデオコーデックのDY3設定でエンコード、デコードした際の処理時間(FPS:一秒間に何フレーム処理できるか)を計測します。
両CPU共、動作クロックはRyzenの定格である3.6GHzになるよう設定。
メモリの動作クロックも両方とも2133MHzに設定し、なるべく同じ条件でテストします。


■テスト環境
PC1 Ryzen 1800X
OS  Microsoft Windows 10 Home 64-bit
CPU    AMD Ryzen 7 1800X 3.6GHz (100MHz x 36)
MB  MSI B350 TOMAHAWK
Memory  DDR4 16GB (8GB x 2 Dual channel) 2133MHz
備考  CPUは8コア、16スレッド、AVX2対応。動作クロックをBIOSにて全コア3.6GHz(定格)に設定しましたが
 アイドル状態になると3.1GHzまで低下します。テスト中はほぼ3.6GHzで動作しますが完全にクロックを固定できていません。


PC2 Kabylake 7700K
OS  Microsoft Windows 10 Home 64-bit
CPU  Intel(R) Core(TM) i7-7700K
 定格4.20GHz テスト時は3.6GHz (100MHz x 36)
MB  ASUS PRIME Z270-K
Memory  DDR4 16GB (8GB x 2 Dual channel) 2133MHz
備考  CPUは4コア、8スレッド、AVX2対応。動作クロックをRyzenと同じ全コア3.6GHzで固定し、省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。


Software
 AMV4 Video Codec Ver4.02
 CodecBench64.exe Ver1.01 自作のベンチマークソフト(非公開)



■結果
Ryzen 1800X 3.6GHz  HD画質 シングルスレッド処理
CodecMode ModuleEncode
FPS
 Decode
FPS
AMV4DY3AVX2.0643 704 
AMV4DY3SSE4.1643 880 


Kabylake Core i7 7700K 3.6GHz  HD画質 シングルスレッド処理
CodecMode ModuleEncode
FPS
 Decode
FPS
AMV4DY3AVX2.01106 1169 
AMV4DY3SSE4.1747 646 



■考察
AVX2を使ったKabylakeが突出した性能を発揮していることが解ります。ちなみにこのFPSが540を超えると 理論上4K動画を秒間60フレーム以上処理する能力があります。
一方、RyzenはAVX2とSSE4どちらでもエンコード処理はほぼ同じ性能となっています。AVX2命令を使っても性能が向上しないためこのテストではKabylakeと比べると少し見劣りする結果となりました。

PC Watchのこちらの記事によると

Ryzenの場合256bitのAVX命令は128bitのマイクロオペレーションコード2つに分解して処理するためAVX命令、SSE命令どちらを使っても単位時間あたりに処理できるデータ数(Byte数)に違いが出ないようです。

また、Ryzenのデコード処理に注目するとAVX2版よりSSE4版の方が2割以上良い結果が出ています。
さらに言えば、KabylakeのSSE4版よりもRyzenの方がいい結果となっています。

これは単にAVX命令とSSE命令による違いではなく、プログラムの実装方法による違いが影響していると思われます。
まだ調べていないので予想となりますが、AMV4ビデオコーデックは条件分岐処理を排除することで処理速度の向上を図っているけど、SSE4版のデコード処理だけは条件分岐処理を使って処理するようになっているので、そのことがRyzenでは良い結果につながっているのかもしれません。


・RyzenはAVX命令を使ってもSSE命令を使ってもパフォーマンスは変わらない(プログラムによっては、AVXを使うとパフォーマンスが低下する場合がある)
・Ryzenは分岐処理を使っても高いパフォーマンスを維持できるかもしれない(未検証)
・KabylakeのAVX命令は額面通りの圧倒的な性能を発揮する(ただしAVX命令を活かせるプログラムは皆無に近い)
・AVX命令を活かせないプログラムの場合にどちらが有利かはプログラム次第、IPCは互角と言って良いのではないでしょうか。ただし、空冷で簡単に5GHzを達成するので動作クロックを考慮するとやはり1コアあたりの性能はKabylakeに軍配が上がることが多いと思います。


最後に、RyzenでAMV4ビデオコーデックを使う場合はSSE4を使うように設定した方が良いです(自動設定だとAVX2を使ってしまいます)。AMV4ビデオコーデック以外でもAVX命令を使うかどうか設定できるプログラムの場合にAVXを使わないように設定することで性能が向上する場合があるようなので、Ryzenにおける豆知識かもしれません。

AMV4setting.png


テーマ : PCパーツ     ジャンル : コンピュータ

AVX2対応 AMVデコーダー デモ版の追試

以前行った「3倍高速 AVX2対応 AMVデコーダー デモ版」のテスト結果がさらに前に行った古いPCによるテスト結果より悪かったため、Haswellの性能ってそんなものなのかなと調査しました。

 古いPC Win7
Ivy Bridge
i5-3470S CPU @ 2.90GHz
新しいPC Win8
Haswell
i7-4770 CPU @ 3.40GHz
AMV2MT Ver2.20i
32bit
HDデコード処理時間
Y2:標準可逆設定
2.47 ms (404 fps)2.59 ms (384 fps)
※ 新しいPCであるHaswellの方が動作クロックが17%高いにも関わらず、わずかですが悪い結果となっています。



なかなか原因はわからないのですが、一つ影響が出たのがOSの電源オプションでした。
電源オプション 

いままでCPUのパフォーマンスを安定させるため「高パフォーマンス」を選択してテストしてきましたが、新しいPCでは「高パフォーマンス」を選択するとPC全体のパフォーマンスが低下します(おそらくテストに使ったPC固有の問題)。「バランス」を選択すると本来の性能と思われる結果が出ましたので「バランス」に設定して再テストした結果を掲載します。


1.ベンチマークテスト
1.1.テスト環境


パソコンのスペック
OSWindows8 x64 Professional
CPUIntel(R) Core(TM) i7-4770 CPU @ 3.40GHz Haswell
MBASRock H87 Performance (Intel H87)
MemoryDDR3 1600 16GB(8GBx2 Dual Cannel)read=25.4GB/s write=14.8GB/s
SoftwareDecBench86.exe Ver1.01
DecBench64.exe Ver1.01
備考CPUは4コア、8スレッド、HTT対応、AVX2対応。動作クロックを3.4GHz(定格)で固定し、
省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。

テスト用動画(動きの激しい動画)
タイトルMystery of the Nile
情報1280*720、2082frames、1分26秒
備考AviUtlと各コーデックを使ってエンコードしてテスト用の動画ファイルを作成



1.2.結果
AMV2MT Y2(標準可逆) 1コア、1スレッド  デコードテスト
コーデック高パフォーマンスバランス高パフォーマンスに対する
バランス設定の性能
時間FPS時間FPS
32bit2.59 ms384 fps1.90 ms524 fps136%
64bit2.23 ms446 fps1.68 ms594 fps133%
64bit AVX20.88 ms1131 fps0.66 ms1515 fps133%
※ FPSは処理時間をもとに算出した値です。数値が大きいほど優れています。
※ 高パフォーマンスは前回のテスト結果をそのまま記載しています。バランスは今回テストした結果です。

電源オプションを「バランス」にしたことで「高パフォーマンス」にたいし全体的に約33%ほど良い結果がでました。
Ivy Bridgeの32bitのテスト結果2.47 ms (404 fps)にたいしても、Haswellのバランス設定では1.90ms(524 fps)と約29%良い結果です。これは動作クロックの増加分17%を超えるのでHaswell自体がIvy Bridgeより10%程度高性能と言ったところでしょうか。

AMVビデオコーデックにおいては後発のHaswellがそれ以前のCPUより遅くなるということは無いようで安心しました。


 
 
あまラボへようこそ
このブログでは自作ソフトの最新情報やtips、PC動画に関する話題を掲載していきます。各記事へは下にあるカテゴリからアクセスして下さい。

ファイルのダウンロードはホームページの方でお願い致します。

質問・要望・不具合報告はこちら
アマレコTV
アマミキ!
アマレココ
アマレコ・ライト
ファンタジーリモート
AMVコーデック



ホームページ
カテゴリ
最新コメント
カレンダー
04 | 2023/05 | 06
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -
最新記事
最新トラックバック
ブログ内タグ

アマレコTV ビデオキャプチャ アマレコVR AMVコーデック Oculus Quest アマレココ アマミキ! コーデック gQuest SC500 動画配信 Pico GO ファンタジーリモート 4K アマレコライト プラグイン G2 AMV4 oculus Unity SC512 ライブ機能 パススルー機能 デスクトップキャプチャ AVX2 Passthrough FAQ リモートソフト 質問コーナー ニコニコ動画 HDキャプチャ DirectShow 120Hz 背景透過 遅延 可変再生速度 レゴ 解説動画 Meta 組み換え VR LEGO XL2420T GV-USB2 2 アセット機能 液晶モニター 倍速液晶 デインターレース PS4 ベンチマーク アマステ AMV2MT Asset Intensity Pico4 MetaQuest Pro VRonVR MonsterX3A designs VideoKeeper2 AVX Alternate XCAPTURE-1 SD-USB2CAP4 GV-USB インストール RDT233WX-Z 32ZP2 31006 ffmpeg WindowsMR Rift 画像処理 31024 T2 60fps RGBキャプチャ UtVideo Shadow Play RYZEN 電源オプション HDCP Haswell HDMI 音遅延 QSV MonsterXU3.0R LameACM MP3 31021 フィギュア 音ズレ 録画 ゲームスムーズモード HT OBS MPC ハイパースレッディングテクノロジー NVEnc 液晶テレビ DirectShowFilter プレビュー 擬似NTSCキャプチャ SD-USB2CUP4 Livetube AtomでHDキャプチャ キャプチャーツール シンクライアント イベント IntensityPro DC-HD1 額縁遅延 REGZA ZP3 32ZP32 オーバーレイ リプレイ機能 モノステ 倍速駆動 倍速補完処理 キャプチャカード Robust Video Matting API APIパススルー機能 60Hz 検証 passthrough python pytorch ハンドジェスチャー パカラーススルー機能 AssetBundle 2.0 Tracking ファイルマネージャプラス SkyBox Hand AMPlayer 新プレイヤー機能 GPU使用率 LAVFilters Preferred 可逆圧縮 GV-USB3 Kabelake SSE SKnet Filter Tweaker Windows 90Hz 新アマレコVR MR VRコントローラー SteamVR VR動画 フレーム間圧縮 XCapture-1 

ブログ内検索
月別アーカイブ
アマレココに関するリンク
お世話になっているソフトのリンク
RSSリンクの表示
管理画面
  • 管理画面