AMV4ビデオコーデック ベンチマーク暫定版 もはや反則AVX2編
テスト条件は前回のSSE編と同じですのでパソコンのスペック以外は以前の記事を参照してください。
AMV4ビデオコーデック ベンチマーク暫定版 SSE編
なお、AMV4ビデオコーデックについては開発途中のバージョンによるテストですので、
最終的なバージョンと異なる場合があります。
完成後にもう一度ベンチマークをやり直し結果を掲載しますのでそちらも確認してください。
【ベンチマーク条件】
パソコンのスペック以外はSSE編と同じ
AMV4ビデオコーデック ベンチマーク暫定版 SSE編
OS | Windows8 x64 Professional |
CPU | Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz Haswell |
MB | ASRock H87 Performance (Intel H87) |
Memory | DDR3 1600 16GB(8GBx2 Dual Cannel)read=25.4GB/s write=14.8GB/s |
Software | Video Codec Test 2.0.0 |
備考 | CPUは4コア、8スレッド、HTT対応、AVX2対応。動作クロックを3.4GHz(定格)で固定し、 省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。 |
【ベンチマーク結果】
レベル | エンコード | デコード | 圧縮効果 | 備考 | |||
時間 | FPS | 時間 | FPS | ||||
AMV2MT 32bit SSE2 | Y1 | 0.60 ms | 1648 fps | 0.80 ms | 1238 fps | 1.15 | YUY2可逆 |
Y2 | 1.24 ms | 801 fps | 1.90 ms | 523 fps | 2.09 | YUY2可逆 | |
Y3 | 1.81 ms | 551 fps | 2.64 ms | 377 fps | 2.78 | YUY2非可逆 | |
Y4 | 3.73 ms | 267 fps | 4.37 ms | 228 fps | 3.67 | YUY2非可逆 二次圧縮あり |
レベル | エンコード | デコード | 圧縮効果 | 備考 | |||
時間 | FPS | 時間 | FPS | ||||
AMV4 32bit SSE4.1 | DY2 | 1.09 ms | 910 fps | 1.17 ms | 850 fps | 2.52 | YUY2可逆 |
DY3 | 1.84 ms | 541 fps | 1.84 ms | 542 fps | 3.09 | YUY2可逆 二次圧縮あり | |
AMV4 64bit SSE4.1 | DY2 | 1.11 ms | 900 fps | 1.08 ms | 925 fps | 2.52 | YUY2可逆 |
DY3 | 1.78 ms | 558 fps | 1.66 ms | 601 fps | 3.09 | YUY2可逆 二次圧縮あり |
レベル | エンコード | デコード | 圧縮効果 | 備考 | |||
時間 | FPS | 時間 | FPS | ||||
AMV4 32bit AVX2 | DY2 | 0.84 ms | 1189 fps | 0.64 ms | 1557 fps | 2.52 | YUY2可逆 |
DY3 | 1.21 ms | 825 fps | 1.17 ms | 854 fps | 3.09 | YUY2可逆 二次圧縮あり | |
AMV4 64bit AVX2 | DY2 | 0.72 ms | 1386 fps | 0.55 ms | 1790 fps | 2.52 | YUY2可逆 |
DY3 | 1.07 ms | 931 fps | 0.97 ms | 1029 fps | 3.09 | YUY2可逆 二次圧縮あり |
※ 時間、FPS:1フレーム処理するのにかかった時間、FPSは1秒間に何フレーム処理できるかを示しています。この2つは同じ情報です。FPSの数値が大きいほど優れています。
※ 圧縮効果:未圧縮に対しデータ(ファイルサイズ)を何分の1に圧縮できるかを示しています。数値が大きいほど優れています。
例 圧縮効果が2.00の場合、未圧縮で録画した場合と比べファイルサイズを半分(2分の1)に減らす能力があります。
処理速度と圧縮効果について
圧縮効果についてはSSE版とAVX2版とで同じ結果となりますので前回のSSE編を参照してください。
処理速度についてはAMV2MTとAMV4 64bit AVX2版を比較します。
Y2とDY2を比較するとDY2の方がエンコード処理で約73%、デコード処理で約242%(3.4倍)性能が向上しています。
Y3とDY3を比較するとエンコード処理で約68%、デコード処理で172%(2.7倍)の性能向上となっています。
なお、AVX2 32bit SSE版のDY3のエンコードがY3より1%程度遅い結果となっています。前回のIvy BridgeでのテストではDY3の方が約8%速い結果となっているので、Y3とDY3のSSE版はCPUの違いにより優劣が入れ替わるくらいの僅差と言えます。
まとめ
以前公開したAMV2MTデコーダーのAVX2対応デモ版で3倍速いというのを示しましたが、
「3倍高速 AVX2対応 AMVデコーダー デモ版」
「AVX2対応 AMVデコーダー デモ版の追試」
AMV4はさらにその上を行く3.4倍の性能(デコード処理)に達します。これはデモ版の時はAMV2の仕様に合わせてコーディングする必要があった(AMV2の仕様は2008年にSSEを前提に作成したのでAVX2には向かない部分が含まれる)のに対し、AMV4ではAVX2の特性に合わせ仕様の作成段階から取り組んだためです。
その結果、仕様とコーディングの両面でAVX2の性能を 相当高いレベルまで引き出せたと思います。
AMV4のAVX2版を簡単にまとめると
(1) エンコード処理の処理速度が約70%程度向上する
(2) デコード処理の処理速度が200%程度向上する
(3) 可逆圧縮の圧縮効果がDY2で最大約20%、DY3で平均約50%向上する
(4) AVX2が使えるPCでは処理速度と圧縮効果の両面で大幅に性能が向上する
※ 記事の内容は開発中のものです。公開時の仕様と異なる場合があります。
最終的な仕様については、公開時の記事を見てください。
- 関連記事
-
- 3倍高速 AVX2対応 AMVデコーダー デモ版
- 64bit版AMVビデオデコーダーを使って再生した場合のDirect Showグラフ
- AVX2対応 AMVデコーダー デモ版の追試
- AVX2って何? そしてAMV4ビデオコーデック
- AMV4ビデオコーデック 概要
- AMV4ビデオコーデック 内部仕様でみるAMV4とAMV2MTの違い
- AMV4ビデオコーデック ベンチマーク暫定版 SSE編
- AMV4ビデオコーデック ベンチマーク暫定版 もはや反則AVX2編
- ビデオコーデック・ベンチマーク2014夏
- AMV4ビデオコーデック オンラインヘルプ
- AMV2MTとAMV4の違い まとめ
- AMV4ビデオコーデックとアマレコTV Ver3.10公開
- AMV4ビデオコーデック Ver4.01 インストール関連修正
- メディアプレイヤークラシック(MPC)でYUY2の動画が再生できない
- AMV4ビデオコーデック Ver4.02 不具合修正
trackback
コメントの投稿