スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


AMV4ビデオコーデック ベンチマーク暫定版 もはや反則AVX2編

AVX2に対応したCPU「Haswell」でAMV4ビデオコーデックのAVX2版をテストします。
テスト条件は前回のSSE編と同じですのでパソコンのスペック以外は以前の記事を参照してください。
AMV4ビデオコーデック ベンチマーク暫定版 SSE編

なお、AMV4ビデオコーデックについては開発途中のバージョンによるテストですので、
最終的なバージョンと異なる場合があります。
完成後にもう一度ベンチマークをやり直し結果を掲載しますのでそちらも確認してください。

【ベンチマーク条件】
パソコンのスペック以外はSSE編と同じ
AMV4ビデオコーデック ベンチマーク暫定版 SSE編


パソコンのスペック
OSWindows8 x64 Professional
CPUIntel(R) Core(TM) i7-4770 CPU @ 3.40GHz Haswell
MBASRock H87 Performance (Intel H87)
MemoryDDR3 1600 16GB(8GBx2 Dual Cannel)read=25.4GB/s write=14.8GB/s
SoftwareVideo Codec Test 2.0.0
備考CPUは4コア、8スレッド、HTT対応、AVX2対応。動作クロックを3.4GHz(定格)で固定し、
省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。



【ベンチマーク結果】
表1 シングルスレッドによるAMV2MT 32bit SSE2の結果(1スレッド、1コア)
 レベルエンコードデコード圧縮効果備考
時間FPS時間FPS
AMV2MT
32bit
SSE2
Y10.60 ms1648 fps0.80 ms1238 fps1.15YUY2可逆
Y21.24 ms801 fps1.90 ms523 fps2.09YUY2可逆
Y31.81 ms551 fps2.64 ms377 fps2.78YUY2非可逆
Y43.73 ms267 fps4.37 ms228 fps3.67YUY2非可逆 二次圧縮あり


表2 シングルスレッドによるAMV4 SSE4.1版の結果(1スレッド、1コア)
 レベルエンコードデコード圧縮効果備考
時間FPS時間FPS
AMV4
32bit
SSE4.1
DY21.09 ms910 fps1.17 ms850 fps2.52YUY2可逆
DY31.84 ms541 fps1.84 ms542 fps3.09YUY2可逆 二次圧縮あり
AMV4
64bit
SSE4.1
DY21.11 ms900 fps1.08 ms925 fps2.52YUY2可逆
DY31.78 ms558 fps1.66 ms601 fps3.09YUY2可逆 二次圧縮あり


表3 シングルスレッドによるAMV4 AVX2版の結果(1スレッド、1コア)
 レベルエンコードデコード圧縮効果備考
時間FPS時間FPS
AMV4
32bit
AVX2
DY20.84 ms1189 fps0.64 ms1557 fps2.52YUY2可逆
DY31.21 ms825 fps1.17 ms854 fps3.09YUY2可逆 二次圧縮あり
AMV4
64bit
AVX2
DY20.72 ms1386 fps0.55 ms1790 fps2.52YUY2可逆
DY31.07 ms 931 fps0.97 ms1029 fps3.09YUY2可逆 二次圧縮あり

※ 時間、FPS:1フレーム処理するのにかかった時間、FPSは1秒間に何フレーム処理できるかを示しています。この2つは同じ情報です。FPSの数値が大きいほど優れています。
※ 圧縮効果:未圧縮に対しデータ(ファイルサイズ)を何分の1に圧縮できるかを示しています。数値が大きいほど優れています。
例 圧縮効果が2.00の場合、未圧縮で録画した場合と比べファイルサイズを半分(2分の1)に減らす能力があります。



処理速度と圧縮効果について
圧縮効果についてはSSE版とAVX2版とで同じ結果となりますので前回のSSE編を参照してください。
処理速度についてはAMV2MTとAMV4 64bit AVX2版を比較します。
Y2とDY2を比較するとDY2の方がエンコード処理で約73%、デコード処理で約242%(3.4倍)性能が向上しています。
Y3とDY3を比較するとエンコード処理で約68%、デコード処理で172%(2.7倍)の性能向上となっています。
なお、AVX2 32bit SSE版のDY3のエンコードがY3より1%程度遅い結果となっています。前回のIvy BridgeでのテストではDY3の方が約8%速い結果となっているので、Y3とDY3のSSE版はCPUの違いにより優劣が入れ替わるくらいの僅差と言えます。


まとめ
以前公開したAMV2MTデコーダーのAVX2対応デモ版で3倍速いというのを示しましたが、
「3倍高速 AVX2対応 AMVデコーダー デモ版」
「AVX2対応 AMVデコーダー デモ版の追試」

AMV4はさらにその上を行く3.4倍の性能(デコード処理)に達します。これはデモ版の時はAMV2の仕様に合わせてコーディングする必要があった(AMV2の仕様は2008年にSSEを前提に作成したのでAVX2には向かない部分が含まれる)のに対し、AMV4ではAVX2の特性に合わせ仕様の作成段階から取り組んだためです。
その結果、仕様とコーディングの両面でAVX2の性能を 相当高いレベルまで引き出せたと思います。

AMV4のAVX2版を簡単にまとめると
(1)  エンコード処理の処理速度が約70%程度向上する
(2)  デコード処理の処理速度が200%程度向上する
(3)  可逆圧縮の圧縮効果がDY2で最大約20%、DY3で平均約50%向上する
(4)  AVX2が使えるPCでは処理速度と圧縮効果の両面で大幅に性能が向上する


※ 記事の内容は開発中のものです。公開時の仕様と異なる場合があります。
最終的な仕様については、公開時の記事を見てください。

関連記事


コメントの投稿

 
 
あまラボへようこそ
このブログでは自作ソフトの最新情報やtips、PC動画に関する話題を掲載していきます。各記事へは下にあるカテゴリからアクセスして下さい。

ファイルのダウンロードはホームページの方でお願い致します。

質問・要望・不具合報告はこちら
アマレコTV
アマミキ!
アマレココ
アマレコ・ライト
ファンタジーリモート
AMVコーデック



ホームページ
カテゴリ
最新コメント
カレンダー
08 | 2017/09 | 10
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
最新記事
最新トラックバック
ブログ内タグ

アマレコTV ビデオキャプチャ AMVコーデック アマレココ アマミキ! コーデック SC500 動画配信 ファンタジーリモート アマレコライト プラグイン AMV4 SC512 ライブ機能 デスクトップキャプチャ AVX2 FAQ リモートソフト 質問コーナー ニコニコ動画 DirectShow HDキャプチャ 組み換え 4K レゴ 遅延 可変再生速度 解説動画 LEGO XL2420T ベンチマーク Intensity AMV2MT 120Hz 倍速液晶 GV-USB2 アマステ 液晶モニター PS4 Pro デインターレース 32ZP2 Shadow VideoKeeper2 31024 RDT233WX-Z ffmpeg GV-USB AVX Play Alternate designs 31006 RGBキャプチャ RYZEN SD-USB2CAP4 XCAPTURE-1 DirectShowFilter キャプチャーツール Livetube シンクライアント イベント AtomでHDキャプチャ プレビュー 擬似NTSCキャプチャ IntensityPro SD-USB2CUP4 額縁遅延 MPC ハイパースレッディングテクノロジー HT インストール OBS QSV NVEnc 31021 フィギュア Kabelake SSE MonsterX3A XCapture-1 オーバーレイ 音ズレ 録画 HDMI HDCP 32ZP32 SKnet REGZA 液晶テレビ 倍速駆動 リプレイ機能 モノステ ZP3 倍速補完処理 MP3 Haswell 電源オプション LameACM 音遅延 ゲームスムーズモード MonsterXU3.0R DC-HD1 

ブログ内検索
月別アーカイブ
アマレココに関するリンク
お世話になっているソフトのリンク
RSSリンクの表示
管理画面
  • 管理画面
  • 上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。