fc2ブログ
 

AMV2MTとAMV4の違い まとめ

AMV4ビデオコーデックと同じRGB、YUY2に対応したAMV2MTとAMV4の違いを表にまとめました。

AMV2MTとAMV4の違い
   AMV2MT
Ver2.20i
AMV4
Ver4.00
AMV4補足
対応OS

Windows
2000/XP/7

各32bit版のみ

Windows7 SP1

Windows8.1
各64bit版のみ
新しいOSのみ対応
32bit版のOSでは
動作確認を行っていません
CPU拡張命令SSE2

SSE4.1

AVX2.0
SSE4.1必須
AVX2が使える場合は
自動的にAVX2を使います
対応プロセス32bitアプリのみ32bitアプリ
64bitアプリ
64bitOS完全対応
マルチスレッド1から8シングルスレッドのみ

シングルスレッドで

十分リアルタイム処理が可能
圧縮モード

高速可逆

標準可逆

標準(非可逆)

高圧縮(非可逆)

標準可逆

高圧縮可逆
可逆のみ
圧縮効果低め高め

可逆圧縮でもAMV2MTの

標準(非可逆)より高い圧縮効果

処理速度速い全体的にもっと速くなる

AMV2MTと比べ

SSE4版:やや速くなる

AVX2版:大幅に速くなる

デコード処理は最大で約3.4倍高速
    
最少画像サイズ80x4096x48 
画像サイズ横8、縦4の倍数横2、縦2の倍数 

RGB・YUY2変換

色サンプリング
左右の平均値左側の画素 
入力
フォーマット

RGB32

RGB24

RGB16(R5G6B5)

YUY2

UYVY

HDYC

RGB32

RGB24

YUY2

UYVY
RGB16とHDYCを廃止
圧縮
フォーマット

RGB24

YUV444

YUY2

RGB24

YUY2
YUV444を廃止
出力
フォーマット

RGB32

RGB24

YUY2

RGB32

YUY2
RGB24を廃止
FourCC‘AMM2’‘AMV4’ 
    
ハーフサイズ× 
プロファイル× 
インターレース画像× 
    
ライセンスキー共通共通

AMV2、AMV2MT、AMV3、AMV4

で共通

もっと詳しい違いについては次の記事を見てください。
AMV4ビデオコーデック 内部仕様でみるAMV4とAMV2MTの違い




AMV4ビデオコーデック ベンチマーク暫定版 もはや反則AVX2編

AVX2に対応したCPU「Haswell」でAMV4ビデオコーデックのAVX2版をテストします。
テスト条件は前回のSSE編と同じですのでパソコンのスペック以外は以前の記事を参照してください。
AMV4ビデオコーデック ベンチマーク暫定版 SSE編

なお、AMV4ビデオコーデックについては開発途中のバージョンによるテストですので、
最終的なバージョンと異なる場合があります。
完成後にもう一度ベンチマークをやり直し結果を掲載しますのでそちらも確認してください。

【ベンチマーク条件】
パソコンのスペック以外はSSE編と同じ
AMV4ビデオコーデック ベンチマーク暫定版 SSE編


パソコンのスペック
OSWindows8 x64 Professional
CPUIntel(R) Core(TM) i7-4770 CPU @ 3.40GHz Haswell
MBASRock H87 Performance (Intel H87)
MemoryDDR3 1600 16GB(8GBx2 Dual Cannel)read=25.4GB/s write=14.8GB/s
SoftwareVideo Codec Test 2.0.0
備考CPUは4コア、8スレッド、HTT対応、AVX2対応。動作クロックを3.4GHz(定格)で固定し、
省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。



【ベンチマーク結果】
表1 シングルスレッドによるAMV2MT 32bit SSE2の結果(1スレッド、1コア)
 レベルエンコードデコード圧縮効果備考
時間FPS時間FPS
AMV2MT
32bit
SSE2
Y10.60 ms1648 fps0.80 ms1238 fps1.15YUY2可逆
Y21.24 ms801 fps1.90 ms523 fps2.09YUY2可逆
Y31.81 ms551 fps2.64 ms377 fps2.78YUY2非可逆
Y43.73 ms267 fps4.37 ms228 fps3.67YUY2非可逆 二次圧縮あり


表2 シングルスレッドによるAMV4 SSE4.1版の結果(1スレッド、1コア)
 レベルエンコードデコード圧縮効果備考
時間FPS時間FPS
AMV4
32bit
SSE4.1
DY21.09 ms910 fps1.17 ms850 fps2.52YUY2可逆
DY31.84 ms541 fps1.84 ms542 fps3.09YUY2可逆 二次圧縮あり
AMV4
64bit
SSE4.1
DY21.11 ms900 fps1.08 ms925 fps2.52YUY2可逆
DY31.78 ms558 fps1.66 ms601 fps3.09YUY2可逆 二次圧縮あり


表3 シングルスレッドによるAMV4 AVX2版の結果(1スレッド、1コア)
 レベルエンコードデコード圧縮効果備考
時間FPS時間FPS
AMV4
32bit
AVX2
DY20.84 ms1189 fps0.64 ms1557 fps2.52YUY2可逆
DY31.21 ms825 fps1.17 ms854 fps3.09YUY2可逆 二次圧縮あり
AMV4
64bit
AVX2
DY20.72 ms1386 fps0.55 ms1790 fps2.52YUY2可逆
DY31.07 ms 931 fps0.97 ms1029 fps3.09YUY2可逆 二次圧縮あり

※ 時間、FPS:1フレーム処理するのにかかった時間、FPSは1秒間に何フレーム処理できるかを示しています。この2つは同じ情報です。FPSの数値が大きいほど優れています。
※ 圧縮効果:未圧縮に対しデータ(ファイルサイズ)を何分の1に圧縮できるかを示しています。数値が大きいほど優れています。
例 圧縮効果が2.00の場合、未圧縮で録画した場合と比べファイルサイズを半分(2分の1)に減らす能力があります。



処理速度と圧縮効果について
圧縮効果についてはSSE版とAVX2版とで同じ結果となりますので前回のSSE編を参照してください。
処理速度についてはAMV2MTとAMV4 64bit AVX2版を比較します。
Y2とDY2を比較するとDY2の方がエンコード処理で約73%、デコード処理で約242%(3.4倍)性能が向上しています。
Y3とDY3を比較するとエンコード処理で約68%、デコード処理で172%(2.7倍)の性能向上となっています。
なお、AVX2 32bit SSE版のDY3のエンコードがY3より1%程度遅い結果となっています。前回のIvy BridgeでのテストではDY3の方が約8%速い結果となっているので、Y3とDY3のSSE版はCPUの違いにより優劣が入れ替わるくらいの僅差と言えます。


まとめ
以前公開したAMV2MTデコーダーのAVX2対応デモ版で3倍速いというのを示しましたが、
「3倍高速 AVX2対応 AMVデコーダー デモ版」
「AVX2対応 AMVデコーダー デモ版の追試」

AMV4はさらにその上を行く3.4倍の性能(デコード処理)に達します。これはデモ版の時はAMV2の仕様に合わせてコーディングする必要があった(AMV2の仕様は2008年にSSEを前提に作成したのでAVX2には向かない部分が含まれる)のに対し、AMV4ではAVX2の特性に合わせ仕様の作成段階から取り組んだためです。
その結果、仕様とコーディングの両面でAVX2の性能を 相当高いレベルまで引き出せたと思います。

AMV4のAVX2版を簡単にまとめると
(1)  エンコード処理の処理速度が約70%程度向上する
(2)  デコード処理の処理速度が200%程度向上する
(3)  可逆圧縮の圧縮効果がDY2で最大約20%、DY3で平均約50%向上する
(4)  AVX2が使えるPCでは処理速度と圧縮効果の両面で大幅に性能が向上する


※ 記事の内容は開発中のものです。公開時の仕様と異なる場合があります。
最終的な仕様については、公開時の記事を見てください。



AMV4ビデオコーデック ベンチマーク暫定版 SSE編

今回はIvy Bridgeでのベンチマークです。Haswell (AVX2)については次回となります。
Ivy BridgeではAVX2命令が使えないためAMV4のSSE版とAMV2MTを比較します。

なお、AMV4ビデオコーデックについては開発途中のバージョンによるテストですので、最終的なバージョンと異なる場合があります。完成後にもう一度ベンチマークをやり直し結果を掲載しますのでそちらも確認してください。


【ベンチマーク条件】
基本的には以前のベンチマークと同様のテストとなります。
ビデオコーデック・ベンチマーク2012夏(2012.9.4修正版)

サンプル動画(動きの激しい動画)
タイトルMystery of the Nile
情報1280*720、2082frames、1分26秒、3,837,598,360Byte
備考AviUtlを使ってYUY2未圧縮に変換

パソコンのスペック
OSWindows7 x64 Professional SP1
CPUIntel(R) Core(TM) i5-3470S CPU @ 2.90GHz Ivy Bridge
MBASRock H77 Pro4-M (Intel H77)
MemoryDDR3 1600 16GB(4GBx4 Dual Cannel)read=23.5GB/s write=11.8GB/s
SoftwareVideo Codec Test 2.0.0
備考CPUは4コア、マルチスレッドテクノロジーには対応していません。動作クロックを2.9GHz(定格)で固定し、省電力設定およびTurbo BoostはBIOSで無効化、動作クロックがテスト中に変動しないようにしています。

コーデック
コーデック名バージョン32bit 64bit 設定
AMV2MT2.20i×製品版(ロゴなし)
AMV4開発途中ロゴなし


以前のベンチマーク環境とほぼ同じ内容となりますが、次の3点が異なります。
・メモリーが4x2GB(計8GB)から4x4GB(計16GB)に増えた
・ベンチマークソフトのバージョンが上がった
・AMV2MTの試用状態(ロゴ挿入)ではなく製品版(ロゴなし)によるテスト

補足1 圧縮効果の有効桁数について
ベンチマークソフトのバージョンが変わったことで、より細かい数値まで表示されるようになりました。
この部分は今まで小数点第3位を四捨五入して小数点第2位まで表示していたと思いますが、今回から私が数値を読み取る際に小数点第2位未満を切り捨てています(小数点第3位を四捨五入しない)。


補足2 ロゴの有無による圧縮効果の違い
今回はAMV2MTの製品版を使ってテストしています。そのため試用版のロゴが入らないので圧縮効果の数値が微妙に変わってきます。 また、エンコード処理においてもロゴ挿入処理が無いため以前の記事よりわずかに速い結果が出ます。 

 
AMV2MT:Y3のロゴの有無による圧縮効果の差
ロゴの有無圧縮効果圧縮後のサイズ / 未圧縮のサイズ
ロゴあり2.791377776170 / 3837542400
ロゴなし2.781379777362 / 3837542400


このような事情によりテストの本質は以前の記事と同じですが、完全に一致するはずの圧縮効果(圧縮比)の数値がわずかに異なる場合があります。


【ベンチマーク結果 】

表1 シングルスレッドによるAMVビデオコーデックの結果(1スレッド、1コア)
 レベルエンコードデコード圧縮効果備考
時間FPS時間FPS
AMV2MT
32bit
SSE2
Y10.74 ms1340 fps1.00 ms992 fps1.15YUY2可逆
Y21.61 ms617 fps2.47 ms404 fps2.09YUY2可逆
Y32.48 ms401 fps3.32 ms300 fps2.78YUY2非可逆
Y44.89 ms204 fps5.42 ms184 fps3.67YUY2非可逆 二次圧縮あり
AMV4
32bit
SSE4.1
DY21.29 ms772 fps1.40 ms712 fps2.52YUY2可逆
DY32.29 ms436 fps2.23 ms447 fps3.09YUY2可逆 二次圧縮あり
AMV4
64bit
SSE4.1
DY21.26 ms793 fps1.17 ms851 fps2.52YUY2可逆
DY32.16 ms462 fps1.81 ms549 fps3.09YUY2可逆 二次圧縮あり

※ 時間、FPS:1フレーム処理するのにかかった時間、FPSは1秒間に何フレーム処理できるかを示しています。この2つは同じ情報です。FPSの数値が大きいほど優れています。
※ 圧縮効果:未圧縮に対しデータ(ファイルサイズ)を何分の1に圧縮できるかを示しています。数値が大きいほど優れています。
例 圧縮効果が2.00の場合、未圧縮で録画した場合と比べファイルサイズを半分(2分の1)に減らす能力があります。



処理速度について
AMV2MTのY2とAMV4のDY2(32bit版)を比較するとDY2の方がエンコード処理で約25%、デコード処理で約76%性能が向上しています。 また、Y3とDY3を比較するとエンコード処理で約8%、デコード処理で約49%の性能向上となっています。

圧縮効果について
Y2とDY2を比較するとDY2の方が約20%性能が向上しています。 ただし、映像の内容によってはほとんど向上しない場合もあります。最大約20%向上すると捉えてください。
傾向としては、Y2の圧縮効果が低い場面においてDY2の圧縮効果が向上します。 一方、Y2の時点で高い圧縮効果が得られる場面ではY2とDY2はほぼ同じ圧縮効果となります。

続いてDY3についてですが、同じ可逆圧縮のY2と比べると約47%の性能向上という結果になりました。 こちらは映像の内容によってはもっと高い性能向上が期待できます。

まとめ
最近はAVX2の話を中心にしてきましたが、 AMV4のSSE版も圧縮効果の向上とデコード処理の大幅な高速化となりますので、AMV2MTより高性能なコーデックと言えるものとなります。

AMV4のSSE版を簡単にまとめると
(1) エンコード処理は同程度か若干速くなる
(2) デコード処理は大幅に高速化される
(3) 可逆圧縮の圧縮効果がDY2で最大約20%、DY3で平均約47%向上する
(4) AVX2が使えないPCでも確実にAMV2MTより高性能となる


※ 記事の内容は開発中のものです。公開時の仕様と異なる場合があります。
最終的な仕様については、公開時の記事を見てください。



 
 
あまラボへようこそ
このブログでは自作ソフトの最新情報やtips、PC動画に関する話題を掲載していきます。各記事へは下にあるカテゴリからアクセスして下さい。

ファイルのダウンロードはホームページの方でお願い致します。

質問・要望・不具合報告はこちら
アマレコTV
アマミキ!
アマレココ
アマレコ・ライト
ファンタジーリモート
AMVコーデック



ホームページ
カテゴリ
最新コメント
カレンダー
04 | 2023/05 | 06
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -
最新記事
最新トラックバック
ブログ内タグ

アマレコTV ビデオキャプチャ アマレコVR AMVコーデック Oculus Quest アマレココ アマミキ! コーデック gQuest SC500 動画配信 Pico GO ファンタジーリモート 4K アマレコライト プラグイン G2 AMV4 oculus Unity SC512 ライブ機能 パススルー機能 デスクトップキャプチャ AVX2 Passthrough FAQ リモートソフト 質問コーナー ニコニコ動画 HDキャプチャ DirectShow 120Hz 背景透過 遅延 可変再生速度 レゴ 解説動画 Meta 組み換え VR LEGO XL2420T GV-USB2 2 アセット機能 液晶モニター 倍速液晶 デインターレース PS4 ベンチマーク アマステ AMV2MT Asset Intensity Pico4 MetaQuest Pro VRonVR MonsterX3A designs VideoKeeper2 AVX Alternate XCAPTURE-1 SD-USB2CAP4 GV-USB インストール RDT233WX-Z 32ZP2 31006 ffmpeg WindowsMR Rift 画像処理 31024 T2 60fps RGBキャプチャ UtVideo Shadow Play RYZEN 電源オプション HDCP Haswell HDMI 音遅延 QSV MonsterXU3.0R LameACM MP3 31021 フィギュア 音ズレ 録画 ゲームスムーズモード HT OBS MPC ハイパースレッディングテクノロジー NVEnc 液晶テレビ DirectShowFilter プレビュー 擬似NTSCキャプチャ SD-USB2CUP4 Livetube AtomでHDキャプチャ キャプチャーツール シンクライアント イベント IntensityPro DC-HD1 額縁遅延 REGZA ZP3 32ZP32 オーバーレイ リプレイ機能 モノステ 倍速駆動 倍速補完処理 キャプチャカード Robust Video Matting API APIパススルー機能 60Hz 検証 passthrough python pytorch ハンドジェスチャー パカラーススルー機能 AssetBundle 2.0 Tracking ファイルマネージャプラス SkyBox Hand AMPlayer 新プレイヤー機能 GPU使用率 LAVFilters Preferred 可逆圧縮 GV-USB3 Kabelake SSE SKnet Filter Tweaker Windows 90Hz 新アマレコVR MR VRコントローラー SteamVR VR動画 フレーム間圧縮 XCapture-1 

ブログ内検索
月別アーカイブ
アマレココに関するリンク
お世話になっているソフトのリンク
RSSリンクの表示
管理画面
  • 管理画面