連載1 高速なメモリーコピー その1

私はC言語でプログラムを開発していてmemcpy()関数を使うことが多く、この関数は次のようなアセンブラに展開されるようです。

1:     mov     ecx, dword ptr [ebp+10h]
2:     mov     esi, dword ptr [ebp+0Ch]
3:     mov     edi, dword ptr [ebp+8]
4:     mov     eax, ecx
5:     shr     ecx, 2
6:     rep     movs dword ptr [edi], dword ptr [esi]
7:     mov     ecx, eax
8:     and     ecx, 3
9:     rep     movs byte ptr [edi], byte ptr [esi]

これは4Byte (32bit)ずつコピーしていって、4Byte未満の端数が出たら1Byteずつコピーしています。アセンブラのコードを見る限り無駄もなく安心して使える関数ですが処理速度の点ではもう少し向上させることが出来ます。

ポイントは2つ、一つ目は今のCPUならSSE命令を使って16Byte(128bit)ずつコピーできる点、そしてもう一つはメモリーアライメントを考慮することです。

続く...
関連記事


コメントの投稿

 
 
あまラボへようこそ
このブログでは自作ソフトの最新情報やtips、PC動画に関する話題を掲載していきます。各記事へは下にあるカテゴリからアクセスして下さい。

ファイルのダウンロードはホームページの方でお願い致します。

質問・要望・不具合報告はこちら
アマレコTV
アマミキ!
アマレココ
アマレコ・ライト
ファンタジーリモート
AMVコーデック



ホームページ
カテゴリ
最新コメント
カレンダー
06 | 2018/07 | 08
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
最新記事
最新トラックバック
ブログ内タグ

アマレコTV ビデオキャプチャ AMVコーデック アマレココ アマミキ! コーデック SC500 動画配信 ファンタジーリモート アマレコライト プラグイン AMV4 SC512 ライブ機能 デスクトップキャプチャ AVX2 アマレコVR リモートソフト 質問コーナー FAQ ニコニコ動画 HDキャプチャ DirectShow 組み換え 可変再生速度 4K 解説動画 遅延 レゴ LEGO GV-USB2 XL2420T 液晶モニター 倍速液晶 Intensity AMV2MT アマステ MonsterX3A ベンチマーク Oculus デインターレース PS4 120Hz Pro RYZEN 32ZP2 Play RDT233WX-Z 31006 designs Alternate 31024 SD-USB2CAP4 WindowsMR Rift Unity GV-USB UtVideo T2 VideoKeeper2 ffmpeg Shadow RGBキャプチャ XCAPTURE-1 AVX DirectShowFilter Livetube AtomでHDキャプチャ OBS フィギュア GPU使用率 可逆圧縮 GV-USB3 プレビュー キャプチャカード 電源オプション HDCP インストール 音ズレ SteamVR Tweaker VR動画 フレーム間圧縮 キャプチャーツール VRコントローラー Filter Preferred HDMI SKnet シンクライアント QSV LAVFilters イベント SD-USB2CUP4 MP3 額縁遅延 32ZP32 液晶テレビ MPC XCapture-1 REGZA ZP3 音遅延 MonsterXU3.0R LameACM ゲームスムーズモード 倍速補完処理 録画 ハイパースレッディングテクノロジー Haswell IntensityPro オーバーレイ SSE 擬似NTSCキャプチャ MR DC-HD1 リプレイ機能 HT 倍速駆動 NVEnc Kabelake モノステ 31021 

ブログ内検索
月別アーカイブ
アマレココに関するリンク
お世話になっているソフトのリンク
RSSリンクの表示
管理画面
  • 管理画面