スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


連載1 高速なメモリーコピー その1

私はC言語でプログラムを開発していてmemcpy()関数を使うことが多く、この関数は次のようなアセンブラに展開されるようです。

1:     mov     ecx, dword ptr [ebp+10h]
2:     mov     esi, dword ptr [ebp+0Ch]
3:     mov     edi, dword ptr [ebp+8]
4:     mov     eax, ecx
5:     shr     ecx, 2
6:     rep     movs dword ptr [edi], dword ptr [esi]
7:     mov     ecx, eax
8:     and     ecx, 3
9:     rep     movs byte ptr [edi], byte ptr [esi]

これは4Byte (32bit)ずつコピーしていって、4Byte未満の端数が出たら1Byteずつコピーしています。アセンブラのコードを見る限り無駄もなく安心して使える関数ですが処理速度の点ではもう少し向上させることが出来ます。

ポイントは2つ、一つ目は今のCPUならSSE命令を使って16Byte(128bit)ずつコピーできる点、そしてもう一つはメモリーアライメントを考慮することです。

続く...
関連記事


コメントの投稿

 
 
あまラボへようこそ
このブログでは自作ソフトの最新情報やtips、PC動画に関する話題を掲載していきます。各記事へは下にあるカテゴリからアクセスして下さい。

ファイルのダウンロードはホームページの方でお願い致します。

質問・要望・不具合報告はこちら
アマレコTV
アマミキ!
アマレココ
アマレコ・ライト
ファンタジーリモート
AMVコーデック



ホームページ
カテゴリ
最新コメント
カレンダー
01 | 2018/02 | 03
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 - - -
最新記事
最新トラックバック
ブログ内タグ

アマレコTV ビデオキャプチャ AMVコーデック アマレココ アマミキ! コーデック SC500 動画配信 ファンタジーリモート アマレコライト プラグイン AMV4 ライブ機能 SC512 AVX2 デスクトップキャプチャ FAQ リモートソフト 質問コーナー DirectShow HDキャプチャ ニコニコ動画 組み換え 遅延 LEGO 解説動画 レゴ 可変再生速度 4K GV-USB2 XL2420T ベンチマーク 倍速液晶 Pro Intensity MonsterX3A 120Hz AMV2MT PS4 アマステ デインターレース 液晶モニター RGBキャプチャ Play ffmpeg SD-USB2CAP4 RYZEN RDT233WX-Z 32ZP2 Alternate XCAPTURE-1 31006 Shadow 31024 AVX VideoKeeper2 designs GV-USB DC-HD1 IntensityPro DirectShowFilter AtomでHDキャプチャ リプレイ機能 シンクライアント キャプチャーツール Livetube 擬似NTSCキャプチャ SD-USB2CUP4 プレビュー イベント 倍速補完処理 フィギュア 音ズレ 録画 31021 HT インストール MPC ハイパースレッディングテクノロジー オーバーレイ XCapture-1 キャプチャカード UtVideo T2 GV-USB3 SKnet Kabelake SSE OBS NVEnc ZP3 可逆圧縮 ゲームスムーズモード REGZA 額縁遅延 倍速駆動 液晶テレビ 32ZP32 MonsterXU3.0R 音遅延 HDCP HDMI QSV 電源オプション Haswell LameACM MP3 モノステ 

ブログ内検索
月別アーカイブ
アマレココに関するリンク
お世話になっているソフトのリンク
RSSリンクの表示
管理画面
  • 管理画面
  • 上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。