08/06/01 02:04:28 UUrel9fs0
>>767
一応CFに関しては簡単な指針が出てますね。
URLリンク(ati.amd.com)
> ・Keep all frames independent of previous frames
> ・Don’t share data across frames
> ・Don’t read back any data
> ・Don’t sync to any less than as many frames as there are GPUs
> ・Clear buffers, and
> ・Use proper lock flags
無茶苦茶言ってますが、ドライバやオフィシャルツールでアプリケーションを特定して
適切な動作モードに切り替えている現状では、この位の制限をかけないと
まともにスケールしないのでしょう。
32bitなCUDAが直接動かないのなら、IPCを使って32bitなラッパープラグインから
64bitなCUDAを呼んでみてはどうでしょう。
要するに↓の逆な訳ですが。
URLリンク(dnjonline.com)
>>803
Brook+でSDKのバージョンが上がる度に作ってみてますが、DirectX使った方が速いですよ。
今のところ3850を使って範囲3 分散50 1024x786で1フレーム0.4秒程ですが、5600+でSSE2を使うと0.6秒と大して変わらず。
CALを使って書けばもっと速くなるんでしょうけど、何せアセンブラ並みの中間言語なので労力に見合わなくて・・・