GPGPU

GPGPUat TECH

GPGPU - 暇つぶし2ch693:デフォルトの名無しさん
07/06/03 21:10:34
今エミュだけだからよーわからんのだけど
__device__と__global__って再帰呼び出し禁止だけど

２つの関数交互に呼ぶのはOKなのかなぁ？
エミュだとOKに見えるのだが実機だと動かなそうだがうーん

694:デフォルトの名無しさん
07/06/03 22:12:09
ソース上げてくれたらテストするよ。

695:デフォルトの名無しさん
07/06/03 23:13:18
__device__ hogeから__device__hoge1を呼び出せないのは痛いなぁ。

inline展開できない場合は処理不可能なのかぁうーむ。これにはちと
まいったな

696:デフォルトの名無しさん
07/06/07 23:58:14
なぁなぁ

Geforce8800GTXでCUDAするとき
sharedメモリいくらになるの？
各ブロックはいくらになるの？

その辺の情報がいまいちよーわからんのだが

697:デフォルトの名無しさん
07/06/08 07:41:27
CUDAが未だにVistaやx64に対応できないのは何か理由があんの？
もうかなり経つよね。

698:デフォルトの名無しさん
07/06/11 00:43:57
GPGPU完全死亡
URLﾘﾝｸ(pc.watch.impress.co.jp)

699:デフォルトの名無しさん
07/06/11 02:23:44
>>698
こんなのセルと大してかわらへん
並列度が低すぎる

700:・∀・）っ-○◎●
07/06/11 03:08:05
IA命令セットと互換ってのがみそだろ。
どうせSSEだろうけど。

701:デフォルトの名無しさん
07/06/11 07:00:21
で、どれだけ広まるのよ？一般に。
GPU以上に広まる可能性はあるのけ？

702:・∀・）っ-○◎●
07/06/11 07:04:13
そもそもGPUじゃないし
ただGPUで出来るGeneral Processingのおいしい部分は全部持ってっちゃうと思う。
x86のコードがそのまま動く意味は大きい。

703:デフォルトの名無しさん
07/06/11 07:04:20
しかも2009年まで出てこなんじゃ
インテルお得意のキャンセルされるかもしれないしね

704:デフォルトの名無しさん
07/06/11 07:22:53
てことは、一般には浸透しない可能性の方が大きいな。
Intelの資料にはLarrabeeだけで4CPU(?)構成の絵があったりするから
OSもそのまま走るのかも？

Tera Tera Teraには下記の記述がある。
LARRABEE ??TERATERA--SCALE SOLUTIONSOLUTION
Discrete high end GPU on general purpose platform
TeraFlopsof fully programmable performance
GPU ->16 cores @ ~2.0GHz, >150W
JPEG textures, physics acceleration, anti-aliasing, enhanced AI, Ray Tracing etc.

705:デフォルトの名無しさん
07/06/11 18:39:47
CPUコアがいくら増えたところでGPUの性能が落ちる訳じゃないし。

706:デフォルトの名無しさん
07/06/11 19:57:52
GPGPUよ、短い命であった。

707:デフォルトの名無しさん
07/06/11 22:43:50
そう、CPUのコアが増えたところで
GPGPUを使えば更に速くなるわけで、どっちか切り捨てるとかそういうものじゃないでしょ。
使えるものは使うと速くなるんだから。この場合は　だけどｗ

708:デフォルトの名無しさん
07/06/11 23:07:43
例えば今まで
CPU10 + GPU25 = 35
で処理できていたことが
CPU20 + GPU25 = 45
で処理できるならそれはいい。
なんで
CPU20 = 20にGPU切り捨てる必要があるんだ

709:デフォルトの名無しさん
07/06/11 23:15:13
しかも、CPUよりはGPUの方が安い罠。

710:デフォルトの名無しさん
07/06/11 23:18:20
30コアのCPUがいきなり一万円台で買えるとは思えないが。
よっぽど一世代前の高級GPUのほうが安く買えるかも。

711:デフォルトの名無しさん
07/06/11 23:41:11
PCI-Expressに挿せる超高速コプロならなんでも売れると思うけどね。
GPUでも糞INTELの石でもなんでもいいけどね

712:デフォルトの名無しさん
07/06/11 23:46:48
そうは言ってもClearSpeedはベンチマークスコア上げるのには
有効だが実用面ではちょっと。

713:デフォルトの名無しさん
07/06/11 23:51:48
あれは期待外れだった。糞高いコンパイラだけで性能出せないんじゃ……ねぇ。

714:デフォルトの名無しさん
07/06/12 07:29:59
「Larrabeeが登場したら、ハイパフォーマンスコンピューティングのベンチマークを
総なめにする可能性がある」とある業界関係者は期待を語る。

Larrabeeのターゲットアプリケーションは、一目見てわかる通り、GPUがGPGPU
でターゲットにし始めている領域と完全に重なる。つまり、LarrabeeはIntelによる
GPGPUの動きに対する回答だ。IntelとGPUベンダーは、ハイパフォーマンスな
浮動小数点演算性能が必要な並列コンピューティングの領域で、真っ向から
ぶつかることになる。

715:デフォルトの名無しさん
07/06/12 14:02:27
LarrabeeはSSL対応レイヤ3スイッチのアクセラレータや
重めのアプリケーションサーバにも向いているような気がする。
値段次第だけど。

716:デフォルトの名無しさん
07/06/15 05:53:00
R600のプログラム形態はSPIのStorm-1に近いかも知れん。

717:デフォルトの名無しさん
07/06/15 06:11:31
URLﾘﾝｸ(journal.mycom.co.jp)
>Stream ProcessorはDPUの他、2つのマイコン(MIPS 4000Ec)を搭載している。
>一つはSystem MIPSと呼んでおり、管理用OSが動作している。
>もう一つはDSP MIPSと呼んでおり、ここでメインアプリケーションが動作し、DPUをマネージメントする。

>並列アーキテクチャを備えたDSPながら、データ処理ロジックの開発は極めて簡単だという。
>アプリケーションはシングルスレッドプログラミングで記述すればよく、複数のレーン間の協調や、
>分散して配置されているメモリのマネジメントについて考慮せずに開発ができるという。
>複数のレーンには同じ命令を配置するので、レーン間で因果関係は出ない(出ないように
>各レーンに割り当てるデータの切り方を考慮する必要がある)。
>また、メモリのマネジメントはコンパイラが自動的に行う。
>このため、マルチスレッドプログラミングが必要なマルチコアDSPよりも、
>アプリケーション開発が楽であるという。しかも、将来の製品展開によってレーンの数が増減した時にも、
>ほぼ同じアプリケーションを使い続けることができるというスケーラビリティを持っているという。

R600の場合command processorとUltra-Threaded Dispatch Processorを二つのMIPS
レーンをShaderと置き換えれば似てるかも知れんね。
ただしR600の場合そのレーンのブロックが4つある。

718:デフォルトの名無しさん
07/06/15 19:06:16
GPGPUでGrapeオワタと思たらメニーコアでGPGPUオワタ

719:デフォルトの名無しさん
07/06/19 20:26:20
GPGPUを使った類似画像検索とか面白そうだが
どこもやってないのかな？

720:デフォルトの名無しさん
07/06/19 21:52:03
画像のパターン検索？ならやってた人がいたと思う

721:デフォルトの名無しさん
07/06/19 23:10:03
まぁそういう用途はGPGPUよりもこういうほうが面白そうだけどスレ違いか
URLﾘﾝｸ(www.k2.t.u-tokyo.ac.jp)

722:・∀・）っ-○◎●
07/06/20 00:57:06
DirectX10でGPUを汎用整数プロセッサとして使うサンプルある？

723:デフォルトの名無しさん
07/06/20 01:19:03
今更R600って、…MSX Turbo-R？

724:部外者('A`)NEET ◆xayimgmixk
07/06/20 11:57:32
あれは、R800だろ。

725:デフォルトの名無しさん
07/06/20 16:44:13
SEGA の体感ゲームだっけ?

726:デフォルトの名無しさん
07/06/21 01:21:12
R3000じゃなかったっけ？
ジオメトリエンジンついてるんだよな？

727:デフォルトの名無しさん
07/06/21 05:39:54
URLﾘﾝｸ(www.dailytech.com)
NVIDIA Announces Tesla General Purpose Processor Platform

URLﾘﾝｸ(pc.watch.impress.co.jp)
NVIDIA、G80ベースのHPC向けGPU「Tesla」
～PCI Expressカードタイプから1Uラックまで

>Teslaのソフトウェアプラットフォームは同社の汎用プログラミングモデル
>「CUDA (Compute Unified Device Architecture)」を利用。
>CUDAにはGPU用のCコンパイラが含まれており、
>Cプログラムに若干の修正を加えるだけで、
>CUDAコンパイラが処理をCPUとGPUに振り分けられる。

728:デフォルトの名無しさん
07/06/21 06:05:30
新しいGPGPU
URLﾘﾝｸ(www.gpucomputing.eu)
URLﾘﾝｸ(www.gpucomputing.eu)

729:ktkr!
07/06/26 11:26:50
ktkr!

Linux
[Download x86, x86-64] CUDA Tookit version 1.0

Windows
[Download] CUDA Tookit version 1.0 for Windows XP (32-bit)
[Download] CUDA SDK version 1.0 for Windows XP (32-bit)
[Download] Windows Display Driver version 162.01 for CUDA Toolkit version 1.0

URLﾘﾝｸ(developer.nvidia.com)

....ちょ、x64とかVistaは?

730:デフォルトの名無しさん
07/06/26 11:50:15
お、情報THX。
早速見てみなくちゃだわ。

731:デフォルトの名無しさん
07/06/26 12:15:19
もう完全にCUDAはやる気ないんじゃない？

うちはXP x64とVistaのデュアルブートだから、完全にアウト。

732:デフォルトの名無しさん
07/06/26 12:17:27
>>731
大丈夫、TesraがあるからCudaは終わらない。

733:デフォルトの名無しさん
07/06/26 14:56:23
こりゃあrapidmindの勝ちかな

734:デフォルトの名無しさん
07/06/26 15:51:35
x86_64 でXPとかビスタなんて使ってるやついたのか？

735:デフォルトの名無しさん
07/06/26 15:54:31
GPGPU用途に限ればLinuxでもいいのか。
CUDAカーネルの5秒制限も払拭されることだし。

736:デフォルトの名無しさん
07/06/26 18:51:32
残念。Larabeeの一人勝ち。

737:デフォルトの名無しさん
07/06/26 19:15:32
CUDAの分野とかから考えて、Vistaとx64を避ける意味がわからん。
特にVistaでは、GPUの仮想化をサポートしてるんで、まさにGPGPUの為の実装みたいなもんなのに・・・

738:デフォルトの名無しさん
07/06/26 20:32:02
Larrabeeは2009-2010登場のでGPU軍勢が散々広まってしまった後だ。
それにGPUは3世代進歩する。
専用ライブラリやランタイムが必要ならISAがx86である意味は薄い。
ましてや32コアを意識してプログラムを組めなんて気の遠くなることは・・・
Larrabeeだけこける。

GPU軍勢の影の総大将がMicrosoftであることは間違いない。

739:デフォルトの名無しさん
07/06/26 20:52:27
>>737
じゃあDirectX10.1が出る頃には対応するんじゃないか

740:デフォルトの名無しさん
07/06/26 21:11:16
PeakStreamを忘れないでください…と思ったけど買収されたしナァ

741:デフォルトの名無しさん
07/06/26 22:39:50
>>738
そんなばかなｗ
GPU軍勢って、nVIDIAだけじゃん。
結局IntelとAMDの天下だよ。

742:デフォルトの名無しさん
07/06/26 22:46:43
ララビー来るまでにTeslaがどれだけ普及するかだなぁ。
取り敢えずCUDA1.0を788GTSで動かすかな。

743:デフォルトの名無しさん
07/06/26 22:58:45
歴史的に見て、このプロセッサ(GPU)をCPUが取り込もうとして
失敗する事は殆ど無い。最終的にCPUに取り込まれるのは必然だと思われ。

性能云々の問題ではすまない。それで住むならMIPSは勝利していたはず。
キーとなるとは、いかにGPUを汎用的に使えるようにするか　だ。
GPUのメリットはぶっちゃけてしまえばコア数の差だ。これがもっと汎用的な事が可能なCPUもコアが増えるとなれば大変だ。
向き不向きで確かにGPUの並列化のほうが得策かもしれないが、その差が微々たる物であった時、はじめは部分的に使われても、最終的には全てを飲み込まれてしまう。

CUDAがx64やVistaに対応しないとか、馬鹿な所で詰まってる場合ではない。
今のメリット(先行)を生かさないと・・・。
本当に何を考えてるんだか・・・。

744:デフォルトの名無しさん
07/06/27 01:05:29
先生！
強い電波を観測しますた！！

745:デフォルトの名無しさん
07/06/27 01:39:32
>>743
まー、さっさと対応して欲しいよね。
俺もCPUに取り込まれてx86になったら、人は流れると思う。
特定分野はわからんけど、それならそれでx64に対応しろよ。
何もかもが中途半端

746:デフォルトの名無しさん
07/06/27 01:45:07
長文いってみようか。

性能ではなく普及台数の勝ち負け（プラットフォーム足り得るか）で言えばTeslaは間違いなく「負け」だな。
研究者は独りでｵﾅﾆｰしてﾊｧﾊｧできるだろうが、需要となるキラーアプリが無い限り一般消費者が飛びつくわけがない。
どっかのアホがPPUでレイトレとか風呂敷広げてたが、PPUと同じように普及せず終わる。
（つかそもそもTeslaは一般向けじゃねぇし）

GPUはGPUたる所以のラスタライザ周りのハードワイヤード機能が足枷となって
電力消費の観点からも性能は伸び悩むだろうが、Vistaや3Dゲームで元々GPUは需要があるだけに可能性はある。
ただ現状ではVistaは全く普及していないし、CUDA・CTMとベンダ毎に仕様が異なるから
2010年にLarabeeが登場する頃までは標準化も達成されずグダグダが続くだろう。

ってことでIntelとAMDが談合してx86にデータ並列のストリーム処理命令を新たに追加して終わりだな。
LarabeeでもFusionでも使えるとなれば勝ち決定。

747:デフォルトの名無しさん
07/06/27 02:10:44
と思ったがLarrabeeは全部のコアでフルx86が走るのか。
そうなると>LarabeeでもFusionでも使えるとなれば～は無いな。

748:デフォルトの名無しさん
07/06/27 02:28:25
CPU/MCHどっちにくっついていようがオンボードVGAがシェーダー重視で肥大化して
いったら、逆にS3（VIA）その他の弱小グラフィックスが再び脚光を浴びる。

（PCIeカードの）GPGPUは大学の研究室/個人レベルで使われるだろうが、それで終わる。
チップ自体の価格は大量生産を背景に競争力を持てるが、プログラミングコスト、電力
コストを考えると中～大規模案件では採用されない。

Larrabeeは詳細不明、リリース次期から逆算すると現時点でテープアウトしてなさそう。
後藤記事によると「“練習版”、本格的な製品とは言えない」(業界関係者)。とのことで、
実用化への道は長い。

5年後を予想すると、HPCクラスタ界隈はOpteronやXeonやPowerPCが引き続き使われ、
クライアント環境でのベクトル演算/SIMDはSSEの進化で間に合う。

749:デフォルトの名無しさん
07/06/27 02:38:09
639 ：Socket774 [sage] ：2007/06/18(月) 23:35:29 ID:j/fCz3TG
URLﾘﾝｸ(it.nikkei.co.jp)
システム価格の安いｘ８６サーバーのクラスターシステムへの需要シフトが
継続するとＩＤＣではみています。
２００６年におけるｘ８６サーバーは前年比４０．６％増で、４年連続で前年比プラス
成長となりました。国内ＨＰＣ市場におけるｘ８６サーバーの出荷金額構成比は、
過去最高の３６．６％に達しました。
ＲＩＳＣサーバーからｘ８６サーバーに民間企業のＨＰＣ需要がシフトしたとみられ、
民間企業向けの大規模クラスターシステムが好調でした。

678 ：Socket774 [sage] ：2007/06/27(水) 01:35:36 ID:Kgk8gcuA
Sun，ペタフロップスを実現可能なSolaris機を披露へ
URLﾘﾝｸ(techon.nikkeibp.co.jp)
Rangerには米AMD社のクアッド・コアを6576個以上搭載する。
当初のピーク性能は105TFLOPSだが，2007年中にピーク性能を
421TFLOPSに引き上げる計画である。

IBM社の次世代BlueGene，米Argonne研が導入へ
URLﾘﾝｸ(techon.nikkeibp.co.jp)
今回のBlue Gene/Pの演算性能は114TFLOPS。
2007年秋には3万2768個のプロセサから成るシステムになる。
各プロセサは，4個のCPUコアを1チップ上に集積した，いわゆる
クアッド・コアである。

750:デフォルトの名無しさん
07/06/27 02:39:19
670 ：MACオタ [sage] ：2007/06/26(火) 22:25:47 ID:E+b+TZBO
Blue Gene/Pのプレスリリースす。
URLﾘﾝｸ(www-03.ibm.com)
　　---------------------
　　Four IBM (850 MHz) PowerPC 450 processors are integrated on a single Blue Gene/P
　　chip. Each chip is capable of 13.6 billion operations per second.
　　---------------------
　・PPC450: Quad 850MHz PPC440 core with "Double Hummer" FP-APU
　・1 petaflops at 294,912-processor
　・up to 884,736-processor
　・optical rack-to-rack interconnect

671 ：MACオタ＠補足 [sage] ：2007/06/26(火) 22:35:03 ID:E+b+TZBO
とりあえず884,736-processorの最大構成で2-PetaFlopsわ超えるす。同じPPC44xベースの
コアが90nmバルクCMOSで2GHzを超えることが可能なことも証明されているすから(>>392参照)、
Blue Geneわ、このままの設計でも数年以内に5-PetaFlopsを超えるロードマップわ現実的す。

751:デフォルトの名無しさん
07/06/27 02:41:21
変なの沸きすぎ

752:・∀・）っ-○◎●
07/06/27 04:23:26
俺Vista x64で8600GTだけどDirectXしかねーべ？

753:デフォルトの名無しさん
07/06/27 05:29:45
Larrabeeってどうやって普及させるつもりなんだろうか。

754:デフォルトの名無しさん
07/06/27 11:13:19
最終的にはCPUと統合らしいから
普通に次世代CPUとしてでしょ。
何となくチップセットに内蔵してきそうな気もする。

っていうか、単体で出さないでしょ？ｗ
科学技術分野に出すかも知れないけど、普及版は統合かと

755:デフォルトの名無しさん
07/06/27 12:35:48
出るのは pcie gen 2 カードでだよ
価格は10万前後

756:デフォルトの名無しさん
07/06/27 15:31:56
つかストリームコンピューティングって市場がそもそもないだろ
せいぜい研究機関とか大学で細々と使われるぐらいで
結局ソフトウェアが無ければ普及しない

リアルタイムレイトレがGPUラスタライザを凌駕するとか真顔で言ってる奴がいるけど
ポリゴンとピクセルが1:1に限りなく近付くようになるならまだしも
法線マップとかのイメージスペース技法の発明でそんなことはこの先起こらない

757:デフォルトの名無しさん
07/06/27 16:43:33
GPUじゃないけど一番敷居が低いのはやっぱりCell?

758:536
07/06/27 16:56:17
>>757
思いっきり高い敷居を跨ぐ為に、誰もが俺様ライブラリを作っている状態ですが。

759:デフォルトの名無しさん
07/06/27 17:06:03
>>756
＞つかストリームコンピューティングって市場がそもそもないだろ

あるけど言わない。飯の種だから。
潜在的需要はいくらでもある。

＞リアルタイムレイトレがGPUラスタライザを凌駕するとか真顔で言ってる奴がいるけど
＞ポリゴンとピクセルが1:1に限りなく近付くようになるならまだしも

それ以外にも、レンダリングパスが多くなりすぎるケースや、
ラスタ処理では不可能な処理や、誤魔化していた処理、
そういった高レベルの処理を入れていくと、ラスタライザでは限界がある。
光源が増え、シャドーが幾何級数的に増加したら、従来のラスタライザではどうしようもなくなる。
最終的にはレイトレとラジオシティを組み合わせたものしか生き残れない。

760:デフォルトの名無しさん
07/06/27 18:14:04
>>759
> 潜在的需要はいくらでもある。

そりゃ潜在需要がなけりゃ誰も新規にストリームプロセッサに投資なんてしない
俺が言いたいのはGPUに対する3Dゲームのような決定的な市場があるのかってこと
詐欺まがいのソフト作って無知相手に売ってもせいぜい売り上げは数百～数千万円程度だろ

> 光源が増え、シャドーが幾何級数的に増加したら、
> 従来のラスタライザではどうしようもなくなる。

またまたご冗談を
勘違いしやすいがシャドーマップってのもコヒーレントレイだからな
ピクセル単位でシャドーレイ飛ばすのとシャドーマップ描画して参照するのとを比べれば
圧倒的に後者の方が効率的だし、そもそも光源数とシャドーの増加量に比例して
負荷も比例するのはレイトレも同じ
おまけにレイトレは動的シーンに致命的に弱い

俺はこの先もリアルタイム3DはGPUラスタライザで変態的テクニックを多用していくことに変わりないと考えるね
一次レイと一次シャドーレイだけで息切らしてるようなリアルタイムレイトレは期待できない

761:デフォルトの名無しさん
07/06/27 19:06:27
>>760

>そりゃ潜在需要がなけりゃ誰も新規にストリームプロセッサに投資なんてしない
>俺が言いたいのはGPUに対する3Dゲームのような決定的な市場があるのかってこと

それを教えてほしけりゃ自分で探しな～

>詐欺まがいのソフト作って無知相手に売ってもせいぜい売り上げは数百～数千万円程度だろ

確かに数億～数百億のプロジェクトを仕切っているあなたにはたいした額ではないですね～
でも会社としてはそういう態度で仕事に望まれると困るんですが・・・

つか通常のGPUで盛り上がっているし。
意見は貴重だけどよそでやってくれないかな～？

762:デフォルトの名無しさん
07/06/27 19:12:23
レイトレの話はさすがにスレ違いだけど、
「GPUに対する3Dゲームのような決定的な市場」があるのなら是非知りたいね。

763:デフォルトの名無しさん
07/06/27 19:36:03
言う気無いならがんばるなよ。言わなきゃ論証にならないんだからさ。

764:デフォルトの名無しさん
07/06/27 19:41:30
>763
誰に言ってるの？

765:536
07/06/27 20:15:23
少なくとも漏れの周りでは高速に演算したいと言う要求が色々ある。
「面倒だから1Uサーバ機を100台単位で並べろ」ってのから「4core2CPUは高いからなんとかならんか?」まで千差万別。
前者の場合でも、「1U機にGPU入れればラック筐体単位で節約できる可能性がある」となれば興味を示すだろう。
(他社のアクセラレータボードに較べて)安いことは充分刺激になっているよ。

766:デフォルトの名無しさん
07/06/27 21:57:15
スーパーコンピュータTop500、IBMが依然トップ。日本勢はトップ10圏外に
URLﾘﾝｸ(www.itmedia.co.jp)

プロセッサ別で見ると、Intelプロセッサ搭載システムが57.8％を占めた。
前回の52.5％よりもわずかに増えている。次に多かったのはAMDで21％、
前回の22.6％からは減少した。IBMのPowerプロセッサは17％だった。

また、デュアルコアプロセッサ搭載システムが増えており、
IntelのWoodcrest搭載システムは前回の31台から205台に、
デュアルコアOpteron搭載システムは75台から90台に拡大した。

767:デフォルトの名無しさん
07/06/27 23:16:43
>>760
＞ピクセル単位でシャドーレイ飛ばすのとシャドーマップ描画して参照するのとを比べれば

馬鹿じゃねーのか？シャドーレイなんて飛ばす必要ないぞ。

＞負荷も比例するのはレイトレも同じ

大雑把に、レイトレの負荷はピクセル数に比例する。
光源数やシャドーの数には影響されない。

＞おまけにレイトレは動的シーンに致命的に弱い

そりゃ今はレンダリング速度が遅いだけだ。
1/60秒で描画できるようになったら、逆転する。

768:デフォルトの名無しさん
07/06/27 23:29:10
シャドーｗｗｗｗｗｗｗｗｗ

769:デフォルトの名無しさん
07/06/27 23:34:49
そうなんだよね、折角「ラスタスキャンだとデータ量が増える」からとベクタデータになった処理が、
「解像度が上がるとベクタデータは級数的に増える」からと結局ラスタデータになったりしているしね。
尤も、今や8000x8000なんて画像のフィルタリング処理がオンメモリでできるからこそだけれども。

770:デフォルトの名無しさん
07/06/28 00:11:21
>>767
> シャドーレイなんて飛ばす必要ないぞ。

素人か？1次レイ飛ばすだけでは影は出来ないってのも分からんのか？
誰もラジオシティの話なんてしてねぇぞ

> 大雑把に、レイトレの負荷はピクセル数に比例する。
> 光源数やシャドーの数には影響されない。

レイトレの負荷が解像度に比例するのは当たり前
光源数が増加してもレイトレは計算量が変わらないとでも思っているのか？

確かにラスタライザはレイトレと比較すれば光源1個あたりのコストが高いが
現状最速のコヒーレントレイ技法であるDeferred Shadingを使えば
RTRTが可能なほど高速なハード上では、それ以上に高速に動く（＝より高い複雑度のシーンを扱える）

> 1/60秒で描画できるようになったら、逆転する。

ラスタライザが生成するコーヒレントレイの圧倒的な速度と効率性という前提がある以上
繰り返すがRTRTが可能なほど高速なハード上では、ラスタライザはより高速に動作する
インコヒーレントレイをレイトレで処理して他は通常通り高速にラスタライザで処理するなら分かるが
大方の研究者の云う通りレイトレそれ自体がラスタライザを消し去ることはあり得ない

771:デフォルトの名無しさん
07/06/28 00:13:13
レイトレーシングのスレはここですか？

772:デフォルトの名無しさん
07/06/28 00:41:58
いちおうGPGPUネタではある。

773:デフォルトの名無しさん
07/06/28 05:06:41
ヲタゲーCGはもうお腹一杯。
もっと単純に、天文物理の多体問題を解くみたいな
GRAPEや地球シミュレータとの比較で頼む。

774:デフォルトの名無しさん
07/06/28 07:00:51
Grapeは事実上の敗北宣言が出てたじゃん。
「価格辺り消費電力が大きい」とか微妙な逃げ口上つきで。

775:デフォルトの名無しさん
07/06/28 12:27:32
>>770
＞誰もラジオシティの話なんてしてねぇぞ

俺はしている。ラジオシティ使わずに、レイトレでソフトなライト処理は不可能だ。

776:デフォルトの名無しさん
07/06/28 12:46:31
>>770
＞RTRTが可能なほど高速なハード上では、それ以上に高速に動く（＝より高い複雑度のシーンを扱える）

とは限らない。
例えば、ラスタライザ型では膨大な量の半透明の処理を「完全」に正しく処理するのは非常に困難。
PowerVRのような方法を使えば完全にできるのだが、タイル(チャンク)を細かくしたらレイトレ型と同じだ。
第一、一次レイに限定していないし、それ以上で作られる品質をラスタライザ型で作るのは不可能。

ラスタライザ型で表現できる品質レベルで言えば、そりゃRTRTが可能なハードで上で、
それ以上に高速に動くのはあたりまえ。そんなことは小学生でもわかるわ。
人間が考えうる高品質の画像を作っていく上で、無限の計算力があるなら、
ラスタライズ型の処理なんてあり得ない。
所詮、計算力が十分になるまでの、その場しのぎ、誤魔化しの手法にすぎないんだよ。
RTRTが可能になれば、ラスタライザは死滅する。パレットによるタイリング手法が死滅したようにね。

777:デフォルトの名無しさん
07/06/28 13:48:46
非リアルタイムのアニメ映画でさえもRTはそれほど使われてないんだが・・・

778:デフォルトの名無しさん
07/06/28 14:45:23
とりあえずレイトレしなくてもいいからオフラインレンダラ並の
アンチエイリアスできるようになってから話しろよ

779:デフォルトの名無しさん
07/06/28 15:23:10
>>777
その通り
スキャンラインラスタライザは現在でも多数のオフラインCGで使用されている

まぁ>>776みたいな信者はオノレの信じたいことだけを信じる現実の見えない典型的な馬鹿だから
せいぜい海外の論文でも崇拝しながらRTRTをこのまま妄信し続けてもらいたいね

Larrabeeが出たら是非RTRTを実装してもらいたい
もっとも同時期の最新GPU上で動く最新デモの足元にも及ばんだろうが
品質の面でも解像度の面でもな

780:デフォルトの名無しさん
07/06/28 15:28:11
> 無限の計算力があるなら

この前提も妄想だな

そもそも現在の半導体のドミナントデザインたるCMOSは
20nmプロセス前後で限界を迎えるという事実をお忘れか？

781:デフォルトの名無しさん
07/06/28 16:02:26
>>780
忘れてないよ。でも、技術の発達により、膨大な計算量が扱える方向に進むのだから、
究極的にはどこを目指すかという点で、無限の計算力があるときどうなるかを考えることは無意味ではない。
３０年後のＣＰＵのスペックはどのレベルか考えてみるのもいい。
１００コア程度なら２０１０年前後で投入してくるだろうし。

782:デフォルトの名無しさん
07/06/28 16:07:50
>>779
＞品質の面でも解像度の面でもな

鏡面をもつ膨大な量の玉の映り込みを正確にレンダリングするのでも、
ポリゴンラスタライズ型が勝てるとでも思ってるの？
想定している品質や分野を意図的に制限すれば、そんなことはいくらでもいえる。

783:デフォルトの名無しさん
07/06/28 16:13:04
> 鏡面をもつ膨大な量の玉の映り込みを正確にレンダリングするのでも、
> ポリゴンラスタライズ型が勝てるとでも思ってるの？
> 想定している品質や分野を意図的に制限すれば、そんなことはいくらでもいえる。

「鏡面をもつ膨大な量の玉の映り込みを正確にレンダリングする」ことなんてのはまさに
「想定している品質や分野を意図的に制限す」ることだわな

自己矛盾にすら気付かん馬鹿ですね
相手するだけ時間の無駄か

784:デフォルトの名無しさん
07/06/28 16:24:45
だいだい反射や屈折等のインコヒーレントレイに関しては>>770で
「インコヒーレントレイをレイトレで処理して他は通常通り高速にラスタライザで処理するなら分かる」と言っているだろう

レイトレとラスタライザが「完全に」同調してレンダリングできる時点で
コヒーレントレイをレイトレで処理するなんてのは馬鹿馬鹿しいにも程がある

まさかとは思うが、コヒーレントレイに関してもレイトレがラスタライザより
高速に描画できるとでも思っているのか？

785:デフォルトの名無しさん
07/06/28 16:34:55
>>783
＞「想定している品質や分野を意図的に制限す」ることだわな

だから、それを言っているのだが。
矛盾ではなく、そういう例を出しているのが読めない馬鹿か？それとも意図的に誤読しているのか？
本気で俺が「制限すること」でないと思って書いていると思うなら、お前は読解力がない。

786:デフォルトの名無しさん
07/06/28 16:56:42
>>785
横レスだけどそんな皮相的な反応されても・・・

「意図的に制限すれば何とでもいえる」を批判の言葉として用いているということは、
「より制限の緩い、一般的な用途でRTの方が優秀である」という主張を内包している
としか思えないわけだけど、

「鏡面をもつ膨大な量の玉の映り込みを正確にレンダリングする」という、
これまた意図的に制限された状況を持ち出しているのが矛盾だということ。

という流れなんじゃない？

Ice Age のスタッフがRTサイコーって言ってたよとか、そういう実分野での応用に
ついて検証するしかないんじゃないかな。

787:デフォルトの名無しさん
07/06/28 17:20:19
>>786
＞「より制限の緩い、一般的な用途でRTの方が優秀である」という主張を内包している
＞としか思えないわけだけど、

そうではなく、膨大な計算量が使える環境で、
どのシーンにも使える究極の品質を目指すならＲＴ以外は論外って事。
ポリゴンラスタライズ型は、計算量が乏しい環境で、
上手く誤魔化す程度の品質においてアドバンテージがあるだけだ。

現状の計算機環境、要求品質でポリゴンラスタライズ型を否定しているわけではない。
が、そう遠くない将来、ＧＰＵもポリゴンラスタライズも死滅する。コプロがＣＰＵに取り込まれたように。

788:デフォルトの名無しさん
07/06/28 17:55:12
「膨大な計算量」を何に使うかはデザイナやアーティストが決めるんじゃないかな。

789:デフォルトの名無しさん
07/06/28 18:08:20
>>787
俺の質問に答えろよ
> まさかとは思うが、コヒーレントレイに関してもレイトレがラスタライザより
> 高速に描画できるとでも思っているのか？

一連のお前の発言からすると、コヒーレントレイはレイトレで描画してもラスタライザで描画しても
『数学的に完全に等価である』という大前提をお前は知らない/理解していないようだな

純粋に両者のアルゴリズムの本質(nature)により、コヒーレントレイの描画で
レイトレがラスタライザを速度で上回ることなど
（お前がいくら期待しようが）あり得はしないんだよ
あるとすれば、それは非本質的な部分がボトルネックになっているに過ぎない

ゆえにコヒーレントレイの描画でレイトレがラスタライザを駆逐することなど起こりはしない

お前の「そう遠くない将来、ＧＰＵもポリゴンラスタライズも死滅する」という主張は
全くもって希望的観測に基づいたドグマだ

重要なのはいかに同時期の市場情勢や需要に適合するかであって
シンプルで正確な技術が必ずしもスタンダードとはならないことは歴史が証明している

790:デフォルトの名無しさん
07/06/28 18:40:09
>>789
＞> まさかとは思うが、コヒーレントレイに関してもレイトレがラスタライザより
＞> 高速に描画できるとでも思っているのか？

だから、俺はそんなことは言ってないだろ。
コヒーレントレイに限るなら、想定している品質や分野を意図的に制限しているといっているだけだ。

＞シンプルで正確な技術が必ずしもスタンダードとはならないことは歴史が証明している

シンプルで正確な技術がどっちのことを言っているのか知らんが、
将来のポリゴンラスタライズについても同様のことが言えるな。

ＲＴＲＴのゲームも出てきていることだし、
ＣＰＵパワーの使い道としても俺はＲＴＲＴの今後の発展に期待する。
どっちが残るかなんて歴史が証明すればいいし、今拘る気はない。
ＧＰＵとラスタライズが死滅する方が新しい発展があって面白そうだから、
俺が勝手に思っているだけでいいよ。

791:デフォルトの名無しさん
07/06/28 18:45:20
URLﾘﾝｸ(www.hc.ic.i.u-tokyo.ac.jp)

792:デフォルトの名無しさん
07/06/28 19:52:56
GPUとラスタライザが死滅するほうが新しい発展があるって思える根拠に興味が

793:デフォルトの名無しさん
07/06/28 19:56:39
思ってるだけでいいならだらだらと書き下すなと

794:デフォルトの名無しさん
07/06/28 20:22:54
GPUの応用研究で食おうと思ってたらLarrabeeが出て人生オワタような必死さですね

795:デフォルトの名無しさん
07/06/28 20:29:52
別にLarrabeeなり、CPUベースのレイトレなり、新しいものに期待をかけるのはいいと思うが、
なぜ、チャレンジの芽を摘むような批判をぶつけるのだろう。

GPUがなくなるとかラスタライズが死滅するとかは妄想に過ぎんかもしれんが、
そこに新しい技術の種があるかもしれないのに。

本当に死滅するならそれはそれでいいし、死滅しないとしてもそういう別のベクトルが
頑張るのはいいことだと思うぞ。妄想が原動力ならそれでもいいじゃないか。

796:デフォルトの名無しさん
07/06/28 20:31:27
＞なぜ、チャレンジの芽を摘むような批判をぶつけるのだろう。

「Intel にとって良いことは、コンピュータ業界にとって良いことだ」から

797:デフォルトの名無しさん
07/06/28 20:34:42
>>795
2chで吠えてないで結果を出せってことだろ。

798:デフォルトの名無しさん
07/06/28 20:42:01
LarrabeeもTeslaもPCI-Eカードの時点で終わってる
CPUに統合されない限り可能性はない

799:デフォルトの名無しさん
07/06/28 20:56:15
今現在結果を出そうとすることすら叶わないLarrabeeへの皮肉ですか

800:デフォルトの名無しさん
07/06/28 21:10:20
このスレを一通り眺めて思ったこと。
CPUも互換性を考えなければすっげ早くなるのだろうか。

801:デフォルトの名無しさん
07/06/28 21:17:40
>>800
それなんてCell？

802:デフォルトの名無しさん
07/06/28 21:21:15
CPUに統合されても可能性はない

803:デフォルトの名無しさん
07/06/28 21:22:24
誰かが20nmの壁を書いていたけれど、それを忘れてないと書きつつ100コアとか書いちゃうのが信じられない。
そしてまさしくその壁と戦っている人達が、実際にGPGPUにもLarrabeeにも興味を持っているわけなのだが。

804:デフォルトの名無しさん
07/06/28 21:33:56
>>798
メモリ事情を考えろ
URLﾘﾝｸ(pc.watch.impress.co.jp)
URLﾘﾝｸ(media.arstechnica.com)

805:デフォルトの名無しさん
07/06/28 21:38:58
つか俺的には何FLOPSとかどうでもいいからメモリのレイテンシを改善しろと言いたい。
お前ら何年間横這いなんだよ、と。

806:デフォルトの名無しさん
07/06/28 21:58:53
>>805
急に言われてもメモリも困る。
ちゃんとプリフェッチされるようなコードを書けば良い。

807:デフォルトの名無しさん
07/06/28 22:07:50
コードについて以外のことについてぐだぐだ書くのはやめろよ。
板違いだ。

自作板にでもスレッド立ててやれば良いだろ。

808:デフォルトの名無しさん
07/06/28 22:14:10
>>807
最近多いよな
こういう多分野にまたがって統合的にものが考えられない奴

809:デフォルトの名無しさん
07/06/28 22:25:33
>>808
どっかのいいかげんなwebサイト仕込みのネタをの適当に口まねするのが
「総合的にものを考える」ことかよｗ　アホくさ。

810:デフォルトの名無しさん
07/06/28 23:49:45
スレのびすぎ

811:デフォルトの名無しさん
07/06/29 00:43:52
で、GPGPUで犬を洗えるようになるのか?

812:デフォルトの名無しさん
07/06/29 00:48:03
>>804
考えた
URLﾘﾝｸ(amb.sakura.ne.jp)

813:デフォルトの名無しさん
07/06/29 01:41:37
>>803
１００コアの話はインテルのロードマップのことだろ。あっちでは数百コアって書いてあったけど。

814:デフォルトの名無しさん
07/06/29 12:21:39
>>812
CSIが細くて笑った。

データの入りと出だけだから問題ないの･･･か？

815:・∀・）っ-○◎●
07/06/30 00:37:10
要するにNUMAでしょ
CPU間のCSIはコヒーレントバス的に使って、たまに他のノードのメモリにアクセスする感じでは。

816:デフォルトの名無しさん
07/06/30 12:03:02
ものすっごい初歩的な質問なのですが

for(int i=0;i<1024*1024;i++){
何か作業
}

の、何か作業をGPUに任せるのって
プログラム側からシェーダに対して
どういうコードを描けばいいのですか？Cgで

817:デフォルトの名無しさん
07/06/30 14:40:47
>>816
つ[cuda]

818:デフォルトの名無しさん
07/06/30 15:05:34
CUDA使えるGPUではないので無理です

ナニを読んだりググれば出てきますか？

819:デフォルトの名無しさん
07/06/30 15:58:30
Cgで普通のグラフィックのプログラム書いた経験はある？

820:デフォルトの名無しさん
07/06/30 16:19:54
今やろうとしているのが、まさにCgで普通のグラフィックプログラムやろうとしてるのですが
どうもわからなくて

はじめにどこ見ればいいですか？

821:デフォルトの名無しさん
07/06/30 16:33:15
>>820
まずは鏡を見て「俺はなんて馬鹿なんだろう」と気付くことから始めよう。

822:デフォルトの名無しさん
07/06/30 16:33:58
そうですね、バカだと思います

823:デフォルトの名無しさん
07/06/30 16:52:22
もう来ません＞＜

824:デフォルトの名無しさん
07/06/30 17:03:34
ぼくもやりたーい

　　　　　　　　　　　　　　　　　┌─┐
　　　　　　　　　　　　　　　　　｜も.｜
　　　　　　　　　　　　　　　　　｜う　|
　　　　　　　　　　　　　　　　　│来│
　　　　　　　　　　　　　　　　　│ね│
　　　　　　　　　　　　　　　　　│え .|
　　　　　　　　　　　　　　　　　│よ .|
　　　　　　ﾊﾞｶ　　　　ｺﾞﾙｧ　　│ !!.│
　　　　　　　　　　　　　　　　　└─┤　　　　ﾌﾟﾝﾌﾟﾝ
　　　　ヽ(`Д´)ﾉ　ヽ(`Д´)ﾉ　　(`Д´)ﾉ　　　（　`Д）
　　　　|￣￣￣|─|￣￣￣|─|￣￣￣|─□（ヽ┐U
～～　￣◎￣　　.￣◎￣　　￣◎￣　　 ◎－>┘◎

825:デフォルトの名無しさん
07/06/30 21:31:04
GPGPU.ORG

826:デフォルトの名無しさん
07/06/30 23:58:24
普通のグラフィックプログラムでループを1000回も回すことがあるのか
ちょっと興味あるな

827:デフォルトの名無しさん
07/07/01 01:37:45
1000回じゃなくて百万回では？

828:デフォルトの名無しさん
07/07/01 04:45:32
数百万ループって・・・
どんだけ広い空間を定義する気なんだ・・・

829:デフォルトの名無しさん
07/07/01 04:52:17
別に広さの問題ではないと思うけど

830:デフォルトの名無しさん
07/07/01 05:32:31
>>826
単に1024×1024のテクスチャの各ピクセルに対して同じ「何か作業」をしたいだけだろ

831:デフォルトの名無しさん
07/07/01 17:03:08
そんな低レベルというか基本中の基本のことを他人に聞く
ような神経が考えられない。ゆとりか？

832:デフォルトの名無しさん
07/07/01 21:10:16
基本中の基本は
どこを調べたら出てくるんですか＞＜

833:デフォルトの名無しさん
07/07/02 11:02:30
>>832
>825

834:デフォルトの名無しさん
07/07/02 16:33:11
ジャパニーズで教えてください＞＜

835:デフォルトの名無しさん
07/07/02 16:40:38
つ[excite翻訳]

836:デフォルトの名無しさん
07/07/02 17:10:10
英語読めないとかどんな低学歴…

837:デフォルトの名無しさん
07/07/02 19:29:34
NVIDIA最強
URLﾘﾝｸ(pc.watch.impress.co.jp)

838:デフォルトの名無しさん
07/07/02 19:35:27
>837
お前個人は貧弱だけどな

839:デフォルトの名無しさん
07/07/02 19:44:34
一人一人は小さな火だが

840:デフォルトの名無しさん
07/07/02 19:44:39
なんでわかった？

841:デフォルトの名無しさん
07/07/02 20:31:55
なんだよ、お前らみんな英語読んでやってるってのかよ！
このバカバカマンコ！！！！
お前らなんかチンコの皮をチャックに挟んでしんじゃえ！！！

早く、GPUでのプログラミング教えろよ！

842:デフォルトの名無しさん
07/07/02 21:44:38
英語が嫌ならDirect3Dの日本語ドキュメントとかでHLSLとか勉強して、それをグラフィックス以外の用途に使えばいいやん

843:デフォルトの名無しさん
07/07/02 23:32:53
ゲフォ8600とか買ってCUDAするのがよろしいかと

844:デフォルトの名無しさん
07/07/03 10:33:42
8600GTSなら3万弱、8600GTなら1万円台中頃かな。
最早CUDA以外を勧める理由がないよ。

845:デフォルトの名無しさん
07/07/03 12:59:22
CUDAで使えるjava処理系だせや>えぬびでぃあ

846:デフォルトの名無しさん
07/07/03 14:19:49
>>844
x64やVistaに対応していないし、しそうにもない現状を考慮してもか？
流石に痛すぎるだろ・・・。

847:デフォルトの名無しさん
07/07/03 14:35:40
>>846
需要があれば出すでしょ。現状、TeslaはLinuxをメインにしているようだからね。
#Linuxならx64もあるわけで。

848:デフォルトの名無しさん
07/07/03 21:52:20
>>837
AMD K10最強
URLﾘﾝｸ(www.amd.com)