【AMD】RadeonのGPGPUの整備を願うスレ【NVIDIA】at JISAKU
【AMD】RadeonのGPGPUの整備を願うスレ【NVIDIA】 - 暇つぶし2ch193:,,・´∀`・,,)っ-○○○
09/07/15 23:43:54 NzR5u4q0
GeForceとかRadeonは産廃以下だそうですよ

194:Socket774
09/07/15 23:57:23 7RVI3hic
おや、団子が壊れるなんて珍しい。

195:,,・´∀`・,,)っ-○○○
09/07/15 23:59:59 NzR5u4q0
ゲームに使えないし(笑)

CAPCOMもLarrabee向けにエンジン作ってるってさ(笑)

196:,,・´∀`・,,)っ-○○○
09/07/16 00:05:07 NzR5u4q0
ゲームに使える液晶モニタのドットピッチはほとんど頭打ちだし、
GPU需要も今後はプログラマビリティ重視路線しか活路無いよ。
Crysis(笑)以降キラータイトル不在のこんな世の中じゃ

197:Socket774
09/07/16 00:47:38 dbvG12xs
壊れてるのは初めからだったか。

198:Socket774
09/07/16 05:01:17 FZrXfryf
>>193
馬鹿!逆だ。
ゲームに「しか」使えないGPU。

汎用目的の"GP"GPUに一番近いのは…?

199:ラデ厨 ◆TX.Dz2qTUo
09/07/16 23:44:16 TFp3EAHy
ラデは蚊帳の外だね(・´ω`・)

200:,,・´∀`・,,)っ-○○○
09/07/17 05:33:44 4WChRZYl
だからさ、汎用物理エンジン使ってもろくにパフォーマンスでねーGPUなんて今後ゲームにすら使えねーって
Aero Glassを超高解像度で動かすくらいしか使い道ねえ

201:Socket774
09/07/17 05:39:44 Ft32otgm
まPPU(58gflops)と9600GT(312gflops)が実パフォーマンス同等だし

202:,,・´∀`・,,)っ-○○○
09/07/17 05:44:58 4WChRZYl
まあ現行のGeForceもRadeon目糞と鼻糞の差でしかないよ

ストリームプロセッサ向けプログラミングインターフェイスの本命は
CUDAでもBrook+/CALでもOpenCLでもない。
「x86 ISA」だ。
AMDがIntel AVX互換路線にシフトした時点で、ほぼ決まった。

NVIDIAが今更x86の研究開発してる意味よく考えてね

203:Socket774
09/07/17 06:39:55 Ft32otgm
まnvがx86出せるかどうか以前に、会社が存続出来るのかが問題だ

204:Socket774
09/07/17 09:24:04 f2a584IP
AMDもLarrabeeみたいなのを作らないの?

205:Socket774
09/07/17 09:33:48 Tlm2CviY
お前一昨年の世界からやって来たのかよ

206:Socket774
09/07/17 10:38:36 0r6y+x25
Larrabeeって見る度にワラビーを思い浮かべる

207:Socket774
09/07/17 12:39:31 NBIQkBag
ミニカンガルー?

208:ラデ厨 ◆TX.Dz2qTUo
09/07/20 20:00:00 6JX3s7uT
アムダはいつまで経ってもIntel頼りから脱却できないんだね(・´ω`・)

209:,,・´∀`・,,)っ-○○○
09/07/20 21:06:31 X2wjyZMb
Intelにそっぽ向かれてピンチの脳タリンVIDIA(藁

210:ラデ厨 ◆TX.Dz2qTUo
09/07/22 08:38:29 fuaPOEnT
脳タリンに遥かに劣るアムダは先天性のいけぬまなのかね(・´ω`・)

211:Socket774
09/07/22 18:32:00 UICqnX6z
Solarisのドライバ無いの?

212:ラデ厨 ◆TX.Dz2qTUo
09/07/23 20:00:27 3lz884+X
Streamは話にならないね(・´ω`・)

213:Socket774
09/07/25 09:21:41 u1CFHFr3
age

214:Socket774
09/07/25 09:35:16 7Xg2iV7E
gglの3D新技術はIntelとNvidiaのGPU
しか動作しないようだ。googleのエンジニアが
オープンに議論しようといっても
AMDは何もしようとしなかったのが原因らしい

215:ラデ厨 ◆TX.Dz2qTUo
09/07/25 20:11:44 hBXLnwzh
巨人Googleにも見捨てられてお先真っ暗だね(・´ω`・)

216:Socket774
09/07/26 04:12:09 tL49230/
まじめな話、RADEONでCUDAが動くMODドライバ出して欲しい。
そういう話あったけど、開発進んでないのかね?

217:Socket774
09/07/26 04:26:20 9+1UcLEV
Larrabeeはさっさと特殊用途向け物理演算ボードと改称すべき。

218:ラデ厨 ◆TX.Dz2qTUo
09/07/26 21:17:45 1aRk+Fck
ラデでCUDAをやっても遅すぎて使い物にならないね(・´ω`・)

219:Socket774
09/07/27 12:43:27 Lv2fwxnL
>>218
ラデ用に作られたわけでもラデに最適化されてるわけもないんだ、当然だろ。
何言ってるか自分でわかってるか? 相変わらずなやつだw

220:ラデ厨 ◆TX.Dz2qTUo
09/07/27 21:30:51 rsdNjhSa
>>216をよく読みたまえ(・´ω`・)

221:Socket774
09/07/28 03:07:53 biGkgLFN
結局のところ実用できるレベルのMODドライバ出ているわけではないし
CUDA自体もわざわざ他社のRadeonにも最適化しやすくnVidiaが作るわけもないよな?
例えるならDirectX向けに作ったコードがOpenGLでは使い物にならないね
とか言ってるようなもので至極当然のことだと思うが?

仮想化とかと同じで構造などの違うものを別のプラットフォーム上で
それ以上の速度で動かせることの方が稀だ。
もしそれが適うとしたら最初からそのターゲットに合わせて作っている場合か
それ以上に画期的な技術だった場合くらいだろう。

というかどのスレでも貶すばかりで
ここでも整備を願う気も全く無いんだろうから他所逝けよ。

222:Socket774
09/07/28 04:10:47 bzlA/Sxe
>>214は馬鹿?
AMDとnVIDIAは方向性が違う
Windows以外でPCゲームがやれるなら重要だが、Googleのは動画とwebを見るだけノートPC向き
GoogleOSでdirectXを使えるなら話は別だが、そんな話は聞いた事が無い

223:ラデ厨 ◆TX.Dz2qTUo
09/07/28 21:59:00 zeos3b76
馬鹿はおまいだ(・´ω`・)

224:,,・´∀`・,,)っ-○○○
09/07/28 22:08:05 0lksF9Ir
ライトユーザーの大半はWebとメールさえできればいいから
スマートフォンはPC市場を侵食していくだろうよ

225:ラデ厨 ◆TX.Dz2qTUo
09/07/30 20:48:46 Zr0HAJqX
Tegraに対抗する術のないアムダは終わるだけだね(・´ω`・)

226:Socket774
09/07/31 00:01:47 aGG/7DyS
元々AMDはそこまでモバイル重視してないじゃない。
TegraでGPGPUなんて考えてるとしたらTPO癌無視だし。
いつまでスレチな的外れ続けるんだもまえら。

227:Socket774
09/07/31 00:05:40 Vv1PNk5U
(・´ω`・)←これってどっちが目なの?

228:Socket774
09/07/31 01:22:55 w8up04Cw
"(" ")" これじゃね?

229:Socket774
09/08/01 13:08:44 CO60itEW
URLリンク(developer.amd.com)

230:Socket774
09/08/01 17:24:43 thwoY2iq
1.4から一気に2.0か。でも相変わらずβは取れてないんだな

231:ラデ厨 ◆TX.Dz2qTUo
09/08/01 22:00:30 RmCHaQ8h
永遠のβ版だね(・´ω`・)

232:ラデ厨 ◆TX.Dz2qTUo
09/08/03 21:43:46 FFGk5pDx
時代に乗り遅れているね(・´ω`・)

233:ラデ厨 ◆TX.Dz2qTUo
09/08/04 21:26:14 nq7kBZNG
いつになったら使い物になるのやら(・´ω`・)

234:Socket774
09/08/05 19:10:38 IyjDL0Ow
ATI Stream Software Development Kit (SDK) v2.0 Beta Program
URLリンク(developer.amd.com)

What’s New in v2.0-beta2

The OpenCL? 1.0 conformance logs from this release have been submitted to the Khronos OpenCL? Working Group
Several bug fixes and optimizations
Brook+ is now available on SourceForge: URLリンク(sourceforge.net)

235:Socket774
09/08/05 19:24:01 EgWxRYZq
5. When will the ATI Stream SDK v2.0-beta2 with OpenCL 1.0 GPU support be shipped?

The GPU version of OpenCL to be bundled with the ATI Stream SDK is scheduled to be
available later in Q3 of 2009.

6. When will the first production version be shipped?

The first production release of the ATI Stream SDK v2.0 with OpenCL 1.0 support is
scheduled to be available in Q4 of 2009.

8. What GPUs does the ATI Stream SDK v2.0-beta2 with OpenCL 1.0 support work on?

The CPU component of OpenCL that is bundled with the ATI Stream SDK does not make
use of GPU acceleration. The exact list of compatible GPUs for the GPU component of
OpenCL to be bundled with the ATI Stream SDK will be provided when that release is made
available.

236:Socket774
09/08/05 19:29:32 ntN7RX7t
ラデ厨◆TX.Dz2qTUo(アスペル在日)のプロフィール
URLリンク(hissi.org)
Rb.XJ8VXow ID:AHOnx3kM
●テヘ権田●=(・´ω`・)アム厨 ◆Fh2IQtNvbw、(・´ω`・)ラデ厨 ◆TX.Dz2qTUo、雑音(録音)
Z、Zセンセイ、Z坊、劇団ひとり、NOD厨、三休ぼうず、犬畜生、負け虫、That'On

自称:自営業プログラマー、50歳過ぎ、 年収5000万(単位:レス)、子供は小4の少女が一人との事。
プログラム作成に使用するPCはP4 3.06(オーバークロックして使用との事)50万円(構成は言えない模様)だそうです。
ちなみにローマ字入力・タッチタイピングは出来ず、カナ打ちだそうです。
また「503です ◆2rKzobetks」や「北森厨 ◆5Gsd5WS6Yo」「おいらAMD厨 ◆kd.2f.1cKc」「アンチNOD厨嫌い ◆Tcp44q2AKA」「◆1V4CaE0ZHE」
「ジーパンは503です ◆lFzd5ORXqk」「◆glMbhmKgoA」他の名前を使うことも有ります。
普通に自作自演を仕掛けてきますが、その際には名無しにてダイアルアップや携帯、
串を駆使してIDを替え自作自演にてスレッドを混乱に落としいれる事を得意技とします。

主にAMD叩きや、NOD32及びPestPatrol以外のセキュリティソフトを叩くことを好む。

近年の雑音はセキュリティ板においては「基地外」「500」「バスター厨」「相模原」と言った言葉を多用して板を荒らし、
「劇団ひとり・雑音・Z・Z先生・NOD厨など」はそれぞれ別人でウイルスバスター使いであると主張したり、
自治議論のスレを装った工作スレを乱立させたりしています。

興味のある方は、雑音犬畜生負け虫劇団ひとりを突付き回して遊ぶことで日頃仕事で溜まったストレスの
発散にでも役立ててください。

Wiki
URLリンク(l-lab.org)
(2004年12月26日復活したものの2005年07月20日消滅。L ◆eruX6eXBcA氏今までどうもありがとう。)

プレス子スレにてSIMMとSIMDの勘違いをした決定的瞬間のログ(雑音が”録音”と呼ばれていた時代のログ)
URLリンク(z-temp.hp.infoseek.co.jp)
【NOD32】雑音犬畜生Part42【Pentium4】
スレリンク(tubo板)

237:ラデ厨 ◆TX.Dz2qTUo
09/08/05 20:58:39 nxmyM8On
コピペはいらんよ(・´ω`・)

238:Socket774
09/08/05 21:58:54 c85uiSEU
在日かよ、どおりで。

239:ラデ厨 ◆TX.Dz2qTUo
09/08/06 23:44:23 /hj6n8yX
自演かね(・´ω`・)

240:アム厨 ◆Fh2IQtNvbw
09/08/06 23:50:05 LrI9H0et
>>1
あきらめてください(・´ω`・)

241:Socket774
09/08/08 00:51:34 0r3PC6sb
AMD+nVidiaの黄金コンビ復活、キボンヌ。
Linuxや*BSDでは、これが一番性能出るのに。

242:Socket774
09/08/08 08:15:58 kO8ZLivY
性能が出るっていうか、
単純にドライバ開発に積極的って話だろうがね
つまり同じ動作をWindowsですればもっとry

243:ラデ厨 ◆TX.Dz2qTUo
09/08/10 19:53:27 i/fHwOvj
窓ベッタリなラデはオープンソースの考えに不適格だね(・´ω`・)

244:Socket774
09/08/10 21:55:02 Z/S/FE/4
お前らは、この板にベッタリだけどな。


245:ラデ厨 ◆TX.Dz2qTUo
09/08/14 20:56:20 NpWMIU6M
君もね(・´ω`・)

246:Socket774
09/08/15 22:28:20 m4KsTT9h
グプグプ対応高速エンコウェアと編集ソフトが一体化したのはスーパーロリロリだけ?
一択なら迷わなくて良いとも言えるけど・・・

247:ラデ厨 ◆TX.Dz2qTUo
09/08/18 23:06:06 upeHK4Bh
ハードがGPGPUに適していなければ如何なるソフトを用いても残念な結果に終わるね(・´ω`・)

248:Socket774
09/08/21 20:25:40 Xz3Lma1c
GPGPUに対応してないのはIntelだけだろ。
他はみんなDx10には対応済みだし。


249:,,・´∀`・,,)っ-○○○
09/08/21 20:29:57 3/Urk3WQ
GMAでCPUの代わりやらせて楽しいか?
クアッドコア買ってくれって思惑だろ。
Intelにはx86でないGPUで汎用処理をさせる気はないし
それはそれでい私企業の理念としては正しい。


250:Socket774
09/08/21 20:32:01 PJOgA4U5
URLリンク(software.intel.com)
Intel Media SDK

なんかinstall失敗する

251:,,・´∀`・,,)っ-○○○
09/08/21 20:43:17 3/Urk3WQ
事実上の一般向けLarrabee SDKだなこれ

252:,,・´∀`・,,)っ-○○○
09/08/22 16:54:30 0OTlWjEk
Radeon 5xxxは最大350Wなんだなw
馬鹿なの?死ぬの?

253:Socket774
09/08/22 16:59:29 UyFXdBSN
そうなの?

254:ラデ厨 ◆TX.Dz2qTUo
09/08/22 23:32:13 hV+kPx2X
ラデは電子レンジの領域に突入するね(・´ω`・)

255:Socket774
09/08/22 23:42:01 MbbBXcDy
ところでGT300やLarrabeeが来年頭に仲良く出棺する件について

256:,,・´∀`・,,)っ-○○○
09/08/23 00:13:26 oXzAxgqB
300W超えコースはDameonだけだろ


257:Socket774
09/08/23 01:28:25 watR6vni
ところでLarrabeeがTDP300W超え確実な件について

258:Socket774
09/08/23 01:56:37 PTEptOx1
ATI Streamって実際速いの?

259:Socket774
09/08/23 04:13:13 eCwbt8ha
350WってX2(Hemlock)だかX3(Trillian)だろ?

てか、Gt300やlarrabeeって本当に出てくるの?

260:Socket774
09/08/23 09:54:30 1TqyWriV
Gt300は来年春、ララビーは再来年登場。
もちろんハイエンドからの投入で10万円程度の値段。
ミドル以下は未定だが更に半年遅れ位だろうね。

261:,,・´∀`・,,)っ-○○○
09/08/23 09:56:53 oXzAxgqB
2010上半期って言ってるのに何を恐れてるの?

262:Socket774
09/08/23 10:21:48 watR6vni
いやぁほんとに出るのかぁ?ららびぃは
また延期なんでしょ?

263:Socket774
09/08/23 10:30:43 eCwbt8ha
1社に楽な商売されると困るんで、ぜひ出てもらわないと困る
それでも1年近く間開くのか・・

264:,,・´∀`・,,)っ-○○○
09/08/23 10:42:03 oXzAxgqB
シリコンのお披露目すらしてないDameonこそ大丈夫なの?


265:Socket774
09/08/23 11:12:55 watR6vni
エバグリって9月か10月に販売開始するでしょ

そしてららびぃとGT300は仲良く延期?

266:Socket774
09/08/23 11:19:03 watR6vni
6月30日は上半期?

267:,,・´∀`・,,)っ-○○○
09/08/23 11:20:21 oXzAxgqB
君は「early 2010」は6/30って訳するんだね



268:Socket774
09/08/23 11:21:17 watR6vni
じゃあ6/29か

269:,,・´∀`・,,)っ-○○○
09/08/23 11:28:38 oXzAxgqB
なんにせよ、Bulldozerだから事実上IntelのWestmere/SandyBridgeユーザー相手に商売することになるわけだな、何れの陣営も。
ハイエンドGPUに拘る人間が45nmプロセス止まりのAMDのCPUを選ぶ理由無くなるからな。


270:,,・´∀`・,,)っ-○○○
09/08/23 11:29:30 oXzAxgqB
×Bulldozerだから
○Bulldozerが延期決まってあの有様だから

271:Socket774
09/08/23 11:53:58 eCwbt8ha
つまり45nmのGPUを選ぶ理由はないと

272:Socket774
09/08/23 12:09:58 watR6vni
団子はEvergreenのどのクラスを買うの?

273:Socket774
09/08/23 12:13:34 watR6vni
団子はDirectX Compute Shaderを弄ったりする予定ないの?

274:,,・´∀`・,,)っ-○○○
09/08/23 12:19:21 oXzAxgqB
リークだだ漏れの40よりは、CoreMAやAtomで実績を積んで減価償却も終わってるHKMGの45のほうが安心かもね

>>272
電源のことかとオモタ

GPGPUとしては魅力無いな。
俺としてはゲームやるってよりはぶっちゃけ自前で汎用エンジン書きたい。
そっち系の開発者やってるの知ってるだろ?


275:Socket774
09/08/23 12:29:38 watR6vni
そうか

団子はクラウドコンピューティングについてどう思う?

MSはそのことに本気で取組むと思う?

276:,,・´∀`・,,)っ-○○○
09/08/23 12:39:41 oXzAxgqB
クラウドはMSが率先ってよりは仕方なくやってるイメージがある。
あの会社の主な収入源ってWindowsとオフラインのOfficeだぜ。
率先して自分たちの収益削る意味がない。

結局の所Google対抗だからね。
限りない消耗戦の末、どうやって収益に繋げるのか、まったくビジョンが見えない。


277:Socket774
09/08/23 18:45:10 9lfqKVSE
>>276
Officeはオンライン化するし、WindowsさえAzureでオンライン化するやんか


278:,,・´∀`・,,)っ-○○○
09/08/23 18:51:22 oXzAxgqB
だからそれ自体がGoogleなんかの対抗で顧客逃さないためにしぶしぶやってることなんだって。
オフラインのOfficeで十分稼げてるのにオンライン化するメリットある?ないよ。

279:Socket774
09/08/23 21:17:15 Yuvi20aL
しぶしぶやってると思い込んでるだけ

280:,,・´∀`・,,)っ-○○○
09/08/23 22:16:13 oXzAxgqB
お前が鈍感なだけだ。
Googleという目の上のたんこぶを潰す目的でなければクラウドなんてやる理由はない。

10年前くらいから言われてたことだ。
IBM(ハード)がコンピュータ市場の支配権をMS(ソフト)に取られたように
今度はMSは「ネット」という第三極に市場を奪われると。

その第三極を担ってるのはGoogleなわけで。
MSが万年赤字のネット部門の赤字を更に拡大させてまでYahooと提携してGoogleに挑もうとしてる
MSはもう必死だよ

Google Appsで十分って事になっちゃうとMSはオフィス売れない。


281:,,・´∀`・,,)っ-○○○
09/08/23 22:23:05 oXzAxgqB
動機が後ろ向きって意味では壊滅が近づいてるディスクリートGPUにおけるGPGPUと似たものがある。


282:Socket774
09/08/23 22:54:21 skcDC+DD
団子ww結局それが言いたかったんだろww
なんてカワイイやつだ

283:Socket774
09/08/23 23:04:00 watR6vni
ディスクリートは5年後くらいに無くなり、それと同時にNVIDIAも無くなると予想

284:Socket774
09/08/24 04:02:33 xlzucE4J
2年じゃね

285:Socket774
09/08/24 08:06:58 qEHze7Gp
ディスクリートなくなるとかあり得んからw

286:Socket774
09/08/24 09:25:52 3TYXRG56
消費電力、ダイサイズが年毎に肥大化している現状では考えられないね。

287:ラデ厨 ◆TX.Dz2qTUo
09/08/25 22:18:22 PfNT18RT
>>283
ねーよ(・´ω`・)

288:,,・´∀`・,,)っ-○○○
09/08/25 22:27:33 PfXExxoV
No VIsion, DIe-Away

289:Socket774
09/08/25 22:34:47 vZ6P/3yO
うまいこと言ったと思ってるだろ?

290:Socket774
09/08/26 23:17:56 lLI6vPeg
よくこんな話題であつくなれるなぁ


291:Socket774
09/08/27 08:53:43 WfhG+vAj
A:ATiはGPGPU未対応?
B未対応だな

って言われてもしょうがないレベル

292:Socket774
09/08/27 19:06:51 QamlGYfC
A:GPGPUって使いものになるの?
B:使いものにならない

って言われてもしょうがないレベル

293:Socket774
09/08/27 19:25:01 jRfa7Qgd
レートを3Mbpsくらいに取れば使えない事もないがな・・・
とにかく入力フォーマットが少なすぎて

294:アム厨 ◆Fh2IQtNvbw
09/08/27 20:24:48 bgf6ftMJ
RadeonがGeFoce並みにかしこければ買ってもいいんだがな(・´ω`・)

295:Socket774
09/08/27 20:52:26 +7Cys7cs
GPGPUぜんぜん普及してないな
一般人に浸透してないな壊滅的に

296:Socket774
09/08/27 23:08:21 UZ2rfpAr
そりゃAPIと開発環境にまず問題があるからなぁ
CUDAやATIStreamじゃ普及するわけが無い。
Compute ShaderとOpenCLが登場するこれからでしょ。

それとAMDは最近、UVDの機能もGPGPUの機能として扱うように方針転換した。
今までUBDは、動画再生支援や画質向上専用の機能としてGPGPUとは別枠扱い
だったが、ユーザーが演算機能として使えるようにする方針らしい


297:Socket774
09/08/28 03:33:10 ywfjtifw
それでもNL meansフィルタとかはCPUより相当速いけどね

298:Socket774
09/08/28 10:06:06 QgSoP0Kz
そもそも一般人が並列コンピューティングを使う機会が無いだろ
CG関係かエンコ関係、あとは解析とかだろ
3DCG関係でV-RayがCUDA(OpenCL予定)対応で糞早いレンダ可能に

299:Socket774
09/08/28 12:42:24 Dy/Q23GJ
ATiが潰れて、nRAGEが登場する。


300:Socket774
09/08/28 18:23:30 kFG3iGYc
>>298
Win7のWindows Media Centerは、動画を出力デバイスに合わせて自動でエンコする。
その時にGPUを使ってる

301:ラデ厨 ◆TX.Dz2qTUo
09/08/28 21:29:37 yvMQfBe3
コンピュートなんちゃらとOpenCLはCUDAの下位規格みたいなもんだね(・´ω`・)

302:Socket774
09/08/29 19:37:41 rS619FjJ
>>297
一般人がNL meansを必要とする場面が無い
SSEに最適化されたLancozやSpline実装で十分

303:Socket774
09/08/29 19:53:06 vlp0JeNk
>>302
Blu-rayならともかく、地デジだとノイズが酷いから必須ですが

304:Socket774
09/08/30 00:14:08 lSLtFBtb
つか殆どの局がアプコンだからな
その時にリンギングが出たりクロスカラーが出たり酷いことになるから
アプコンしなくなったら必要なくなるが
DVDは当分なくならないからそれを放送する場合アプコンせざるを得ない
つまりNL meansはこの先もずっと必要だし
パワーが上がるほどに実用的になって必要性が増す

305:ラデ厨 ◆TX.Dz2qTUo
09/08/30 21:06:52 Eh3di1Of
ラデのアプコンはボケボケで使い物にならないね(・´ω`・)

306:ラデ厨 ◆TX.Dz2qTUo
09/09/01 21:24:39 yKX5pPrZ
アチストリームは信徒の希望と願望で動いているね(・´ω`・)

307:ラデ厨 ◆TX.Dz2qTUo
09/09/03 22:14:00 LaTjskGK
DirectComputeでも惨敗が推測されるね(・´ω`・)

308:Socket774
09/09/04 03:09:49 bf/yqDxS
                                          (巛ミ彡ミ彡ミ彡ミ彡ミ彡)ミ彡ミ彡)ミ彡)
                                            ,,从.ノ巛ミ    彡ミ彡)ミ彡ミ彡ミ彡)ミ彡)''"
                                      人ノ゙ ⌒ヽ         彡ミ彡)ミ彡)ミ彡)'
                                ,,..、;;:~''"゙゙       )  从    ミ彡ミ彡)ミ彡,,)
                       ,,..、;;:~-:''"゙⌒゙         (・´ω`・)   ⌒ヽ     ミ彡"
       | ̄P━━━|::::::゙:゙                    '"゙        ミ彡)彡''"
        /  \   ( ゚д゚)つ┃``゙⌒`゙"''~-、:;;,_              )   彡,,ノ彡~''"
      | ̄ ̄ ̄|                   ゙⌒`゙"''~-、,,     ,,彡⌒''~''"
      | エア   |                           "⌒''~"
      | ダスター|        
      |   . |        
      |   . |        
      |___| 

309:ラデ厨 ◆TX.Dz2qTUo
09/09/06 22:11:38 eXebE7Tr
オイラに何をしようがラデがGPGPUでお話にならない現実は如何ともし難いね(・´ω`・)

310:ラデ厨 ◆TX.Dz2qTUo
09/09/07 23:14:10 BIznqvla
CUDAの躍進の前に為す術無しかね(・´ω`・)

311:,,・´∀`・,,)っ-○○○
09/09/07 23:26:51 p0YR0AuF
地上スレスレ1mのところを超低空飛行してるのがほんの10cm高度上がったのが躍進っていうならそうかもな

312:Socket774
09/09/07 23:38:09 5syM1+fI
ダンゴのおっさん
こんなところにも顔出すんだな

313:ラデ厨 ◆TX.Dz2qTUo
09/09/08 23:55:08 N/lpsWuY
団子氏は技術話が無いと死んでしまう体質だね(・´ω`・)

314:,,・´∀`・,,)っ-○○○
09/09/09 00:06:38 ujnD+adE
                                             (巛ミ彡ミ彡ミ彡ミ彡ミ彡)ミ彡ミ彡)ミ彡)
                                              ,,从.ノ巛ミ    彡ミ彡)ミ彡ミ彡ミ彡)ミ彡)''"
                                       人ノ゙ ⌒ヽ         彡ミ彡)ミ彡)ミ彡)'
                                ,,..、;;:~''"゙゙       )  从    ミ彡ミ彡)ミ彡,,)
                         ,,..、;;:~-:''"゙⌒゙         (・´ω`・)   ⌒ヽ     ミ彡"
       | ̄P━━━━━|::::::゙:゙                    '"゙        ミ彡)彡''"
        /  \,,・´∀`・,,)っ-○○○┃``゙⌒`゙"''~-、:;;,_              )   彡,,ノ彡~''"
      | ̄ ̄ ̄|                      ゙⌒`゙"''~-、,,     ,,彡⌒''~''"
      | エア   |                              "⌒''~"
      | ダスター|        
      |   . |        
      |   . |        
      |___| 

315:ラデ厨 ◆TX.Dz2qTUo
09/09/10 21:05:41 WcK3huri
効かんわ(・´ω`・)

316:Socket774
09/09/10 23:04:30 10E2232Y
>>314
だんごのおっさんOpenCLで遊んでる?
なんか計算問題くれよ

317:,,・´∀`・,,)っ-○○○
09/09/10 23:11:42 NYMGAvzW
Larrabee Prototype LibraryとIntel謹製シミュレータで遊んでるよ

318:ラデ厨 ◆TX.Dz2qTUo
09/09/11 23:54:58 Rdgl+0d5
もの好きだね(・´ω`・)

319:Socket774
09/09/12 06:43:03 XdcovKn/
2.6GFLOPSワロタw

もうnVidia用済みだわ

320:Socket774
09/09/12 14:05:26 qC62DcD1
テラとギガは間違える人多いな。通じるけど。
俺も何度か間違えたことある

321:,,・´∀`・,,)っ-○○○
09/09/12 14:37:25 j3WuhvmV
あながち間違いでもないと思う

>ATI StreamSDK 2.0 beta(Windows, CPU 利用)の
>OpenCL 実装だと、8 秒近くもかかってとてつもなく遅い!
>(SnowLeopard だと 0.0001 秒なのに…)
URLリンク(lucille.atso-net.jp)



322:Socket774
09/09/12 14:46:51 XdcovKn/
普通にCPU使ってんでしょそれ

323:,,・´∀`・,,)っ-○○○
09/09/12 14:48:52 j3WuhvmV
GPUだと動きすらしないんだよ


324:Socket774
09/09/12 14:54:48 bs/yDbJ/
Atom + GMAで3Dゲームやるようなもんだな

325:,,・´∀`・,,)っ-○○○
09/09/12 14:57:25 j3WuhvmV
「CPUを含めたあらゆる並列コンピュータ包括する言語・フレームワーク」としてのOpenCLは
AMDがこの程度の開発力じゃ事実上終わったと考えていい

AppleはMac以外のプラットフォーム向けのSDKは出さないだろうし
IntelはCPUとLarrabeeで透過的に使えるフレームワークは独自に開発してるからな

326:Socket774
09/09/12 19:23:22 Art6QZod
ATI StreamSDK 2.0 betaってllvmベースだよね。
ここまで遅くなる方が不思議

327:,,・´∀`・,,)っ-○○○
09/09/12 19:31:59 j3WuhvmV
そもそも1.0を正式リリースすらしてないのに2.0とか

328:Socket774
09/09/12 20:33:20 +TJRfM6c
だが待ってほしい
AMDがOpenCLのHavok clothでデモやったとき
CPUじゃ3体でGPUではたったの1体しか動かさなかったんだぜ
intel native cpuは20体以上だが・・

AMDがこの先生きのこるには・・

329:Socket774
09/09/12 20:36:59 +TJRfM6c
8秒と0.0001秒だと8万倍か

330:,,・´∀`・,,)っ-○○○
09/09/12 20:37:51 j3WuhvmV
>>319の2.6GFLOPSってのは正しいのかもな

331:Socket774
09/09/12 21:08:32 +TJRfM6c
先日のHD5800系(?)のデモの際も
いわゆるGPGPU系のデモはしなかった
nvに対抗するなら、先ずやらなきゃいかんところだと思うのだが
DXCSもポスト処理の被写深度
Havokはもとより、OpenCL系のデモもなし

OpenCL Havokの完成版は無しだな、また

332:Socket774
09/09/12 21:33:51 CHq1aTrD
それにしちゃあIntelから何も発表ありませんね
また順調に延期かな

333:Socket774
09/09/12 21:46:01 +TJRfM6c
URLリンク(news.ati-forum.de)
URLリンク(news.ati-forum.de)
URLリンク(news.ati-forum.de)

ブリタイ艦

334:Socket774
09/09/12 21:47:26 3j8oBx1Z
20cmもあるとケースに入らないのだが?


335:Socket774
09/09/12 21:50:50 usK0KJw7
<$400で$399で販売かw

336:Socket774
09/09/13 00:23:11 JTllPFbK
記念かきこ

601 :,,・´∀`・,,)っ-●◎○ [sage] :2009/02/06(金) 07:50:39 ID:36Q+eCpY
もうLarrabeeの(silicon)サンプルはDreamworksで評価されてるようだが

337:ラデ厨 ◆TX.Dz2qTUo
09/09/13 18:57:37 s/EbxZMl
アチストリームの無能さがアムダー期待のOpenCLで暴かれたとは皮肉だね(・´ω`・)

338:ラデ厨 ◆TX.Dz2qTUo
09/09/15 01:25:58 3O0i139J
80000倍遅いのはもはやギネス級だね(・´ω`・)

339:Socket774
09/09/16 12:35:01 pc+/E4mn
早とちりだったみたいだね

340:ラデ厨 ◆TX.Dz2qTUo
09/09/16 20:59:59 0iMJaiAW
エバグリは実測1GFLOPS出るかどうか怪しいもんだね(・´ω`・)

341:Socket774
09/09/17 01:17:04 H7o0PtLu
>>そもそも1.0を正式リリースすらしてないのに2.0とか

それはな……実はOpenCLは実用レベルに至ってないのに、
その目処は立ってない、というか予定がない。
プログラマ側で各GPU向けに最適化するよう頑張れって感じで、
今OpenCLの規格会議は2.0で何入れようかって話しかしてない。
Appleはどうやってんだろーね? HD4800遅いけど、ちゃんと動くし。

342:Socket774
09/09/17 01:31:50 VTsysaSa
AppleはCPUとGPUを固定してるだけ


343:Socket774
09/09/17 01:38:44 H7o0PtLu
URLリンク(www.fudzilla.com)

NVIDIAはデモ間近なのにGT300の情報をほとんど出してないけど、
どうやらG80以来のMIMD系新アーキテクチャらしい。
完全にLarrabeeに対抗する気だな。GPGPUは速そうだ。

344:Socket774
09/09/17 02:04:25 nfrWXy0U
もうなんか、CPUの強化するだけで良い気がしてきた。
CPUもマルチコア化してきてるんだし・・・。
何が悲しくて特殊な方法つかってわざわざGPU使わねばならんのよ。
3年前なら考えたけどさ・・・
まともに使えるライブラリの実装に時間かけ過ぎ。

345:Socket774
09/09/17 05:54:37 ALNQjxNI
IntelCPUに統合されるという最強のロードマップを持つLarrabeeが出たらGPGPUの死亡が確定する。
LarrabeeがGPUとしてどれだけ爆死しようともGPGPUだけは確実に殺せる。

346:Socket774
09/09/17 06:17:27 51BLWjNV
つかこれだけ更新も無い機能だからもうダメだろ
統合CPUになったら益々意味が無くなるし
まあストリームプロセッサのプログラムがどれだけ難しいかって事だろう
ゲーム用途にしたってどれだけインターフェースを統一しようと
バグだらけで常にドライバ更新が必要なくらい難しいものだしな

347:Socket774
09/09/17 10:43:04 n75Nc0iR
AVCHD動画編集とBD保存を目的にPC組みたいんですけど
幸せになれる方法おしえてくれませんか?

348:Socket774
09/09/17 11:12:38 51BLWjNV
URLリンク(blog.goo.ne.jp)
ここで勉強すりゃ幸せになれる
GPGPUはレートが4Mbps超えてこないと使い物にならんので
(特にATI stremというかAVIVO VCは破綻が酷く
多分バグがあってわけの分からんブロックノイズが出る)
専用ハードに任せるが宜しい

349:Socket774
09/09/17 11:37:03 n75Nc0iR
>>348
ありがとう!勉強してきます。

350:Socket774
09/09/17 16:57:42 VTsysaSa
■後藤弘茂のWeekly海外ニュース■
2.5TFLOPS超に到達するAMDの次世代ハイエンドGPU
URLリンク(pc.watch.impress.co.jp)

●これまでの成功路線を継続発展させるAMD
基本路線は、成功の図式を踏襲し、
生の演算パフォーマンスのアップを追求し、
パフォーマンス効率を落とす複雑化をできるだけ避ける
基本はあくまでもグラフィックス。

より高い演算パフォーマンス効率を実現できれば、結果として、
汎用コンピューティングの性能を押し上げられる。

新GPUの搭載するトランジスタ数は21.5億。
前世代より2.x倍のトランジスタ数で2.x倍の演算性能を実現
アーキテクチャの方向性が変わっていないことが示唆されている。

●スーパーコンピュータの4年の歴史を1年で達成
●プロセスの微細化とともに発展するAMD GPU

---
基本アーキを変えずにリスクを減らし、開発スピードを維持したまま
トランジスタ数に比例してパフォーマンスを上げることに成功。
これも全てDx10.1への早期対応と、ずっと独自で積んでたテッセレータのおかげ。

また、AMDはピクセルパフォーマンスの劇的向上により、同時6画面出力を可能にした。
これはつまり、フィルレートの劇的向上を意味し、
GPGPUのパフォーマンスの劇的向上も意味する。

351:Socket774
09/09/17 17:58:04 Xg1D6Iol
意味しない

352:,,・´∀`・,,)っ-○○○
09/09/17 21:25:05 ZP1RrD/W
汎用性のないプロセッサの数がN倍になったところで
使えないプロセッサばかりが増えるだけ。

たとえばCellのSPEの1コアも使いこなせないソフト会社が6個なら使えるか?
愚の骨頂。

353:Socket774
09/09/17 21:36:24 YlrRXvkO
>>345
想像とは……うん……。察しろ。

GT300は倍精度演算性能を根本から改善するつもり。
6倍~15倍という話だけど、どうだろうな。
別に載せるのはやめたらしい。

354:,,・´∀`・,,)っ-○○○
09/09/17 21:40:29 ZP1RrD/W
Core MAやeCBEよろしく単精度2要素分で倍精度1要素分だったらあり得るがな


355:Socket774
09/09/17 21:44:37 5n0pXN4Y
みなさん、ここはへぼプログラマーが希望的観測を発信するスレです。

356:Socket774
09/09/17 21:54:09 YlrRXvkO
>へぼプログラマー

間違ってないな。
CUDAが難しいとか言ってるヤツは仕事不可能だろ。
職業プログラマかどうかさえ怪しい。

357:,,・´∀`・,,)っ-○○○
09/09/17 22:18:36 ZP1RrD/W
職業プログラマならCUDAが向いてない計算のほうが圧倒的に多いこともわかるよな


358:Socket774
09/09/17 22:38:09 XF8FlDRi
GT300は4.8TFで消費電力150W以下だそうだ

359:Socket774
09/09/17 22:39:04 51BLWjNV
>>356
職業プログラマでもさまざまなジャンルがあるんだけど?
基礎知識の無い分野を扱うなら最初から勉強しなきゃならん
あんたプログラム組んだ事無いだろ

プログラム自体が組めてもそれと分野別の知識はまったく別物
テクニックがどんなに優れていてもそこが理解できないなら組めない

ゲームなんかはその典型
3Dの物理演算モデルを設計してるのは数学者って知ってるか?
こう言った専門知識が必要なアルゴリズムはプログラマじゃ太刀打ちできんのよ
プログラマの仕事はそのアルゴリズムをコードに落とし込む事

つかあんたはCUDAの設計が出来るほどの力があるなら
いますぐnVidiaが高待遇で雇ってくれるから売り込んだほうがいいよw
優秀ならチップに設計に取り込んでくれるよwww

360:,,・´∀`・,,)っ-○○○
09/09/17 22:47:40 ZP1RrD/W
自分が理解してないという事実を理解しているプログラマこそ優秀



361:Socket774
09/09/17 22:50:24 YlrRXvkO
>>359
これはただのガキだということはわかる。

仕事に必要なことを勉強するのは当たり前だ。
出来ない、わからない、と言い訳するつもりらしい。

362:Socket774
09/09/17 22:50:59 5n0pXN4Y
へぼプログラマーが何か言ってますよ

363:,,・´∀`・,,)っ-○○○
09/09/17 22:59:51 ZP1RrD/W
>>361
幼稚だな
たとえばWebやるのにも携帯やるのにもカーナビやるのにも
CUDAなんて勉強する必要がないし

そもそも

使いようがない


364:Socket774
09/09/17 23:16:17 tvRMgAYn
結局金にならないと企業は動かないんだろう。
企業に縛られる一般プログラマも大抵そう。

企業よりも大学の研究室に作ってもらったほうが良いような。

365:Socket774
09/09/17 23:17:05 YlrRXvkO
>>363
話のわかるヤツだと思ったが、そうでもないのか。
必要なところに使われるだけさ。

CUDAが必要かどうかという以前に、俺は習熟が容易で難易度が低いと言っただけ。
わざわざGPUでやる意味がわからんという奴はそもそもGPUが必要な状況を知らん。
CPUで無理なこともあるのさ。

366:Socket774
09/09/17 23:18:52 XF8FlDRi
>>365
それってお前さんが貧乏なだけじゃね?
今ならamazones2に突っ込めばCPUなんて
無尽蔵に使えるぞw?



367:Socket774
09/09/17 23:31:10 YlrRXvkO
仕事の話なのに、なんで俺の財布の話になるの?w

368:,,・´∀`・,,)っ-○○○
09/09/18 00:05:35 ZD70ajJ8
パイプライン充填率70%程度じゃ満足しない人間には
ネイティブ命令仕様が公開されてなくてアキュレートな性能が読みにくい
それだけでも難しいよ



369:Socket774
09/09/18 01:08:57 AnXh9BOR
量子力学とか相対論とか流体力学とか電磁気学とか
(要するに偏微分方程式が主役の奴)は敷居が高いが
ゲームで使われる物理は主に剛体や弾性体のニュートン力学で
それにちょっと破断などのアレンジが入るくらいじゃないのか。
それくらいならカンニング無しでこなせよ

370:Socket774
09/09/18 01:32:19 iuRVKeiB
>>361
お前はどれだけ幼稚なんだ
それもまた当たり前のことを
必要なら勉強するなんて口に出すような事でもないし
社会人一年生で世の中の厳しさでも学んだかのか?w

んで勉強する事と出来る事は違う
プロジェクトの失敗原因の多くが出来ない事をやろうとするから
デスマを繰り返した挙句に失敗する

初期設計の段階で納期が守れるか
予算は十分か準備にどれくらいかかるか
実行した場合の成功率はどれくらいか
これらがキチンと現実的に考えられていないとダメ

出来ない事はできないと言えないやつは無能
他人をも巻き込んで沈没するのが落ち
とにかくやってみよう勉強してみようってのは
もう抜き差しなら無い状況でしか出来ない
つかその段階で99%失敗は見えてる

371:Socket774
09/09/18 02:32:09 oiJuyGLj
プロジェクト論とかそーいうのはプログラマ板でやってくれ

372:Socket774
09/09/18 07:17:06 Lbb6RlFY
URLリンク(www.xbitlabs.com)
DirectX 11 - Not Important

nvが本気で言ってるなら、GT300は非x86のnv版larrabeeだな
フルプログラマブルなプロセッサであるならば、確かにDX11はそれを使うひとつのAPIにすぎないってことになる
ただのお絵かき発熱器はもうたくさん
ATIのように多画面を売りにされても、激しくニッチだし

ただintelに対抗できるほどシェア伸ばせるのかね
ま、ある意味早い者勝ちなのかも知れんが、この分野はまだ

373:Socket774
09/09/18 08:10:17 fCcAJKSy
歩留まり2%で何が出来るんですかね

374:Socket774
09/09/18 09:50:39 AnXh9BOR
個人的にはGT300が倍精度飛躍的向上という噂に期待してる。

多画面と演算モンスタとでどちらがニッチかなんて目くそ鼻くそだ

375:Socket774
09/09/18 10:04:16 K+RcnWLZ
>倍精度飛躍的向上

2chでしか見ないんだが

376:Socket774
09/09/18 10:10:06 6/XKom7f
完全体が2%だろうが
欠陥含みでも別に構わないならもっとあがる

描画だけじゃ先はない

377:Socket774
09/09/18 10:38:34 nTMfhRp5
ニッチな分野に絶望的な歩留まり

まさに適量適材適所

378:Socket774
09/09/18 11:42:16 V9tTk8om
CUDAはTSUBAME2.0みたいな次世代のHPCに採用が決まってるから
GT300はGPU市場を捨ててる可能性がある

379:Socket774
09/09/18 12:10:59 6/XKom7f
だってゲーム市場が崩壊してるもの

ベンチ市場はまだ健在なのかなw

380:Socket774
09/09/18 12:29:24 FqXNo4It
>>378
HPC分野ではAPIなんてなんだって良いわけで。
別にCUDAだから採用されたんではないぞ。


381:Socket774
09/09/18 16:35:47 AnXh9BOR
値段ですよ値段。Teslaは個人の自作PC的な視点で見るとボッタクリだが
研究所をまわる営業がカタログを持っていくエンタープライズ向け
ハードに比べたら割安に感じるわけで

計算やってる研究所、部署で金持ちなのは核計算してる所くらいなもので
他は(理想の額に比べて相対的に)貧乏。ぁ 最近は環境って言えば
金集められるのかな?

382:ラデ厨 ◆TX.Dz2qTUo
09/09/18 21:43:36 w3wFgIi/
お絵描きしか能がないラデは行き詰まりが目に見えているね(・´ω`・)

383:ラデ厨 ◆TX.Dz2qTUo
09/09/21 22:37:49 ACD0qc3s
ラデは未来を見据えない設計ばかりだね(・´ω`・)

384:Socket774
09/09/21 23:49:17 yCFNXDzN
未来を見据えないでDirectX10対応を遅らせてた某企業はこのありさまだよ

385:Socket774
09/09/22 01:47:08 XHVZ7oPp
世界初DX10世代GPUを世に出したのはその某企業なわけだが…?
DX11のこと言ってるのかね?
GT300は対応してるぜ、数ヶ月の差だし気にすんな。

ラデ先攻の規格って普及はするけど出て来る場面では旨みが少ないんだよな。
DX10.1は必須アプリが存在しないままDX11に移行するし、PCI-EはAGP切捨てにより足枷にすらなった。
おれはラデオンが未来を見据えていないとは思わないが、売り方が下手だとは思うぞ。

386:Socket774
09/09/22 02:20:25 Bnrpq3hV
>>385
逆。採用例が少なくてうまみはそれなりに出る。

DX10.1が使えるソフトでは結構フレームレート上昇するよ。特にAAON時。
NVからシェアを奪っていれば普及していただろうけどね。

結局シェア取れてないと良い規格を作ろうが採用されない。
冒険する前にまずはシェアを取るべき、という意味では確かに売り方は下手かもしれん。

387:Socket774
09/09/22 04:38:25 42GG4O2K
>>385
S3の事じゃね?

388:ラデ厨 ◆TX.Dz2qTUo
09/09/23 21:50:11 BubOHnuT
グラフィックに固執ばかりしていると様々な分野から見放されるね(・´ω`・)

389:疫厨 ◆bzZ6A62svU
09/09/23 23:45:51 8nPKvGn4
いつもげんきだね(・´ω`・)

390:ラデ厨 ◆TX.Dz2qTUo
09/09/23 23:56:27 BubOHnuT
君も元気だね(・´ω`・)

391:Socket774
09/09/24 07:15:47 BgMDYIOj
URLリンク(images.anandtech.com)

どうしてこうなった?

392:Socket774
09/09/24 07:46:15 AwyP6gHA
 ___        ♪  ∩∧__,∧
/ || ̄ ̄||         _ ヽ( ^ω^ )7  どうしてこうなった!
|.....||__||         /`ヽJ   ,‐┘   どうしてこうなった! 
| ̄ ̄\三  / ̄ ̄ ̄/  ´`ヽ、_  ノ    
|    | ( ./     /      `) ) ♪

 ___    ∧__,∧.∩
/ || ̄ ̄|| r( ^ω^ )ノ  どうしてこうなった!
|.....||__|| └‐、   レ´`ヽ   どうしてこうなった!
| ̄ ̄\三  / ̄ ̄ ̄/ノ´` 
|    | ( ./     /

 ___
/ || ̄ ̄|| ∧_∧
|.....||__|| ( ^ω^ )  どうしてこうなった!?
| ̄ ̄\三⊂/ ̄ ̄ ̄/
|    | ( ./     /

 ___
/ || ̄ ̄|| ∧_∧
|.....||__|| (     )  どうして・・・
| ̄ ̄\三⊂/ ̄ ̄ ̄/
|    | ( ./     /



393:Socket774
09/09/24 11:21:55 KpUuHofL
GTXおせええええええええええええええ

394:Socket774
09/09/24 18:37:23 Q5pFKZAk
HD5870のGPGPU性能

URLリンク(www.anandtech.com)
URLリンク(images.anandtech.com)
DirectX Compute Ocean(Nvidia製)のベンチ結果。
どうしてこうなった・・・


>RadeonはAMD STREAM、GeForceはCUDAを使い、マンデンブロ図形描画を行っている。
URLリンク(journal.mycom.co.jp)
URLリンク(journal.mycom.co.jp)


ワンチップで2.7TFLOPSをたたき出すAMDのCypressの秘密
URLリンク(pc.watch.impress.co.jp)
●マルチコンテクストを保持するAMDアーキテクチャ
AMD GPUは、コンテクストのスイッチを高速化する機構をハードウェアで備えている。
「複数のコンテクストをGPU内部で保持している。コンテクストをスイッチすると、
ナノ秒で全く違うコンテクストに切り替わる。完全にパイプライン化されており、
ストールは全くない。合計で8コンテクストの全てのステイトを保持している」

AMDアーキテクチャでは、全く異なるタイプのステイトもGPU内部に保持できるという。
 「コンピュートとグラフィックスをGPUの中に同時に持つことも可能だ。
 我々のGPUでは、シェーダもコンピュートも同じことだ」(Demmers氏)。

一度に走らせることができるのは1つのコンテクストだけで、ステイトを保持することで
切り替えを速くしている。
---
グラフィックとGPGPUを何の区別もせず、ナノ秒でステートを切り替えて対応。
両者をシームレスに使用できるDx11にまさにベストマッチ。
GPUモードを完全に切り替えなきゃいけないnVidiaGPUは根本的な設計変更を迫られることになったな

395:Socket774
09/09/24 20:40:44 VKhYkx2Q
あmd信者は良いな
頭がお花畑でw

396:Socket774
09/09/24 20:59:44 yuQAc2yA
半角英文字を打つ余裕すら無くなってしまったのか…

397:Socket774
09/09/24 21:19:55 VKhYkx2Q
>GPUモードを完全に切り替えなきゃいけない
そんなハンデがあって、この程度のしかつけられないの?
公称値3倍近くあって?

398:Socket774
09/09/24 21:37:57 hqoIm0Dg
よくわからんがGPUモードじゃないとそもそもベンチ出来ねーんじゃねーの?
どの辺がハンデなんだ?

399:Socket774
09/09/24 21:43:30 tgg5GnLc
ハンデ背負って頑張ってますぅw

そのハンデを捨ててくれよな



400:Socket774
09/09/24 22:18:28 VKhYkx2Q
URLリンク(game.watch.impress.co.jp)

Simon Green氏によれば、NVIDIAのDirectX 10世代GPU(GeForce 8000/9000/GT200シリーズ)では、
スレッド数を多くするとパフォーマンスが上がらないとか、スレッドごとにアクセスできるTLSの範囲が制限されるといった制約があるとしていた。

また現行DirectX 10世代GeForceでは、演算シェーダーとピクセルシェーダーのモード切替に時間を要するため
頻繁にモードを往来するとパフォーマンス的に辛くなるだろうと警告し、
ゲームであれば演算シェーダーの活用(GPGPUモードの活用)は1フレーム内で1回程度にすべきだと述べていた。

401:Socket774
09/09/25 00:47:34 ZydEp7wv
>>398
nVidia GPUは
GPGPUモードで計算して→GPUモードに切り替えて
→GPUモードでグラフィックを書く→GPGPUモードに切り替えて→以下繰り返し

この切り替えのオーバーヘッドが大きくてパフォーマンスロスってる。
だから波を描くnVidia製ベンチでスコアが伸びてない

Dx10まではGPGPUそのものがDxの埒外だったからそれでもよかったが、
Dx11ではGPGPUさえもDirectXに取り込まれた。
グラフィック描写とGPUでの数値計算は頻繁に交互に起こりうることになったわけ。


402:Socket774
09/09/25 00:50:58 cSW9G7LY
ID:VKhYkx2Q 涙拭けよw

403:Socket774
09/09/25 03:34:39 nxopHjHh
最新ラデオソはnvの旧型にもハンデが無いと勝てないのね
しかも公称値3倍近くで2倍未満の差

本当に遅いな
ラデオソは
URLリンク(www.youtube.com)
URLリンク(www.youtube.com)

404:Socket774
09/09/25 07:26:06 ZydEp7wv
URLリンク(www.anandtech.com)
URLリンク(images.anandtech.com)
DirectX Compute Ocean(Nvidia製)のベンチ結果。

405:Socket774
09/09/25 10:11:11 nnkweoFK
ショボいな

ATIは効率低すぎ

406:Socket774
09/09/25 10:12:32 UH/jVrxG
電力当たりの効率でnVを圧倒していればそれでいいだろw

407:Socket774
09/09/25 10:15:25 EaAYnlkS
GT300は4TF以上なんだから
それまで待てばいいんじゃね

408:Socket774
09/09/25 10:19:41 8qTnvQip

G T 3 0 0 の デ モ は ま だ か


409:Socket774
09/09/25 10:41:27 nnkweoFK
ラデオソはいつになったら使い物になるのw

410:Socket774
09/09/25 10:43:49 UH/jVrxG
>>409
涙拭けよ。

411:Socket774
09/09/25 11:22:38 K9YQ6Uzw
WMEってCUDAかGPGPU対応してたっけ?
いや、これが対応してるんなら買おうかなと

412:Socket774
09/09/25 12:14:48 nnkweoFK
電力効率(笑)
演算効率が最低なのに電力効率がいいとかw

ラデオソで良いのは、カタログスペックだけだろ

413:Socket774
09/09/25 12:16:37 mHl8fmAq
URLリンク(journal.mycom.co.jp)
GeForce遅いっす

414:Socket774
09/09/25 12:20:53 rzUBsmxQ
新製品の前にはパラノイアが良く沸くねぇ。
あっちこっち御苦労さまです。

415:Socket774
09/09/25 12:21:03 mHl8fmAq
ま、結局は最適化次第なんだけどね

416:Socket774
09/09/25 12:30:51 Ksv61UM8
サンプルすらないGT300に最適化はできない

417:Socket774
09/09/25 12:33:43 mHl8fmAq
これはだめだ、やっぱRADEONに最適化しないともったいない
URLリンク(images.anandtech.com)

418:Socket774
09/09/25 22:48:57 1d9glZmN
ラデ厨はGT300発表までの間少し早い冬眠に入りました でも時たま起きてくるので気をつけてね

419:ラデ厨 ◆TX.Dz2qTUo
09/09/26 23:56:06 3oiccP+F
GPGPUをサボったツケはWindows7のリリースと同時に噴出してくるだろうね(・´ω`・)

420:Socket774
09/09/27 00:01:50 Ywm/GCo6
それ、今やNVに対する皮肉じゃね?

421:Socket774
09/09/28 08:49:50 9bWaUBSJ
余りの惨敗ぶりに、もう辺境スレで無理矢理ひねり出したようなことしか書けなくなってしまったね(・´ω`・)

422:ラデ厨 ◆TX.Dz2qTUo
09/09/28 21:45:09 RZt//7tt
ラデの惨敗ぶりは市場を見れば明らかだね(・´ω`・)

423:Socket774
09/09/28 23:05:17 tKOw3X/b
需要に対して供給が惨敗しとるな

424:アム厨 ◆Fh2IQtNvbw
09/09/28 23:08:32 WIcJOId/
需要たって物好きエンスーが必至なだけで100枚も売れんよ(・´ω`・)

425:Socket774
09/09/28 23:46:41 V0LRs7Q6
ラデのアドバンテージは10.1と音チップ?

426:Socket774
09/09/29 07:48:41 jC50VkhK
300なら140くらいいくだろう。
ラデの偉そうにOpenCL対応で高性能っていってがNVDAに比べて優秀だったんかね?


427:Socket774
09/09/29 08:32:36 RCovdsVl
物好きのエンスーw
GPUを計算機にする人たちだな

100枚って所を上手く言えばもっと信憑性が出せたカモね

428:Socket774
09/09/29 18:33:04 ED8GkN56
nVIDIAだけが真っ向から開発推し進めてるけど
AMDはその流れに乗っかって脇から攻めようとしてる感じにしか見えない
もう何年もそんな流れだよな

429:Socket774
09/09/29 22:26:11 11fxEC/N
GT300は愛称が原子炉に決定しました
つまり最強なんです

Radeon4枚CFしても勝てやしません

430:Socket774
09/10/01 21:33:16 AozNOfCB
Whitepaper NVIDIA’s Next Generation
CUDA Compute Architecture:Fermi
URLリンク(www.nvidia.com)

NVIDIA's Fermi: Architected for Tesla, 3 Billion Transistors in 2010
URLリンク(www.anandtech.com)

4.8TF確定しました。

431:Socket774
09/10/01 21:36:21 bMua4RDM
1.5GHzでも1.5tflopsだっつうに

432:Socket774
09/10/02 04:04:31 jzjt8UXT
実効性能でRadeonの4.8TFlopsに相当

433:Socket774
09/10/02 05:59:35 GAZCeNVg
ATI換算なら6tflopsじゃないか
あとfpとintは並列できるし

434:Socket774
09/10/02 16:01:43 FEshAs5P
CUDAに完全に出遅れてるんだから、iTunesのGPGPUエンコードに対応して、
一気にコンシューマ市場かっさらっていくか

435:Socket774
09/10/02 16:12:11 alD99ZmK
なんだネタスレか
オープンソースなBullet Physicsでも期待してるのかと思ってた

436:Socket774
09/10/02 20:33:41 AWxIfTKj
音楽のエンコードかx264でgpgpu対応か後はflashでmp4がcpu関係なく軽くできるくらいにならないとあまりメリットはないな。



437:Socket774
09/10/03 09:38:53 Z9Z9voex
CPU持ってないnvとPhenom持ってるAMDでは気合の入れ方は違うわな。

438:ラデ厨 ◆TX.Dz2qTUo
09/10/03 10:23:41 oipvBDR5
何の役にも立たぬ屁をアテにするとは先が見えているね(・´ω`・)

439:Socket774
09/10/03 16:08:59 XPGoOhze
iTunesのエンコード対応は出来たら、クリティカルな戦略になるだろうけど、
林檎のことだからロイヤリティとか求めてくるだろうから難しいんだろうなぁ…
そこで今シエアを争ってるSONYにとかなると面白いんだけど

440:Socket774
09/10/04 01:31:38 uBpxwJIQ
iTunesって未だにシングルコアだけじゃね?

441:,,・´∀`・,,)っ-○○○
09/10/04 03:40:43 TL0QkM36
Quicktime関連はMacOS版とWindows版で性能の差が有る


442:Socket774
09/10/04 03:47:07 +PQ/4a1j
そういやmac晩のQuicktimeってOpenCLって使わないのかな

443:Socket774
09/10/04 11:33:23 KGIFmf78
nVidiaがチップセット事業を継続しないみたいだから、
現行品はともあれ、Core i移行時にアポーはintelチップセットに戻さなきゃ
いけないからなあ。コスト増を承知でnvのGPUを載せる手もあるけど、
そのへんのからみもあって、OpenCLの使い方は難しいんじゃないの。

444:Socket774
09/10/04 12:12:25 kd7t9Yg1
Core2が来年も残るなら、CPU据え置きで、NVIDIAのCore2用の新チップセットで
来年一杯はしのぐって可能性もあるんじゃないの?
その先はintelの統合GPUのOpenCL性能次第になるだろうけど。

445:Socket774
09/10/04 18:19:42 rYnN4Lls
>>440
エンコはデュアル対応じゃなかった?
iTunes9になってからエンコ速度が2倍近くになったからクアッド対応したのかと思ってたけど

446:ラデ厨 ◆TX.Dz2qTUo
09/10/07 14:06:02 wcy4mkIv
OpenCLのCPUへの親和性を見るに結局ラデはGPGPUで頼るべきものが無くなるね(・´ω`・)

447:Socket774
09/10/07 15:50:37 T1LYr3fx
MACの上位モデルはi9とかXeonDPとかになるからチップセットにオンボないし関係ないような

448:Socket774
09/10/08 21:27:57 mABJziGF
科学技術計算に特化してるってのはいいんだけど
単純なパスワード解析とか動画のフィルターだとラデが圧倒的に強いわけで
実アプリ的に何だとラデより早いのかな。

449:Socket774
09/10/08 21:32:13 O+NkBGdp
へーw

450:Socket774
09/10/08 21:42:46 3uq9YUyK
ぢぴぢぴゆ?

451:アム厨 ◆Fh2IQtNvbw
09/10/08 22:14:15 t8RDrLTu
RadeonのGPGPUの整備を願う?
出来ないものねだりせずGeForce買え(・´ω`・)

452:Socket774
09/10/08 23:22:14 ao+czIek
Larrabeeやばい
開発中止になりそう

誰か助けないであげて

453:アム厨 ◆Fh2IQtNvbw
09/10/09 22:28:25 qXYBDlZ1
Larrabee?NVやAMD宛ての「まどわし草」みたいなもんで、
実際は作ってねーんだろ(・´ω`・)

454:アム厨 ◆Fh2IQtNvbw
09/10/09 23:12:32 qXYBDlZ1
やりたくないか?(・´ω`・)
URLリンク(progrape.jp)
URLリンク(progrape.jp)

455:Socket774
09/10/10 00:08:44 Hl4zkHAi
NVも作ってないしね。結局atiより有利なアプリとか提灯サイトですら紹介ないし。
絵に描いた餅ばっかりのNVも似たものだし。

456:Socket774
09/10/10 01:48:48 Hl4zkHAi
URLリンク(hothardware.com)

457:Socket774
09/10/10 02:12:24 zmck0F6O
だれが好んでパスワード総当たり解析なんてやるんだよw
個人と縁がないだろw

458:Socket774
09/10/10 02:17:59 anDA8SCS
280<4870

なんか・・・・・

459:,,・´∀`・,,)っ-○○○
09/10/10 02:24:30 4pELrNs/
これだからトリップ厨はきもいんだよ(俺が言うな

460:Socket774
09/10/10 02:41:27 Hl4zkHAi
aviutlのgpuフィルターも280<4870。
>>459
こっちもブログみて経緯知ってるからなんとも・・・ご愁傷さまでした。としか。

461:,,・´∀`・,,)っ-○○○
09/10/10 02:49:24 4pELrNs/
アセンブラレベルで弄り倒したい俺としてはLarrabeeとかSandy Bridgeとかが出ないとモチベーションあがんねーわ

そうそうCPUの場合だけど、AMDのXOPはSHA1でも有効だよ
32ビット4並列のビットローテートとMUXが1命令でできるから。


462:Socket774
09/10/10 03:01:52 Hl4zkHAi
Larrabeeでトリップ検索は素人でも速度でないと思うんだ・・・・
ユーザー的にはLarrabeeでもなんでもいいから最低限>>436レベルことができる普及価格帯のビデオカードが出てくれば文句は言わないんだけどね。




463:,,・´∀`・,,)っ-○○○
09/10/10 03:04:48 4pELrNs/
AESにすべきだと主張してたのによりによって強度の低いSHA1だ
FOXは氏に晒せ

464:,,・´∀`・,,)っ-○○○
09/10/10 03:07:01 4pELrNs/
エンタープライズじゃなきゃ毛管ねーよ
"Larrabee on Rails" くらいのフレームワークが必要だな



465:ラデ厨 ◆TX.Dz2qTUo
09/10/10 10:34:54 wfJGIIm7
団子氏は2ちゃんの管理運営に就いてはどうかね(・´ω`・)

466:Socket774
09/10/10 10:35:54 RBDFgtPm
自殺願望?

467:,,・´∀`・,,)っ-○○○
09/10/10 14:08:18 4pELrNs/
Fermiの仕様を駄目出しするのに適切なスレってどっかある?

468:Socket774
09/10/10 14:15:22 RBDFgtPm
【ATI/AMD】Radeon HD5xxxシリーズ葬儀会場【産廃】
スレリンク(jisaku板)l50


ある意味情報収集場

469:,,・´∀`・,,)っ-○○○
09/10/10 14:37:29 4pELrNs/
【独り言】
ちなみにシミュレーションによる机上値だけどLarrabee 32core@2GHzはSHA-1だと600は堅いぜ。
32本SIMDレジスタがあれば必要な定数は1ループ分に全部収まるからこの数字は限りなく実効値に近い。
今は式を簡略化してショートカットする方法を模索中
現状前半5ラウンドくらいは削れてる。まあx86に特化したショートカットをしてるわけじゃないんだが
vinsertdっていう命令がかなり良い感じに性能稼ぐのに役立ってる。

因みにFermiはいろいろ残念な仕様だとわかった
SP内で整数と浮動小数を並列発行じゃなくて整数×2ならそこそこ良い線いくんだが。

あとAVXでもシミュレーションやってるが
128ビット(4並列)でSHA1の80ラウンドで850サイクル位になる。
3基のSIMD ALUがほぼフル稼働してる。面白すぎる。64ビット命令は出番ないかも
SSE*まではレジスタ間MOVに性能取られてたからかなりの進歩と言える

470:Socket774
09/10/10 19:33:15 EoxIWWnH
Folding@HomeでNVにHD54870をもってしてもダブルスコア喰らってる
こーゆう計算はRadeonのGPGPUは苦手なの?

471:アム厨 ◆Fh2IQtNvbw
09/10/10 20:43:38 p8vCzY5O
苦手とゆーか、性能が悪いんですぜ(・´ω`・)

472:Socket774
09/10/10 22:44:06 3mxv1vM0
シェア考えろカスデブ

473:Socket774
09/10/10 22:53:15 LvyfyChH
それででその最新型のHD54870はどこで手に入るんですか?
知らない間に桁が増えてるとは驚きを隠せません
是非購入したいのです

474:Socket774
09/10/11 08:51:04 2B0lU1CD
>>473いや、俺も驚きは隠せないわ。>>HD54870

475:Socket774
09/10/11 16:46:44 JNIp6EIs
うちにあるよ

476:Socket774
09/10/16 10:18:49 QarMJNbQ
GPGPUを使ってみたくて酉検索走らせてみたけど、4890とGTX260だと検索速度が260の方が倍ぐらい早いのね。
4890が80Mtrips/sで、260が190Mtrips/s
使用アプリケーションが違うからGPUの性能に直結してる訳じゃないだろうけど。

477:Socket774
09/10/16 10:42:47 OEreIeLR
シェーダーの粒度の違いが効いてるんだろ。
ATIは粒度が荒く、同じ分岐の処理をするグラフィック向き。
NVは粒度が細かく、分岐処理を行ったり複雑な処理を行うGPGPU向き。

どっちが優れた設計というより、何をターゲットにした設計かという事。

478:Socket774
09/10/16 11:01:01 i9CXj96n
それならなんでnvidiaが情報拒否したんだろ。

479:Socket774
09/10/16 14:20:02 LBnc+Fsj
あれ?逆じゃなかったっけ
NVはnetburstと似たような方向性でATIは並行処理重視だったような

480:Socket774
09/10/16 14:34:44 d98wkNpa
ATIは5-wayVLIWで同じ命令を一括処理
NVは8つずつのSPにそれぞれ別の命令を割り振る
開発環境でも実行効率でもnVidiaの方が数段先を言ってる
OpenCLもCUDAベース

481:Socket774
09/10/16 14:41:59 CMVV8Idp
こうもサラッと嘘を吐かれるとなぁ

482:Socket774
09/10/16 14:46:01 pFWsd/AU
そういえばアップルは4870をまとめ買いしてたよな
iTunesほか、アップル謹製ソフトのOpenCL対応は進むんじゃないかな

483:Socket774
09/10/16 16:03:40 cOxKcKWm
演算の分岐粒度はゲフォとラデで10倍違うな

Geforce 1024bit
Radeon 10240bit
Larrabee 512bit

484:Socket774
09/10/16 16:44:25 axI0U8KF
OpenCLはCUDAベースとか電波過ぎて笑えもしない


485:Socket774
09/10/16 16:50:03 UOCoyZRx
ここんとこのOpenCLはCUDAの亜種みたいなAPI拡張ばかりしてるぜ

486:Socket774
09/10/16 17:19:57 d98wkNpa
>>484
Thread、Block、Gridの概念があるのに?
nVidiaのOpenCLサンプルはCUDA実装と遜色が無くて
ATiのOpenCLサンプルはStreamと比べて激遅なのに?

487:Socket774
09/10/16 17:23:57 kBbQl1Gg
>>484具体的な反論がんばれよw

488:Socket774
09/10/16 20:43:23 /4yguRUj
>OpenCLはCUDAベースとか電波過ぎて笑えもしない

なかみてないの?

489:Socket774
09/10/17 00:42:16 sm0iiUgl
ガセ書いてこられると>>470すら疑ってかかったほうがよさそうだなあ。

490:Socket774
09/10/17 10:09:15 F944LBPw
>>457
木を見て森を見(ry

491:Socket774
09/10/17 11:00:57 6FgdMzFm
>>489
F@hで5870が遅いのは事実だよ

URLリンク(pchardwareblips.dailyradar.com)

However, the performance wasn't what we expected - Radeon HD 4870 and HD 4870X2
will both yield around 3000 points per day and we definitely didn't expected that Radeon
HD 5870 1GB will join the club. In our measurements, different units showed that
the number of points will vary between 1650 and 3150 points per day, dramatically
lagging behind nVidia GeForce cards.
In comparison, Gainward's GeForce GTX 275 returns between 5400 and 7100 PPD
- depending on how complex the units are. Direct competitors to Radeon HD 5870,
GeForce GTX 285 and GTX 295 are simply leaving HD 5870 in the dust.

492:Socket774
09/10/17 11:37:19 +Ci0sp5W
まだ正式対応してないからな。
一応Brook+で書かれた旧コードがそのまま動くけど
4000系と同レベルにしか使えない、増えたキャッシュもSPも使えない。
で現在AMDはBrook+のサポート切ってDirectComputeとOpenCLに移行中で
OpenCLSDKも出たばっかだし対応はまだ先か、てな所。

493:Socket774
09/10/17 16:01:54 b1GwOcaa
「フリーランチが終わる」のだとしたら、ハードウェアの性能評価は
どんどんやりにくくなるな。ハード評価してるんだかソフト評価してるんだか

494:ラデ厨 ◆TX.Dz2qTUo
09/10/17 19:59:25 SCZ2kAvQ
双方ダメなラデに生き残る道はあるのかね(・´ω`・)

495:Socket774
09/10/17 20:14:00 On/wDWvS
GPUしか無いからGPGPUが要るんだしw

496:Socket774
09/10/17 20:53:37 kRw5jN19
DX11に対応したからとりあえず問題はない
もう一方の本命openCLの当事者であるアポーがopenCLの弱いラデ大人買いしたのはまだ普及に本腰を入れるつもりは無い証拠
そうなるとアポーと組んで一気に普及させるnvidiaの目論みは崩れる
しかもopenにしたことでnvidiaが長年研究してきたCUDAの仕様がamdに渡るという皮肉な結果に
次期ラデがアーキテクチャ一新するらしいがひょっとしたらopenCLの強化かも知れない
それにopenである以上ラデで動かないようにすることも出来ない

一見先行してるように見えるnvidiaは実はかなり窮地に陥ってる

497:Socket774
09/10/17 21:02:18 QyTo2aFa
妄想乙

498:Socket774
09/10/17 21:10:36 O2JSA3LO
AMD,nVIDIA,S3のGPUでもっとも演算に向いてないのがAMD

499:Socket774
09/10/17 21:23:29 lxttSOLe
演算に向かないとか言っちゃったw

500:Socket774
09/10/17 21:44:27 O2JSA3LO
むいてるとか思ってるのw

501:Socket774
09/10/17 21:46:12 wjVtBgZI
せめて汎用演算とかスカラ演算に向いてないって言えばいいものを…
3Dグラフィック処理だって演算なんだから

502:Socket774
09/10/17 21:46:53 lTpmnaWQ
nVは器用貧乏と言うか、基本的にCPUが得意な処理でも
効率よくしようとするとトランジスタ効率が落ちるから、
もともとGPU向きだった計算ではAMD(ATI)に物量で負けることになる。
CPU向きだった処理はもちろんLRBに負ける。



503:Socket774
09/10/17 21:51:26 D5brKARu
まあ、今さら何を騒いだとしても、ソフト大手のADOBEがCUDAじゃなくDXCSベースでFlashのGPU対応を実施して、HD5870で実演した事実は動かない。
ADOBEじゃ他のソフトも同様にHD5xxxとATI Stireamの環境で開発を続けるよ。
他にもDX11対応やGPGPUのソフト開発にHD5xxxの実機とStreamを使っているところは多いだろうね。(動画やゲーム関係は特に)

504:Socket774
09/10/17 21:52:10 O2JSA3LO
>3Dグラフィック処理だって演算なんだから

だからそれも、クソ遅いんだってのw

505:Socket774
09/10/17 21:53:46 O2JSA3LO
>>503
自ら市場を狭めるなんて馬鹿かw

506:Socket774
09/10/17 22:07:49 7da5KTDH
ID:O2JSA3LO
そこはMUDAの優位性を説くべきだろう

507:Socket774
09/10/17 22:13:54 O2JSA3LO
URLリンク(www.youtube.com)

いくら物量を増やそうが、屑は屑

URLリンク(labs.adobe.com)
Video hardware decoding
Flash Player 10.1 introduces hardware-based H.264 video decoding to deliver smooth, high quality
video with minimal overhead across mobile devices and PCs.
Using available hardware to decode video offloads tasks from the CPU to improve video playback performance, reduce
system resource utilization and preserve battery life.

モバイルやPCでまんべんなくサポートするにゃDXVAの方が広いし、パフォーマンス、電力面でも有利
物好きは低効率なshaderを使って獏熱再生で、自己満足したいのかw

508:Socket774
09/10/17 22:43:31 lxttSOLe
小中学生が必死にリンク貼って納得させようとしているなw
自分の言葉で議論できるようになってから書き込め。

509:Socket774
09/10/17 23:58:09 On/wDWvS
自分の言葉w

現象を説明するのにそんな物使えってwww

510:Socket774
09/10/18 03:32:14 +b8BuilI
えんざんりゅうどがでかすぎて、おはなしになりません。
えぬぶいとくらべてもじゅうばい
いんてるとくらべたらにじゅうばい

511:Socket774
09/10/18 04:02:34 pxmideGl
総統閣下がお怒りです
URLリンク(youtube.com)


512:Socket774
09/10/21 21:07:54 e+mLRI30
そーとー怒っていますね

513:Socket774
09/10/22 00:05:41 XgEr7mau
ドイツ語卑怯だなw 字幕付けるだけで面白いww

514:Socket774
09/10/22 00:12:34 qo7yba5e
あのペースだと、字幕を読み切れんw
総統のしゃべりは相当早いですよ

515:ラデ厨 ◆TX.Dz2qTUo
09/10/24 16:48:23 MueBvux/
ラデは一生お絵描き屋さんで終わるんだね(・´ω`・)

516:Socket774
09/10/24 17:50:11 sv/PH/QW
GPGPUきたはいいけど、調整が微妙でCPUでエンコするのと
あんまり変わりませんでした、とかだと笑えるなw
いかにもRadeonらしいw

517:sage
09/10/25 01:34:07 SP0fVXer
ゲフォはお絵かきすら出来なくなったよ

518:ののたん ◆KiwamonoL.
09/10/27 14:38:34 yWbiERsm
>>476
アプリケーションがどうの以前に、10 桁と 12 桁じゃやってることが全然違うぜ。
両方とも 10 桁だ、とかならゴメン。

519:ラデ厨 ◆TX.Dz2qTUo
09/10/27 21:01:26 BaecAxnF
いい加減ラデのGPGPUに夢を持つのは諦めたまえ(・´ω`・)

520:,,・´∀`・,,)っ-○○○
09/10/27 21:29:48 p0qmGqi2
ようくそたんぺ

521:ラデ厨 ◆TX.Dz2qTUo
09/10/31 18:22:47 qs8JsgRZ
団子氏はGPGPUに否定的なのかね(・´ω`・)

522:Socket774
09/11/01 07:03:41 vE0uu2BR
坊やだからさ

523:,,・´∀`・,,)っ-○○○
09/11/01 09:16:04 mtXW/RVq
GPGPU(笑)

524:ラデ厨 ◆TX.Dz2qTUo
09/11/03 23:24:34 h85FwYZf
なるほどね(・´ω`・)

525:ラデ厨 ◆TX.Dz2qTUo
09/11/06 23:48:54 tyk0dtR3
糞画質エンコなど誰も望んじゃいないね(・´ω`・)

526:Socket774
09/11/06 23:53:05 l6pGXwrL
生きてるんだw

527:ラデ厨 ◆TX.Dz2qTUo
09/11/11 22:50:23 WsdJ5uGc
ラデは死んでるがね(・´ω`・)

528:Socket774
09/11/11 23:00:56 b2YVWMdO
RadeonはOpenCL性能ぜんぜんでないねぇ


529:Socket774
09/11/15 18:33:01 iCpTHAKX
OpenCLはまだ実装する必要はないよ
NVに実験させてから、時機を見てGPGPU機能を実装すればいい
まだGPGPUは早い

530:Socket774
09/11/15 18:40:30 m1UoyREw
へーw

531:Socket774
09/11/15 18:49:32 1na4qW8D
一方東工大はTSUBAMEにTeslaを搭載した

532:529
09/11/15 19:01:17 iCpTHAKX
ブルドーザーコアにGPGPUコアをミックスしたCPUを出すのがベストなタイミングだろうね

533:Socket774
09/11/15 19:50:31 NTKOjKnG
avivoってTS読み込めないのか。。

534:Socket774
09/11/16 04:19:20 Krqt6Gqh
>>531
それ導入したのすげー前じゃん


535:Socket774
09/11/16 22:27:39 nX+pLWtl
>>534
それだけAMDの戦略が遅れてるってこと
来年竣工のTSUBAME2.0もCUDAカード(Fermi)確定

536:Socket774
09/11/16 22:36:00 MclTKq5W
お前の中ではそうなんだろうな

537:Socket774
09/11/17 00:45:26 sDLjTGPh
CUDAみたいな性能出しにくいものだれも使わないだろ
CPUの方がほとんどのアルゴリズムで優れているのは間違いない

538:Socket774
09/11/17 01:10:01 PmvfKPo7
実測値が理論値の46%・・・次は使われないだろう

539:Socket774
09/11/17 01:14:14 HWM8g8Qc
>>535
中国のなんとかというスパコンがラデ4870X2数千搭載して世界5位らしいよ。

540:Socket774
09/11/17 01:30:40 hfDzkHHM
nVidia搭載のスパコンは上位に入ってないね
突然HD4870搭載で5位にランクインってのが凄い

しかも1位も6コアOpteron山盛りのマシンが取ったし。

AMD大躍進だな

541:Socket774
09/11/17 01:34:56 +OTpUYAA
CPUもGPUも使い方次第ってことか

542:Socket774
09/11/17 01:47:33 HWM8g8Qc
どっかがHD5870か5970満載のスパコンを作ってそうだ。

543:Socket774
09/11/17 01:56:57 sDLjTGPh
残念ながら、GPGPUとしてみた場合、ラデは使いものにならない

544:Socket774
09/11/17 01:57:05 FSvxuGiY
天河一号はXeon E5540を6144基とRV770を5120基搭載だってさ

545:Socket774
09/11/17 01:59:05 hfDzkHHM
使いものになってるということだね


546:Socket774
09/11/17 02:02:08 sDLjTGPh
残念ながらなっていない
実際GPGPU系の論文は現在100%NVIDIAのカードを使ってる

547:Socket774
09/11/17 02:07:57 egnAnZ7V
汎用演算効率は脱VLIW化すると噂されてる次の6xxxで向上するんでは無かろうかと思われる。

548:Socket774
09/11/17 02:08:33 hfDzkHHM
そんな空論はどうでもいい
実際5位にランクインしてるってことが重要。



549:Socket774
09/11/17 02:47:19 HWM8g8Qc
サンプルすらない半年遅れの屁ルミには見切り付けてHD5870でHPCやスパコン組むところが出て来そうだ。

550:Socket774
09/11/17 03:04:18 J0CAloNa
TOP500を見た感想。GPGPUは不要。

551:Socket774
09/11/17 03:11:25 sDLjTGPh
>>549
残念ながらありえな

>>550
トップを取ったORNLの時期スパコンはOpetron+Fermiで構成される予定

552:Socket774
09/11/17 04:19:57 HWM8g8Qc
>>551
気の毒だけど、それ多分詐欺スペック(倍精度1T、単精度2T、220W、10月発売)での計画だから見直されるか、かなり遅れる上に低性能になるかのどちらかになるよ。

553:Socket774
09/11/17 10:41:47 onkg88WT
今の所RadeonでもGeforceでもGPGPUで出来ることは
一般じゃトリップ検索ぐらいしかないよな。
それはおいといて。

スパコン分野は安い4870X2まとめ買いしてソフト開発の方に注力したんだろう。
HPC分野では破格のTeslaよりさらに破格で弾あるしな。

554:Socket774
09/11/17 11:01:44 1fynVpRR
ID:sDLjTGPhは知ったか書く前にまず日本語を正しく覚えようよ

555:Socket774
09/11/17 11:16:31 pT22jC+G
まーCUDAがゴミってのは同意

556:Socket774
09/11/17 11:26:31 0+lMNrJJ
ありえないとソースを一切出さずに言っているのが笑えるw

557:Socket774
09/11/19 21:24:18 7dKtM5JS
いろいろなコードをOpenCLで書いて、Radeon HD 5770で動かしてみたんだけど
GPUがハングアップしたり、clBuildProgramが永遠に終わらなかったり
とっても不安定... (WindowsのGPUリカバリに凄い感謝。Linuxでやったら毎回再起動が必要でとっても面倒だったw)
NVIDIAの方のOpenCLは安定してるのかなぁ ?

AMDさんにはバグだらけなんだから、頻繁な更新をお願いしたいところだけど、
次の更新は何時になる事やら...

558:Socket774
09/11/19 21:45:59 kGZu13vW
毎月更新してんだから遅くても1か月でしょ?
考えることか。

559:Socket774
09/11/19 21:50:53 ZhnFP/kU
GPGPU関係のDLLは毎月のCCCで毎回更新されるわけじゃない

560:Socket774
09/11/19 21:53:55 7dKtM5JS
あれ、毎月更新なのですか。知りませんでした。
今、SDKは11/12がLaunchDateになっているんですが、
中身は10/16のままなんですよね。
と言うことはそろそろ次の更新が来るのかなー。楽しみだ。

561:Socket774
09/11/20 22:12:28 zBOUov3X
AMDのOpenCL実装遅いのですが
これってCPUに続く重大なハードウェアバグですよね?
設計ミスで性能でない商品を売りつけてるんだよね?

562:Socket774
09/11/20 22:23:49 g7Uv+WaB
設計ミスで性能でないのはどちらかというとOpenCLの仕様のような。
汎用性狙うのは良いが、結局そのままじゃどのハードで動かしてもあまり速度は出ない。
速度出すにはターゲット依存の最適化をギチギチにかける必要がある。

DirectComputeの方がGPU的な特性のデバイスで
性能出す上ではかなりマシな仕様


563:Socket774
09/11/20 23:04:44 a7AIcygp
メモリの抽象とかは、5xxx番台とOpenCLはかなり近いと思うから
十分な性能が出そうな気がするけどねぇ。後はAMDのコンパイラの作り込み次第になるのかな。

4xxx番台は、ローカルメモリが実質グローバルメモリ状態だから、
ローカルメモリを使わなきゃいけない場合(=ほとんどの場合)は凄く遅くなりそうだけどね。

そーいえば、DirectComputeは全然調べてないや。OpenCLよりもGPU向けとのことだし、
少し調べてみようかな。

564:Socket774
09/11/20 23:06:12 H5UU0p6K
OpenCLはケチなAppleが旗振りだから、結局PCUnixの連中が手弁当でがんばらない限り発展はしないだろ
DirectComputeは例のごとくMSがどかどか研究費つぎ込むだろうから、環境整備は結構早いと思う

565:Socket774
09/11/20 23:18:59 Z9XJrmOs
>>562
その為にターゲット依存部分はデバイス毎に分けて書くこともできる仕様だから、
全部が間違ってるってわけでもないとも思うがな。

初版の仕様だし、そんなもんじゃね?

566:Socket774
09/11/21 13:12:04 f6DMArnx
>>535
それって、クリアスピードのアクセラレータを駆逐してるだけのような。

567:ラデ厨 ◆TX.Dz2qTUo
09/11/22 18:39:29 bWkox70j
ラデは内蔵メモリを増やすだけがGPGPU対策なんだね(・´ω`・)

568:ラデ厨 ◆TX.Dz2qTUo
09/11/26 20:54:52 /3fPnyA3
結局頼みの綱のOpenCLでも劇遅のようだね(・´ω`・)

569:Socket774
09/11/26 21:35:40 H0U+3ha3
badaboomの体験版はジャギが酷く使い物にならんが製品版だとバージョンが違うからジャギが相当でなくなってる



570:Socket774
09/11/27 04:26:18 LINBMUV6
まともなドライバ更新もできないんだから、GPGPUのソフト開発なんて無理だろw
この際、NVIDIAに金出してSDK移植してもらった方が良いんじゃね?w

571:Socket774
09/11/27 04:50:46 ZpRFWLuG
みんなこれやってよ
URLリンク(www.ngohq.com)

572:Socket774
09/11/27 05:09:37 hZfgkrKn
>>571
なんか、OpenCL動かないんだけど、とりあえずDirectComputeだけ
GeForce GTX260: D12577
Radeon HD5750: D96518

Radeonはちゃんとドライバ入れてるのに、OpenCLサポートがNoになるし、
GeForceは、一瞬でベンチが終わってスコアがマイナスになる。
OpenCLは自分の作ったプログラムやSDKのデモは動くんだけどなぁ。
このソフトは内部でNVIDIAとAMDのOpenCL.dllの位置を自動認識しているらしいから、
64bit版とかインストール先をデフォルトじゃない場所にするとだめなのかな。

とりあえず、このベンチを実行したらGTX260が出力する画面が乱れるようになったw

573:Socket774
09/11/27 07:08:30 knMAqEeD
>>572
一瞬gtx260が12万、5750が9万で260スゲーと思った。

574:Socket774
09/11/27 07:17:00 IAAdAjRq
変なべんちw

575:Socket774
09/11/27 07:43:50 hZfgkrKn
たぶん、ベンチマークプログラムが間違っているんじゃないかな?
v.0.25だと、
GTX260: M73704
HD5750: M27967
なので、こっちの方が妥当な結果に見える。
単純な行列演算ではGTX260はHD5750の半分の時間で処理出来るのでね。

576:Socket774
09/11/27 13:43:49 8cECvxy2
<スパコン>長崎大の浜田助教、3800万円で日本一の速度達成 安くても作れ、事業仕分けにも一石?

「何度もあきらめかけた」というが、3年かけてGPU380基を並列に作動させることに成功。
メーカーからの購入分だけでは足りず、実際に秋葉原でGPUを調達した。開発費は約3800万円。
一般的には10億~100億円ほどかかるというから、破格の安さだ。
そしてこのスパコンで、毎秒158兆回の計算ができる「演算速度日本一」を達成した。

URLリンク(headlines.yahoo.co.jp)



577:Socket774
09/11/27 14:13:08 fk+QuxYO
<スパコン>長崎大の浜田助教 の検索結果 約 2,170 件中 1 - 10 件目 (0.33 秒)

578:Socket774
09/11/27 18:50:28 +BlENlDG
全く性質の違う二つのスパコン比べても意味ないしなぁ
しかも地球シミュレータが作られたのは7年前でしょう

579:Socket774
09/11/27 19:23:03 sMs8dv1c
その業績は称えていいものだと思うが
どんな課題でも158TFlops で計算できるわけではない事は知っておかないと

URLリンク(progrape.jp) の6頁

580:Socket774
09/11/27 23:16:41 MKl/6y2u
>>576
計算速度2PFLOPS(毎秒2000兆回)のGRAPE-DRはスルーですかいw


・・・ところで、GRAPE-DRって完成していたっけ?(’’;)

581:Socket774
09/11/28 00:04:35 zSUAFowA
映像系もいいけどサウンド系のソフト欲しいな

582:Socket774
09/11/28 00:09:51 mo+fN+i+
>>580
あれは・・・おっとこんな時間に誰か来たようだ

583:Socket774
09/11/28 10:33:43 dTeZlDtj
>>581
FM音源のVSTi作ってる人とか居たぞ。
ソフトシンセの世界では、いくつかでてる。

584:Socket774
09/11/28 12:09:28 OETqcr9n
FM音源のMIDIプレイヤーとVSTリバーブは見たけどVSTiなんかあったっけ?
レイテンシ命のDTMじゃGT200やRV870でVSTiはまだ無謀だと思うけど

585:Socket774
09/11/28 16:05:49 HPkLGX1Y
作ってる人もいるんだね、ほんと楽しみだ
レイテンシは構造的にどうなんだろ、問題ある部分あるんだろうか

586:ラデ厨 ◆TX.Dz2qTUo
09/11/29 19:34:23 VyvBZLs/
ラデはレイテンシを隠蔽できる構造にないから無謀だね(・´ω`・)

587:,,・´∀`・,,)っ-○○○
09/11/29 21:01:39 1kopwAVM
L2キャッシュが1MBもないNVIDEOも似たり寄ったりだけどな


588:Socket774
09/11/30 04:18:28 U/HzEC9l
電気信号的なレイテンシなんてそんなに影響出るの?


589:Socket774
09/11/30 20:18:57 5Ydip3hi
>>588
オーディオ関係のマニアは、”事実上はゼロである”という観念がありません。
”実際にない”ことを求めます。

590:Socket774
09/12/01 15:32:03 v+AJtrWb
オーディオプロセッシング関連は
うわさだけでぜんぜん実用レベルまでいってねえよ
同じ奴がソースなしで言ってんだろ?
まあフリーより商用のほうが対応先だろうな

591:Socket774
09/12/01 17:34:23 ILFfBfWd
ソースどころか、ソースコードまで一緒に公開されてますが・・・
ちったぁggrksやまほど出てくるっての。

>ビデオカードでサウンドを生成するFM音源内蔵型のMIDIプレイヤー「g_synth」
URLリンク(www.forest.impress.co.jp)


592:Socket774
09/12/01 19:44:30 AWs1tBtd
音楽製作系の人と聞き専のオーディオマニアは微妙に志向が違う

593:Socket774
09/12/02 00:00:02 EDmxAnKv
開発環境も進化したしこれからどんどん出てきそうだな

594:Socket774
09/12/02 00:26:16 uZ8AkrE/
>>591
それただのMIDIプレイヤーじゃねえか
DTM系の奴は昔デュアルOpteronが流行ったくらい発音のレイテンシに命を懸けてるんだぞ…
未だと最小レイテンシ10msとか廉価環境扱い

595:Socket774
09/12/02 00:31:37 X5jYAOvM
音げー目的か?
普通の演奏とか録音ならまったく問題ないと思うけどな

596:Socket774
09/12/02 00:46:01 S/1P/djR
音はよく分からんけど10msも遅延すると位相合わせるのが面倒くさかったりするんじゃないの?

597:Socket774
09/12/02 09:24:27 g1AdaZRI
GPUに送る電気信号的なレイテンシが、10msとかいくわけが無いw

598:ラデ厨 ◆TX.Dz2qTUo
09/12/03 21:07:46 uiwYNK7o
GPGPUから逸脱してしまってるね(・´ω`・)

599:Socket774
09/12/05 01:51:41 3Lwb2owT
Sandra 2010 GPGPUベンチもあるよ
URLリンク(www.semiaccurate.com)


600:ラデ厨 ◆TX.Dz2qTUo
09/12/07 20:55:44 cpLaJBNb
いよいよGPGPUの時代だね(・´ω`・)

601:ラデ厨 ◆TX.Dz2qTUo
09/12/09 22:31:25 TRB9nl6x
CUDAが日々進歩する中アチストリームは何の更新もないまま放置されてるね(・´ω`・)

602:Socket774
09/12/09 22:37:06 sHDMcF0+
良いじゃねえかこのままゲームはAMD、GPGPUはゲフォでどのPCにも二枚差しで仲良くやってこうぜ

603:Socket774
09/12/09 23:08:21 gqgr6r/n
グプグプもラデだろうな。
Win7はDX11対応が最低ラインだからゲフォはまずはそこからだな。
それ以外はTop500にそれなりに出て来ない限りどうでもいいよ。

604:Socket774
09/12/10 00:22:14 5B1orArU
ゲフォ…というかTeslaはFermiベース?が来年東工大のTSUBAME2.0に大量納入される予定だけど
ラデは既に中国の天河一号に採用されてTOP500中5位のマシンの一部だからなぁ
万が一LarrabeeのGPU版が普通に出来てたらnvidia死んでたわ

605:Socket774
09/12/10 00:32:20 58xuFuyx
そんな遠い話はいいからさー
早いとこエンコなりなんなりにも使えるようにしとくれよー

606:Socket774
09/12/10 15:14:41 q+rJanK1
>>605
Win7で既にトランスコードに使ってるでしょ


607:ラデ厨 ◆TX.Dz2qTUo
09/12/11 23:12:04 7Zv2fhNc
詳しく(・´ω`・)

608:Socket774
09/12/12 00:17:33 O6WO/6UC
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
URLリンク(www.slideshare.net)

609:Socket774
09/12/12 00:31:55 AXLokd1q
Teslaって失敗か?
安くてナンボの世界なんだな

NVは電気代にも配慮してくれ
日本ローカル事情じゃ無理か

610:Socket774
09/12/12 12:39:35 UJL+8Zjg
>>591
合成音声エンジンをGPUで動かせばいんじゃね

611:Socket774
09/12/12 16:56:21 Jeys0BcR
>>610
初音ミクを見るにそこまでしなくてもって感じ


612:Socket774
09/12/12 18:59:28 l+YuSEQo
初音ミクは初音ミクであって人声モデリングとして見たら微妙どころじゃない糞音源でしょ
電子楽器は元々CPUじゃ遅すぎるから専用DSP作って賄ってた分野だから
再現度の高いVOCALOIDはメニーコアCPUやGPUのような今のCPUより高性能なハードウェアで実装されるだろうね

613:,,・´∀`・,,)っ-○○○
09/12/12 19:10:55 LfwDXAhP
サンプル数の問題だろ。
人の声の50音パターンを並べるだけの作業のCPU負荷なんてたかが知れてる。
逆に人の声を動的生成するアルゴリズムの改良が無い限り、GPUなんて使おうが何の進歩も得られない。
つーか固定パターンを並べるだけのほうが楽ではあるんだが


614:Socket774
09/12/12 19:25:00 8yI7zciC
楽器の物理シミュレーションとか手抜きせずやろうとしたら重いね

615:Socket774
09/12/12 21:44:42 ScJ9lZ1i
ミクがくそ音源なのはサンプルが絶対的に少ないから。
演算性能の問題ではない。

616:Socket774
09/12/12 21:49:04 zXpYPT6I
>>613
音色を変えずにピッチを変更するってだけでも結構なコストがかかるぞ。

617:,,・´∀`・,,)っ-○○○
09/12/12 21:51:58 LfwDXAhP
がくっぽいどなんか低音以外全然本人とかけ離れてるだろ

618:Socket774
09/12/12 22:18:54 ScJ9lZ1i
ほんとに打ちこんでる奴いるのか?
PitchBend動かす程度の負荷なんてたかが知れてる。

そんなものより空間系エフェクタのほうがよっぽど負荷かかるわ。

619:,,・´∀`・,,)っ-○○○
09/12/12 22:21:19 LfwDXAhP
これだけは確か


RadeonはFFTに向いてない


620:Socket774
09/12/12 22:44:37 UJL+8Zjg
CPUパワー喰って数値計算いっぱいある処理で
楽しげな使い道だと音声合成くらいかと思うけどなぁ…

621:Socket774
09/12/12 23:01:37 zXpYPT6I
>>617-618
ボカロの処理は知らないが、短時間フーリエ変換で位相の矛盾がないように合成するには相当な処理が必要になるよ。

622:,,・´∀`・,,)っ-○○○
09/12/12 23:45:17 LfwDXAhP
短時間フーリエ変換の「相当な処理」なんてGPUに不向きもいいところだ


623:Socket774
09/12/12 23:50:26 enOtsbrv
どうでも良いが、ハードシンセなんてkorgがoasys(pen4搭載)を出して以来衰退してますが
だが、物理音源ではZ1EX,V1以上のものは知らない
出音はEX5以上のものを知らない

624:Socket774
09/12/13 00:00:09 X1BCs2wY
あとサンプリング使わない純粋なフォルマント音源で
パフューム並の表現力はあるyamahaのfs1r

625:,,・´∀`・,,)っ-○○○
09/12/13 00:08:28 Gw3F5ZKy
ハードシンセの衰退を決定づけたのはMMXが出た頃じゃね?
当時は革新的だったよな。XG音源とかナツい。

元になったDSPはポシャったけど、MMXの登場はx86のソフトウェア需要拡大を決定づけた。

626:Socket774
09/12/13 00:10:33 lViooUoI
>>622
具体的な理由は言えないんですねわかります

627:,,・´∀`・,,)っ-○○○
09/12/13 00:13:34 Gw3F5ZKy
>>626
この惨状が理由だよ
URLリンク(forums.amd.com)

628:Socket774
09/12/13 00:32:49 WN1p6Zn7
mmx pentium必須だったroland virtual sound canvas(VSC-55)とか
SSEつかったyamahaのS-YXG100PVLでVL(物理モデル(簡略))1音+PCMとか
ま、このころは再生だけでやっとこさで、演奏に耐えられるもんじゃなかったが

VLといえばVL70mがいまだに生産終了になってないのが驚きだ

629:Socket774
09/12/13 00:37:35 lViooUoI
>>627
団子だからそのスレッドで何が問題になってるのかわかってると信じて書いておこう。
音声合成で用いる短時間フーリエ変換は基本的に8192点を超えることはない。

630:,,・´∀`・,,)っ-○○○
09/12/13 00:41:15 Gw3F5ZKy
いや、そもそも不向きだからソフトが無いんですよ。
CPU版のACMLにはあるのにGPUには無いものってのはそういうこと。


631:,,・´∀`・,,)っ-○○○
09/12/13 00:50:52 Gw3F5ZKy
URLリンク(www.amd.com)
> 同社のアルゴリズム・チームは、「AMD FireStream 9250」により大規模な1Dの複雑な単精度浮動小数点FFTに
> おいて174 ギガフロップスを達成したと報告しています※3

倍精度かと一瞬目を疑ったけどこれが現実。
大本営発表ですら9250駆使してこれじゃ使えんわ。

残念だがGPUソフトシンセ(笑)が出る前にコモディティなクアッドコアCPUが単精度200GFLOPSに到達するするほうが先だ。
AVX用のFFTは既に俺でも書いてるし。

632:Socket774
09/12/13 01:10:05 lViooUoI
団子は音声合成について少し学んでからレスしてくれ。
> 大規模な1Dの複雑な単精度浮動小数点FFTにおいて
長い1つの数列に対する処理の場合の話でしょ。>>629でFA

633:,,・´∀`・,,)っ-○○○
09/12/13 01:14:24 Gw3F5ZKy
だから具体的に何GFLOPS出せるのよ

634:Socket774
09/12/13 01:19:17 lViooUoI
174GFLOPS以上。

で、CPUでは具体的に何GFLOPS出せるのよ?

635:,,・´∀`・,,)っ-○○○
09/12/13 01:26:23 Gw3F5ZKy
シミュレーションだが、普通にSandy Bridgeで200超える。

636:,,・´∀`・,,)っ-○○○
09/12/13 01:29:46 Gw3F5ZKy
ああ実際コード組んだ訳じゃないのか。
俺のパフォーマンス予想だと実効100GFLOPS以下。
320のデータ並列度で更に何スレッドもインターリーブするから、むしろ大規模じゃないと遊びが多くなるから。

637:,,・´∀`・,,)っ-○○○
09/12/13 01:31:51 Gw3F5ZKy
まさかGPUの特性わかってないの?


638:Socket774
09/12/13 01:34:18 lViooUoI
その200GFLOPS以上とやらでようやく1つの音素が合成できるってだけでしょ?
複数の音素で並列に走らせられるから、そういう意味では十分大規模になるよ。

639:Socket774
09/12/13 01:36:22 lViooUoI
なんで俺がFFTのコード書かなきゃならんのさ。
別に音声合成の研究してるわけじゃないよ。

640:,,・´∀`・,,)っ-○○○
09/12/13 01:41:38 Gw3F5ZKy
なら素人は黙ってな

641:Socket774
09/12/13 01:42:18 lViooUoI
で、具体的な反論はまだですか?

642:Socket774
09/12/13 01:44:29 UcM+1jOt
おいおい、Larrabeeで恥掻いたばかりなのに次のターゲットは大本営ベンチマークすらまだ出ていないAVXかよ…

643:,,・´∀`・,,)っ-○○○
09/12/13 01:45:13 Gw3F5ZKy
反論はできない。なぜなら理論だってないから。

論と脳内妄想の区別はつけよう。
せめてそれなりの資料を示そう。

644:,,・´∀`・,,)っ-○○○
09/12/13 01:46:04 Gw3F5ZKy
>>642
ばーかばーか
URLリンク(software.intel.com)

645:Socket774
09/12/13 01:46:45 yKnayMSN
>>641
さっきから独り言を言っているようにしか見えない俺は団子をNG登録済み。
一々相手にする必要はない。殆どの住人は見限ってる。

646:Socket774
09/12/13 01:53:48 lViooUoI
>>643
どこら辺が妄想なのか指摘することぐらいは出来るよね。

647:,,・´∀`・,,)っ-○○○
09/12/13 01:54:22 Gw3F5ZKy
具体的な数字を示してない

648:,,・´∀`・,,)っ-○○○
09/12/13 01:57:01 Gw3F5ZKy
バタフライ演算用のロジックも備えてない(というかペナルティが生じる)し、CPUに差を詰められるばかりで先がない。
まさか公称1.2GFLOPSが出せると思ってる訳じゃあるまい?



649:Socket774
09/12/13 01:58:10 UcM+1jOt
>>644
で、そのページのどこに実機でも200GFLOPS近い数字が出せるって書いてあるんだ?

650:,,・´∀`・,,)っ-○○○
09/12/13 01:59:00 Gw3F5ZKy
>>649
お前には公開されてないよ

651:Socket774
09/12/13 02:00:27 0aJajCkK
ID:Gw3F5ZKy

652:,,・´∀`・,,)っ-○○○
09/12/13 02:04:39 Gw3F5ZKy
SIMD演算でFFTやる上でネックになりがちなのは俗にバタフライ演算といわれる水平方向の値移動。
URLリンク(upload.wikimedia.org)

しかしまさにこの通りのオペレーションを実行する命令があるんだわAVXには

653:Socket774
09/12/13 02:20:29 lViooUoI
随分進んでしまったようで。

>>647
Cypressは32KBのLDSとアドレッシング可能なレジスタをSIMD Core毎に持ってるから
4000点FFTを同時に20並列実行出来るんじゃねってことで。

>>648
> バタフライ演算用のロジックも備えてない
アドレッシング可能なレジスタ、CPUのSIMDと違って別々の処理が出来るStream Core。
別に要らなくね?

654:,,・´∀`・,,)っ-○○○
09/12/13 02:22:48 Gw3F5ZKy
たぶんRadeonが一番苦手なオペレーションじゃないかな。
CUDAでも同期プリミティブ使いつつShared MemoryにストアしてロードとかしないといけないのでLoad/Storeネック。

LarrabeeでのFFTはかなり素直に書けたんだぜ。おまいらはバカにしてるけど。
4近傍要素に限れば積和演算1命令にswizzle操作を畳み込める。L1キャッシュへのストアなしでな。

655:,,・´∀`・,,)っ-○○○
09/12/13 02:23:31 Gw3F5ZKy
> > バタフライ演算用のロジックも備えてない
> アドレッシング可能なレジスタ、CPUのSIMDと違って別々の処理が出来るStream Core。
> 別に要らなくね?

やっぱわかってないな

656:,,・´∀`・,,)っ-○○○
09/12/13 03:12:55 Gw3F5ZKy
一応書いておくか。

要素数が少ないほどベクトル内の要素移動の頻度が相対的に高くなりその分の演算リソースを
FP演算にまわせなくなるので、原理的にFLOPS数は落ちる。
しかも、最初の数ステージは積和か積差かでプレディケートしないといけない。

こういう要素があるゆえに、一般的にはSIMD演算器のベクトル長が長いほど相対的に不利で、
FFTの要素数がSIMD長を大きく超えてはじめて実効効率があがっていく。
(ただしメモリ帯域がネックにならない範囲で)

174GFLOPSでるのはベストケースで、これより短いと、あからさまにネックになる。

何故こうなるかは仕様書読んでみればわかる。
というかシミュレータなり実機なりで動かしてみれば良い。

657:,,・´∀`・,,)っ-○○○
09/12/13 03:17:55 Gw3F5ZKy
プレディケートっていうか定数パターンとのXORで符号反転すれば十分か。
それでもその分だけはFLOPS数は殺がれることは間違いないが。


658:Socket774
09/12/13 05:52:40 U9qni5tE
スレ開けたら団子だらけでふいたwww

659:Socket774
09/12/13 06:37:51 g7dw5jYu
とりあえず10240bitじゃデカスギル
chromeを見習って出直せ

660:Socket774
09/12/13 08:08:47 00KLpItY
chromeは32bit spを8個まとめたものを1グループとして
その中にcommon register fileとL1 cacheがある
これがnv的に言うとSMだな

それが4つあるのがchrome400/500シリーズ
S3はこれをshader poolと呼ぶ、更にこれに直結する形で
L2 cacheとstream bufferが着く
ちなに固定機能群と、shader poolの演算群は独立の並列構造

粒度は特に語られてはいないが、32bit*8sp*4cycleとしても最大でも1024bit
5400Eで書かれてるように128bit(32*4sp)単位でなら512bit
ま、サイクルは4以下の可能性もあるので、もっと小さいかもな
クソ長い固定機能パイプラインから外れた構造だとレイテンシも短かろう
元がSSEなのが理由かは知らんが、1サイクルでの積和算はサポートしない

この構造だと、何気にcacheはライトバックっぽいんだが
あの高効率はそれが原因か?

661:Socket774
09/12/13 10:57:45 u5EvRrBG
目立たないけど凄いやつ

特にアピールもしない
分かるやつだけが寄っていく

662:Socket774
09/12/13 22:12:40 5ni2gXrg
Google Chromeの話かと思って頭ひねってしまった・・・
Chromeって、S3の方かよw

663:Socket774
09/12/14 00:26:58 YDh/0X6R
名前が一番かっこいいのもChrome。

664:Socket774
09/12/14 01:42:50 XK+8IS33
タクロー

665:Socket774
09/12/14 09:24:11 J64TBleT
団子って基本的に妄想前提で理論付けしてくるよね

666:,,・´∀`・,,)っ-○○○
09/12/14 23:12:59 kgBSmHff
だから実測してみろよ

667:ラデ厨 ◆TX.Dz2qTUo
09/12/14 23:45:37 ZF/7D2OO
10240bitじゃ紙芝居よりも遅いだろうね(・´ω`・)

668:,,・´∀`・,,)っ-○○○
09/12/14 23:48:55 kgBSmHff
ソフトが存在してないこと自体が競争力がないことの証明


669:Socket774
09/12/15 08:06:12 hGxQ/WOZ
団子さんお元気ですか?
ララビーが失敗した今、あなたは何の味方で何を敵にしているんですか?

670:,,・´∀`・,,)っ-○○○
09/12/15 08:33:55 7VClrwiG
消去法でCUDA

671:Socket774
09/12/15 08:44:17 4XaGvXFR
逆神だな。
HPC向けのララビー残るのに乗り換える意味が分からん。


672:Socket774
09/12/15 11:27:37 R6Wx7Qr6
存在しないから俺の理論が正しいとかどこの厨房ですか?
まぁどこにでもいる俺が知らないから有名(実行可能)とかありえないとか本気で思ってる池沼なんだろうけど

673:Socket774
09/12/15 12:45:26 e+JQJy8W
じゃあ存在させてみせろよ。
絵に描いた餅など美味くはないぞ。

674:Socket774
09/12/15 12:59:16 B8geLIZN
>>672
じゃあお前はカタログスペックに釣られて存在してもいないアプリ性能の最強を唱えるマンチキンか。
発想がCellマンセーしてたゲハ坊レベル。


675:Socket774
09/12/15 13:12:41 R6Wx7Qr6
毎回この手の煽りする奴湧くけどまだ発展途上の技術に妄想で決め付けてるのがオカシイって書いてるだけだぞ
自分じゃ技術開発も出来ないくせに文句だけは一人前だな
とくに>>674なんてどこにマンセーしてる意見が載ってると言うんだ?
ホントケチつけるのだけが生き甲斐なんだな

676:Socket774
09/12/15 13:23:08 e+JQJy8W
> 発展途上の技術
要するに現時点では使い物にならないってことだろ

677:Socket774
09/12/15 13:26:25 e+JQJy8W
言い出しっぺが動かないんじゃ発展もしようがないよ?>ID:R6Wx7Qr6


678:Socket774
09/12/15 13:27:21 pXJGMsEM
つまり団子さんの敵はOpenCLとDirectX11ということですか?
それともCUDA Cのことではないから敵ではなく、環境としてのCUDAということで、
敵はATI Streamということですかね。

679:Socket774
09/12/15 17:10:44 cCvgrZeN
発展途上っていか
今のstreamは、真面目にCPU統合しようとした場合
切り捨て確実だよ

680:Socket774
09/12/15 19:12:42 98ViIECX

最高のバカ

681:Socket774
09/12/15 20:40:02 cCvgrZeN
阿保か
10240bitの演算粒度のまま統合してどうするw
CPUとの命令セットの統合はどうするの?
モッサリVLIWのままか?
有り得ないなからw
あ、お絵かき専用だから良いのか
スマンね

682:Socket774
09/12/15 20:58:38 4XaGvXFR
なんだ10240bitの人か。

683:Socket774
09/12/15 21:14:12 cCvgrZeN
10240bitは単なる事実

684:Socket774
09/12/15 21:24:54 nT/l3bnJ
VILWが続くと本気で思ってるんだ

685:Socket774
09/12/15 21:34:31 4XaGvXFR
VLIWは今の密度で演算器を詰め込むためには必要だろ。
粒度変えるのは簡単だが、VLIW構成変えるのは
結局シェーダの新規設計になる。



686:Socket774
09/12/15 21:48:05 cCvgrZeN
当たり前だろ
はっきり言って統合に際しては
AMDのGPUは全て作り替える必要がある
真っ先に捨てられるのがモッサリVLIW

687:Socket774
09/12/15 21:54:40 15x8MbSR
いつも文章一緒だから
もう10240bit乙とでも書いておけw

688:Socket774
09/12/15 21:55:07 8+1RVXjN
逆にすぐにでも統合できそうな構造なのはS3だね

689:Socket774
09/12/15 22:07:31 cCvgrZeN
まだ10240bitが理解出来てないのね

じゃ64要素(単位Pixel)でいいやw

690:ラデ厨 ◆TX.Dz2qTUo
09/12/15 22:47:14 hZmYQfIy
アムダはS3とフュージョンすれば大勝利だね(・´ω`・)

691:Socket774
09/12/15 23:00:34 r1WSeCB3
ID変えてまで主張することなのか

692:,,・´∀`・,,)っ-○○○
09/12/15 23:46:02 7VClrwiG
>>679
お前はバカですか?アホですか?屑ですか?
好きか嫌いかではなく、使えるか使えないかだ。
CUDAは比較的マシなだけだ。

693:Socket774
09/12/16 00:51:29 0YJkovHT
火曜日の最高の馬鹿はID:cCvgrZeNか。OK.把握

694:Socket774
09/12/16 01:42:18 HTvzrumj
ATIVideoConverter使ってみたけど謳い文句は嘘つきとしか言いようが無い出来だな
GPUloadは10%以下でCPU使用率が上がるし、大体読み込めるファイルに限りがありすぎだろ特定のaviとwmvぐらいしか読み込まないとかなんだよこれは・・・
まだbadaboom使ってた方がマシ読み込めるファイルもまあまあ多いし進行速度がプレビュー画面で表示されるしなにより複数起動できて同時進行でエンコ出来るのがいい
と俺は思った

695:Socket774
09/12/16 05:42:48 NKB5iRrP
>692はアンカーミスだろ
>678への

696:Socket774
09/12/16 06:07:32 B63RfcW3
URLリンク(pc.watch.impress.co.jp)
>Bulldozerの実質的な開発リーダーだったMoore氏が、現在、APU(Accelerated Processing Unit=FUSION)を担当しているところも意味深だ。
>AMDの現在のGPUは、NVIDIAと比べると、ずっと既存グラフィックスに最適化している。AMDの勇ましいヘテロジニアスコンピューティングのかけ声とは裏腹に、
>GPUアーキテクチャ自体は保守的だ。もしかすると、AMDは現在のGPU開発チームとは別に、CPUのアーキテクトが中心になったデータ並列コアの開発を進めているのかもしれない。

これってcentaurがS3の演算器作ったのとおなじだな


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch