CPUアーキテクチャについて語れ 23

CPUアーキテクチャについて語れ 23at JISAKU

CPUアーキテクチャについて語れ 23 - 暇つぶし2ch179:Socket774
13/02/18 22:44:26.76 nEpgHK/4
(ﾉ∀`) ﾀﾊｰ

Windows 8は“不発”、家庭市場をけん引できず―IDC Japanが厳しい評価
URLﾘﾝｸ(www.itmedia.co.jp)

Office 2013をインストールできるのは1台のPCだけ―システム破損の場合でも再インストールは不可
URLﾘﾝｸ(japan.internet.com)

180:Socket774
13/02/18 22:48:56.69 fHmb5bwq
>>179
2番目の記事、本当にあってる？
Office 2013は2台までインスコ可能ってパッケージに書いてなかったか？

181:Socket774
13/02/18 22:54:19.65 nEpgHK/4
すまん、179は誤爆

>>180
マジっすか⁈

182:Socket774
13/02/19 09:26:03.01 ICBW2kIl
今は知らんが、昔のofficeは同一人物が
デスクトップとノート持ってる場合を想定して
2台まで可だった記憶がある。

183:Socket774
13/02/19 13:48:21.91 aBMpx+MP
>>180
アメリカ限定での話

184:Socket774
13/02/19 18:01:05.83 rDRYiz1b
URLﾘﾝｸ(pc.watch.impress.co.jp)
SRARC64-X及び、同じアーキテクチャーのT5発表です

10年後は
SRARC64-XⅡ
ARMv10
POWER10+
MIPS64

の4種類がインテルのサーバー用CPUの最大のライバルとなるでしょう

185:Socket774
13/02/19 18:22:08.51 kUvhHvBh
2chは独自研究を発表する場です

186:Socket774
13/02/19 18:23:55.55 3ADckwOx
SPARCって富士通１社がんばってる印象

187:Socket774
13/02/19 20:18:11.75 U4SWp74b
持続可能なビジネスを確立しました

188:Socket774
13/02/20 00:03:50.58 l3gCFSyn
>>184
URLﾘﾝｸ(pc.watch.impress.co.jp)

189:Socket774
13/02/21 18:33:44.67 zs9Gx8dN
PS4のメモリはGDDR5の8GBだってさ

190:Socket774
13/02/21 22:15:42.30 dE2MrfWv
大杉ﾜﾛﾀｗ

191:Socket774
13/02/21 22:29:10.01 4hyLcwr3
少なすぎだろ
2016年あたりでスマホに抜かれるぞ

ソニーの旗艦機を例に、RAM容量の推移
2010年4月 384MB Xperia
2011年3月 512MB Xperia arc
2012年3月 1GB Xperia acro HD
2013年2月 2GB Xperia Z

192:Socket774
13/02/22 00:41:27.70 sfCUS4dq
さすがにネタだよな

193:Socket774
13/02/22 01:12:52.34 Mmnia5VT
PS4はGDDR5
スマホはLP-DDR2（今後LP-DDR3になる）

物もコストも違うし、容量の差は縮まりやすいんじゃない？

194:Socket774
13/02/22 02:47:12.70 OSYEUrnt
GってついてるからVRAMだろ

195:Socket774
13/02/22 03:12:16.62 LqC5M2HJ
正確にはVRAMとメインメモリ共有のGDDR5 8GB
そこはやっぱりAPUなんだねって感じ

まあ、ゲーム機にしてはメモリは多い方なんじゃなかろうか
PS3のメモリは256MB RAMと256MB VRAMだったんだし

196:Socket774
13/02/22 04:53:01.28 4U1pxTtI
メモリーチップ本当に32枚もつんでるのか

197:Socket774
13/02/22 05:07:25.91 PIzmqLJu
GDDR5って32bitか16bit接続じゃなかったっけ？

198:Socket774
13/02/22 18:58:45.82 GNSyqhC5
Cortex-A9 R4って素のA9から25%ぐらいIPC改善してるようなんだが
何をやったんだろう

199:Socket774
13/02/22 22:47:18.07 ukK/Bm4M
クロック向上分が含まれてそう

200:Socket774
13/02/22 23:23:03.86 b6bs29Iw
いや、クロック上昇抜きで25%程度上がってる
SPECintの比較で

201:Socket774
13/02/22 23:27:37.59 ANzvBkdb
上昇率がハンパないな･･･
パイプライン本数増やしたとしか･･･

202:Socket774
13/02/23 00:46:26.08 6iVkVALV
A9はスーパースカラがほとんど効いてないから改善できる余地は大きい。

203:Socket774
13/02/23 02:35:25.03 XjjC2t9q
>>202
スコアボードが、かなり単純なんじゃないかという噂は聞くけど
そういうこと？

204:Socket774
13/02/23 03:13:50.53 6iVkVALV
>>203
具体的なことは分からないけどざっくり言えばARMが想定した命令出現パターンと実際のAndroidの命令出現パターンが大きく乖離していて投機実行が意味をなしていないんだと思う。

205:Socket774
13/02/23 03:36:32.14 F0GcWqWI
いやいやｗ

ROBが足りないとか
RSが浅すぎとか
PRFが少なすぎとか
OoOEするのに必要なリソースが不十分という話でしょ
命令出現パターンが乖離なんていう言い訳はAMDでもしないだろｗ

206:Socket774
13/02/23 03:44:14.46 6iVkVALV
>>205
x86みたいに重装備が許されるわけじゃないから命令のパターンを想定してパイプラインの機能を制限したりバッファを少なくして回路規模を小さくしてるんだよ。そこで想定外の事態に遭遇したらどうなるかってこと。

207: 忍法帖【Lv=25,xxxPT】(2+0：5)
13/02/23 03:45:20.91 6iVkVALV
>>205
x86みたいに重装備が許されるわけじゃないから命令のパターンを想定してパイプラインの機能を制限したりバッファを少なくして回路規模を小さくしてるんだよ。そこで想定外の事態に遭遇したらどうなるかってこと。

208:Socket774
13/02/23 04:29:18.15 +3BWTFG2
何その妄想アーキテクチャ

209:Socket774
13/02/23 10:10:03.44 qxkDhLQv
CentaurのC6思い出した俺。

210:Socket774
13/02/23 11:05:43.04 RScTVwkt
団子が言うには、Cortex-A9のOoOはROBがないらしい
ARMもCortex-A15をFully Out-of-Orderと言っているので、A9はマッピングテーブル方式だろう
しかもFPUパイプは投機実行できない（これはScorpionだけかも）

211:Socket774
13/02/23 15:24:46.71 2xuWLcPd
A9は物理レジスタファイルが56個という値は公式に出てる
あとissue queue(reservation station)は集中型で6エントリっぽい図が公式のスライドにある

ROBに関してはちょっと前にRWT掲示板でも議論になってたけど結論は出てなかったな
このあたりURLﾘﾝｸ(www.realworldtech.com)

212:Socket774
13/02/23 15:33:26.37 vk9afY5U
お客様のなかにCortex-A9のライセンスをお持ちの方はいらっしゃいませんか!?

213:Socket774
13/02/23 17:21:15.17 UrC62WRr
URLﾘﾝｸ(www.eedailynews.com)
SamsungのクアッドCortex-A15コアは2MB L2キャッシュ込みで19mm2、
"a maximum of 30,000 DMIPS at 6W"だそうで

214:Socket774
13/02/23 17:22:37.40 OqTa9Qi0
GDDR5ってのは普通のパソコンのメモリには使えないの？

215:Socket774
13/02/23 17:30:29.36 U6Igjry+
今のパソコン用CPUはGDDR用のメモリコントローラを積んでないのよ。

216:Socket774
13/02/23 18:15:32.86 rNr+ilDy
GDDRは基盤直付けが前提＝M/Bの価格高騰＆メモリ増設が不可能→商品寿命が致命的に短くなる可能性
だから、普及してない

217:Socket774
13/02/23 18:18:43.48 JPAvqQnC
誰の責任で配線距離保障すんの？ってのもあるしねえ

218:Socket774
13/02/23 18:33:55.06 PE0CbV5Y
そこでこの等配線長でなくてもメモリコントローラが伝達時間差を考慮して信号をずらして出すXDR2をですね

219:Socket774
13/02/23 18:59:48.36 xge7f5Bh
逆に言って、メモリコントローラーさえあれば使えるって話でもある

ま、使ってメリットのある用途は限られてる、たとえばゲーム機みたいに
メインメモリとグラフィックメモリ兼用だけど速度がほしいような場合。
その昔sgiが出してたワークステーションなんかも、パソコン用のメモリじゃなく
当時としてはかなり速い（その分高い）メモリ使ってたりして、内蔵GPUなのに
へたな外付けGPUでは勝負にならないくらい速かった

220:Socket774
13/02/23 20:04:23.21 RScTVwkt
GDDRはRambusが特許を持っているし、消費電力が高くて廃熱コストがかかるし、レイテンシーも増える

221:Socket774
13/02/23 20:42:29.60 uBNvWLGk
PS4の中身はどんな姿になるんだろうか？w

222:Socket774
13/02/23 21:08:06.13 /TNpfx6i
ウェディングピーチ二期目とは宗篤

223:Socket774
13/02/23 21:13:15.55 LVHjIHEV
数的な大勢は自作MBのような使い方はしていないわけで、
製品寿命よりも、一つの設計で製品バリエーションを確保する事の方が
メモリのモジュール化の動機としては強いんじゃないだろうか

224:Socket774
13/02/23 21:16:01.23 YTYuWC2k
>213
6wか・・・
a15はやっぱ電力食うね

225:Socket774
13/02/23 21:55:24.68 ijYd0ocW
>>196
仕様は変更の可能性があるって言ってるから減る可能性もある
あとsamsungは4Gbのチップがあるみたいだから、それ使えば16枚で済む
それでもコンシューマーとしては多いが。

226:Socket774
13/02/24 04:15:53.19 M7Dh75nN
エルピーダも大容量チップをダイスタックでサンプル出荷してなかったっけ？

227:Socket774
13/02/24 09:03:54.93 RBZN2xK1
その会社もうないんや

228:,,・´∀｀・,,）っ-○○○
13/02/24 12:01:32.81 0cI3voET
>>210
ソースは後藤記事だ

中の人がROBは電力を食うから持たないようにしたといってるらしいが
2IPC程度ならROBってなくてもどうにかなるんじゃないの？

A15はどういう方式だったか忘れたけど、たしかAMD K7の元アーキテクトが作ったらしく
割と豪華な作りにはなってると思う

229:Socket774
13/02/24 13:58:27.60 vJFwepb7
件のスライドはtraditionalなROBを持ってないと書いてあるだけで
ROBは持っているけれどtraditionalな実装ではないという解釈もできる

RWT掲示板では単なるデータレスのROBの事を言ってるんじゃね、という指摘も

230:Socket774
13/02/24 14:04:50.48 epBvpLP+
preciseな例外を実装するためにはなんらかの機構が必要
ROBがないとしても同等品は必ずある

231:,,・´∀｀・,,）っ-○○○
13/02/24 16:37:50.88 0cI3voET
ARM公式のスライドでは「OoO Writeback Stage」みたいな名前になってたと思う
WB自体はOoO以前の古典的なRISCにも存在するステージだが

232:Socket774
13/02/24 17:26:34.78 vJFwepb7
要はin-flightな実行結果をROBに置くか、future fileに置くか、unifiedなRFに置くかはともかくとして
in-flightな命令の状態を管理する機構は名前は何であれ存在するってことでしょ
それをA9ではOoO Writeback stageと呼んでいる、と

233:Socket774
13/02/25 16:35:25.98 xSPpprs+
URLﾘﾝｸ(www.nvidia.com)
これにA9 R4の改善点がそこそこ詳しく書いてあるね
・L2 TLBがA15相当に(128->512エントリ)
・分岐予測がA15相当に
・L1プリフェッチの改善
分岐予測が一番効いてるのかなURLﾘﾝｸ(images.anandtech.com)

あとA15のROB(OoO window)は128エントリでKraitのは40だとか暴露してるけど
後藤記事ではA15の発表当時はROBは60だという話だったようだが設計が変わったのかな

さらにA15では複雑な命令はmicro-OPに分解して実行してるということもさらっと言ってる

234:Socket774
13/02/26 18:11:58.13 8HTEjCIa
CPUも、高シングルスレッド性能のビッグコアと、高ワットパフォーマンスのスモールコアを
組み合わせたヘテロ構成にするべきじゃね？

ただし、別アーキテクチャ・命令セットに互換性なしのコアを積む完全ヘテロじゃなく、
あくまで命令セット自体は同一のヘテロコアで

235:Socket774
13/02/26 18:31:37.32 e74ag/24
intel　「そんな事するならビッグコアを限りなく低電圧、低クロックで動く様にしてやるわ」

236:Socket774
13/02/26 21:51:48.66 J0KJ89Il
近しきい電圧技術の誕生である。

237:Socket774
13/02/26 22:28:58.51 qYivfpu6
ちょっと感動したｗ

238:Socket774
13/02/26 22:59:39.81 fHrqT7Tz
>>234
別にコアで別けなくても
パイプラインを非対称にするとか、
OoOのパイプライン数を動作状態によって増減させるとかの方法は駄目?

239:Socket774
13/02/26 23:19:12.15 yLGySjp/
>>238
そんなことするよりコアを分けたほうが効率的

240:Socket774
13/02/26 23:20:10.22 ytIrQP8l
Altera、Intelのトライゲート技術を用いた14nmプロセスを次世代FPGAに採用
URLﾘﾝｸ(news.mynavi.jp)

ついにアルテラはファブをintelに切り替えたみたい。
対抗上Xilinxもintelにしないと客が不安がるだろう。

他社も続いてｉｎｔｅｌに乗り換えたいんじゃないかな。
SRAMに近いFPGAはプロセスの初期生産に向いているらしいから他のファブにとっては痛い。

ＣＰＵのハードＩＰコアはARMになるのかＡｔｏｍ系になるか。

241:Socket774
13/02/26 23:29:01.05 fHrqT7Tz
>>240
SRAMに近い構造ってのもあるけど、高集積のFPGAはちょっと高価でも構わないってのが良い所だからな…

ALTERAのArriaV GXのなんざ、1個で普通に20万とかだから…

242:Socket774
13/02/27 00:13:49.25 7v6lDKax
１個１００万超えのFPGAもあるよな

243:Socket774
13/02/27 01:55:14.57 1XacDe/5
ただFPGAってふつうダイサイズでかいから歩留まり良くないといけないよね

244:Socket774
13/02/27 06:24:18.30 BXQO82Ht
atomとの統合SoC出すんじゃない

245:Socket774
13/02/27 19:30:31.55 POPf5EvP
次のphiがペン1コアからatomコアになるから、モバイル用除く全てのインテルCPUにphi
を内蔵して欲しい。低負荷の時はphiがatomとして動作すると。

246:,,・´∀｀・,,）っ-○○○
13/02/28 20:29:09.30 VHJ+CArs
>>243
冗長な構造なのである程度までの欠陥は許容できる

247:Socket774
13/03/01 16:59:31.89 7oR7NorX
phiコアの一つをスモールコアとして使おう

248:Socket774
13/03/01 17:05:17.43 ILJ6Mh2w
しょぼいし、x86互換度が低い。512bitだけがとりえ。

249:Socket774
13/03/01 22:23:01.40 f+0Z/Q7j
キャッシュの効果がほとんどなく、演算速度がほぼメインメモリ帯域に比例するようなアプリでは、
演算用のコアの性能なんて、メモリ帯域を満たすだけあればいいけどな

250:Socket774
13/03/01 23:13:33.04 63uBvVWO
512bitSIMDだけは正直欲しい。

251:Socket774
13/03/01 23:52:57.34 pETPPw1c
んなパラレル化データ持ってうおさおしてたら
帯域とかページングで虚弱メモリが死亡するわ

252:Socket774
13/03/01 23:56:02.05 63uBvVWO
なぁに、今やオンチップで8MBもメモリがあるんだ。
ちょっとやそっとじゃミスヒットしやせんよ。

253:Socket774
13/03/02 00:43:33.24 h28a7Ul5
キャッシュがミスヒット前提ならALUが1個でもオーバースペックでパイプライン段数も4段以下で余裕だな。
SDRAMはキャッシュが無いと無意味だから頑張って40nS(25MHz相当)位の非同期DRAM高速を使うとして、CPUのクロックは50MHz以上上げても無駄か。

254:Socket774
13/03/02 11:23:54.39 XwspwvQe
揮発とか物理アドレスとか朽ちた看板は残っているけれど
DRAMなんて本質は既に遠いストレージ

255:Socket774
13/03/02 11:38:32.51 i/9wH5Zn
物理的には数cmの距離なのに、
遥かに遠く時間のかかるところにいる。

僕とあの子のようだ･･･。

256:Socket774
13/03/02 11:44:24.18 lon9tgS8
ストール中は別のスレッドを動かせばいいのさ

257:Socket774
13/03/02 13:39:07.32 /zkTGeSV
つ[Niagara]

258:Socket774
13/03/02 14:09:07.49 kSM9rG67
命令ウィンドウをアホみたいに大きくしとけば1スレッドでも...

259:Socket774
13/03/02 18:24:59.56 qE7fS32v
あ

260:Socket774
13/03/02 18:43:10.13 qE7fS32v
a

261:Socket774
13/03/03 05:00:19.33 s88teI5Y
>>191
今年度中に4GB到達
URLﾘﾝｸ(juggly.cn)

262:Socket774
13/03/03 06:22:03.60 dpeCjfxU
なんのために

263:Socket774
13/03/03 08:42:41.83 qI3b6bGS
来年は6GB、再来年は8GBですか・・・・
もう小型のPCだね
冗談で言われていた5型以下のスマホが4kの解像度・3Dゲーム・動画撮影・動画エンコード･デコードに
普通に対応しそうな勢いだ。フルHDも早くも時代遅れと言うことになるんだろうな
LPDDR4が搭載される頃には間違いなくそうなっているだろう

264:Socket774
13/03/03 08:45:51.51 1rpVIWhe
今に始まった事じゃないが、もはや電話じゃねぇな。

265:Socket774
13/03/03 12:11:09.80 dpeCjfxU
Android OSが数百MB占有するので、2GBにするのはわかる。
4GBは何に使うのかわからん。

266:Socket774
13/03/03 14:13:15.64 dBIsm/WJ
ロジックもメモリも全然「スマート」じゃないな。
　スマフォのハード　全然スマートじゃない
　スマフォのソフト　全然スマートじゃない
　スマフォ依存のライフスタイル　全然スマートじゃない
　スマフォ業界で一儲け　スマートかも

267:Socket774
13/03/03 15:10:18.80 3FtkxYD0
VRAM 100M
OS基本部分 100M
OS上位部分 100M
裏で動いてるプリインストールアプリやら自分でインストしたアプリ等 100M
これでメモリ400Mくらいは食う
だからメモリ2Gくらいはほしい

268:Socket774
13/03/03 15:23:45.60 COfZ1czj
残りの1.6GはRAMディスクですね

269:Socket774
13/03/03 16:33:32.88 nCxCy146
ついにPhotshopがスマホに進出か

270:,,・´∀｀・,,）っ-○○○
13/03/03 19:26:17.00 KhkXQ8y4
ゲハで話題になってたけど

村上福之の「ネットとケータイと俺様」
URLﾘﾝｸ(blogs.itmedia.co.jp)

ドラクエが「めんどくさい」ならやらなきゃいいだけなのに
挙句にスマホのゲームが面白いとかいったい何なのかと

「ゆとり」化してるのは子供だけじゃなかったんだな。

271:Socket774
13/03/03 19:35:38.72 g14eiOVm
ゆとり化した人たちがターゲットって話じゃないの

272:,,・´∀｀・,,）っ-○○○
13/03/03 19:41:39.40 KhkXQ8y4
でもゲームってめんどくささ（とそれによる達成感）を楽しむためのものだよね

273:Socket774
13/03/03 19:48:28.81 COfZ1czj
まとめ：
俺の脳みそがスマホ脳になって、思考力が落ちて、ドラクエの文法が全部すげー面倒くさい！
本体込で2万円出したゲームも、スマホゲームも楽しさが値段で比例するわけでもない。
それでも、ドラクエぶっつづけで遊んでる俺ガイル。

274:,,・´∀｀・,,）っ-○○○
13/03/03 19:50:42.72 KhkXQ8y4
トイレ行くのもめんどくさくなってペットボトルで用を足す人間の思考をみてるようだ

275:Socket774
13/03/03 19:51:27.52 3FtkxYD0
レバー回すだけ、3つのボタン押すだけのパチンコ・パチスロのほうが
ゲームより市場規模が大きい

モバゲーやグリーは、ゲームの世界に、パチンコやパチスロみたいな
猿でもできるような操作を持ち込んだ

276:Socket774
13/03/03 21:12:05.63 TT0GLjuX
導入部から実際のゲームスタートまで延々長い演出とかはうんざりする

277:,,・´∀｀・,,）っ-○○○
13/03/03 21:26:14.38 KhkXQ8y4
そーいやPS版のDQ7は最初のスライム戦までがやたら長かったな
あれのせいで3DS版はやる気がしないんだが

278:Socket774
13/03/03 21:26:15.46 1h4Tebm6
ドラクエ全盛時ですらめんどくさいといって投げちゃった奴もいた
そういうのを救う意味で、簡単ゲームもありだと思う
自分でやりたいとはそれほど思わないけど

279:Socket774
13/03/04 01:18:16.99 hoQ3YPph
次世代ハイエンドDRAM「DDR4」の全貌
URLﾘﾝｸ(pc.watch.impress.co.jp)

280:Socket774
13/03/04 08:04:08.95 l+3dSEQp
ゲームは内容如何以前に課金の在り方が胡散臭くなってきたので心が離れたな…

281:Socket774
13/03/06 22:29:52.70 tHMp18yZ
ハイパフォーマンスコンピューティング市場はマイナス成長
URLﾘﾝｸ(www.itmedia.co.jp)
＞HPCサーバ市場の2011年～2016年の年間平均成長率（CAGR）は、
＞マイナス16.1％になると見ている。ただし、価格対性能比に優れた
＞x86サーバ市場に関しては、プラス4.7％で推移するという。

282:Socket774
13/03/06 23:31:32.78 L3l+W0Vs
金額ベースはマイナスでも
ByteやFLOPSベースならプラスなんだろうな

283:Socket774
13/03/07 06:37:25.25 J6Hbxc9S
安価なGPUに置き換わっていくからな

284:Socket774
13/03/07 08:44:57.46 knT9U3Xs
GPUはオプションとして付加。
GPUのメモリがメインメモリの役割を果たしていないから、
置き換わりって表現は違和感あるわ。

PS4式のAPUで作ったスパコンなら違和感ないかな

285:Socket774
13/03/07 08:52:57.68 /520WYDe
コードチューンが適切で演算装置になに持ってこようが簡単に乗り換えられるからダメなもんが棄てられ忘れ去られるの早いよ。
手段と目的をまぜこぜにする馬鹿がプロジェクトに混じり込んでなければね

286:Socket774
13/03/07 15:40:05.61 VEZHIUPL
【PC/AMD】次世代APU「Kaveri」はメモリ帯域確保のためにDDR3に加えGDDR5にも対応か？
ｽﾚﾘﾝｸ(poverty板)

287:Socket774
13/03/08 11:22:25.00 ZnpFf/bq
このスレの住人から見たら、このようなVector co-processorは役に立ちそうですか？
Jaguarコアに対してコア毎に512bitの数値演算コプロを付けるみたいな話。
多分、命令はJaguarコアからAVX(256bit)命令のように、仮にAVX2(512bit)命令
を発行するみたい。但し、大量のデータ処理を想定しているのか、データは
メインメモリからキャッシュを経過せずに持ってくるみたいで、またwideIOを考えて
いたのか、co-processorの速度はDRAMのコアの速度に近いぐらいに遅い。
URLﾘﾝｸ(community.us.playstation.com)

288:Socket774
13/03/08 12:00:08.98 2CbOoCCG
ナンセンス

289:Socket774
13/03/08 14:07:24.13 gKU9bSr7
逆だろ考え方が。それが有効な場合につける、有効じゃないなら別の策

290:Socket774
13/03/08 18:40:22.31 wFDJukjs
個人の妄想をこのスレに持ち込むな
しかもFusionでSSE命令をGPUに発行する並みの酷い妄想だそれは

291:Socket774
13/03/08 18:45:45.55 wFDJukjs
いやそれ以下か、300MHzで512bit FMAとか9.6GFLOPSしかない
Jaguar 1.6GHzの1コア分にも満たないｗ

292:Socket774
13/03/08 19:13:30.70 sbxX0ohd
DRAMのレイテンシは伸びる一方だ

293:Socket774
13/03/08 20:50:30.86 3gBdRZ3e
実時間ベースでは変わってないけどな。

294:Socket774
13/03/09 08:02:46.80 5zazbwta
クロックだけ見て勘違いするアホが多い

295:Socket774
13/03/09 08:26:41.58 AnX+hSbI
プロセッサのクロックが低いからレイテンシは相対的に下がってる。

296:Socket774
13/03/09 08:31:55.21 PF8Vq9So
ageia physx 58gflops

297:Socket774
13/03/09 09:38:26.52 u/NGHOeG
Prescottの30段パイプラインはﾌｲﾀｗ

298:Socket774
13/03/09 09:41:30.19 M96O3INL
P3の頃はFSBの10倍以上とか当たり前に在ったな。
今は倍率下がったもののコア数増えたからどっこいか。

299:Socket774
13/03/09 16:10:44.22 j0yfvdn7
PC-98の時代はメモリアクセスノーウェイトとかだったな
486の頃からノーウェイトじゃなくなってきた感じ

300:Socket774
13/03/09 21:05:50.94 MFzzqdDY
286のころ、エプソンが10MHｚノーウェイトと宣伝を打っていた
裏返せばそのころウェイトが入るのが多かったということだと思う

301:Socket774
13/03/09 21:18:27.66 SQ5y/Kkf
ノーウエートつってもメモリアクセスに最低2クロック掛かるんだけどね。

302:Socket774
13/03/10 03:47:13.07 PYQr0izk
まああの頃2次キャッシュもソケットとか専用バスに刺す方式だったし…

303:Socket774
13/03/10 04:09:01.09 uoP+XW/8
当時はコードの自己書き換えとか当たり前だったな

486のときに、先読みの中に入ってる部分を自己書き換えして
正常に動かないとかそんなトラブルが出てくるようになった

Pentium以降は、そもそも自己書き換えは行わないとか、
仮におこなう時は、自己書き換えをサポートする専用の命令を使うなり、
よほど注意して設計しないといけなくなった

304:Socket774
13/03/10 07:18:01.04 NUMem1dZ
Winになってから変化するウイルスの話を聞かなくなったが、それか。
考えてみりゃ当然の話だわ。

305:Socket774
13/03/10 08:16:13.86 lGgiUKWx
プログラム書き換えながら実行とかマジキチｗｗｗ

306:Socket774
13/03/10 11:08:15.06 q47nq6PS
素人の質問だけど、自己書き換えの最中にエラー等があった場合
本来のコードというか、以前の自身をきちんと担保してるのかい、そういうのって
最適化というよりは肥大化という感じで、何かあったら最初に戻れるますよ?、的な対策とでもいうか
作法としては随分乱暴なんだね

307:Socket774
13/03/10 11:31:34.74 HM935XU5
メモリ空間上でプログラム同士が相手を探査、爆撃して
動作不能に追い込んだ方が勝ちという競技があったが
あれいつまでやってたのかな

308:Socket774
13/03/10 14:04:33.82 NUMem1dZ
OS部分を爆撃せんのかそれ。

309:Socket774
13/03/10 15:20:17.95 lWtfzNFH
＞コードの自己書き換え

これ何かメリットあるの？

310:Socket774
13/03/10 15:35:43.29 p/IfX67A
>>309
高速化、省メモリのために良く使われていたがな。

311:Socket774
13/03/10 15:39:18.93 oL1wTrwq
>>309
動作しながらアップグレード可能とか。

ウィルスとかバックドアを仕込むのに便利じゃね？
動作中のプロセスのどこかに自分のコピーを埋め込むとか。

312:Socket774
13/03/10 16:03:41.33 HM935XU5
>>308
仮想マシン上でやってもいいし、実ハードでやるにしても
特権モードとかうまく使えば何とかなるんじゃないかな。
試合場、場外の扱いなどもルールで定められていた。
具体的なルール詳細は憶えていないが。

313:Socket774
13/03/10 16:54:43.55 oJRa0sVD
フラットメモリモデルでプリエンティブマルチタスクで爆撃ゲー遊びに使える環境・・・・
何があるんだろ OS-9 くらい？

314:Socket774
13/03/10 17:08:18.94 6N6+bu4t
>>309
最近だとJITコンパイラが

315:Socket774
13/03/10 17:09:57.99 zK0C9tkB
これだな
URLﾘﾝｸ(ja.wikipedia.org)

316:Socket774
13/03/10 17:12:45.74 7athz7aA
まあ最近のOSは基本的にtext sectionが書き換え不可だからな
自己書き換えしたけりゃコードをdata sectionに置くしかない

逆アセンブリ避けなんかには使えるよ>自己書き換え

317:Socket774
13/03/10 17:29:45.23 ORGtFAAk
>>316
dataは実行できないから

318:Socket774
13/03/10 17:40:52.76 tPJwN1aJ
スタック書き換えてとば゛ば動くだろ

319:Socket774
13/03/10 17:44:50.18 7athz7aA
WindowsはDEP有効だと問答無用で無理なのかな?
LinuxやOSXだと実行不可属性を付けないで使えば実行可能

320:Socket774
13/03/10 18:22:26.01 lWtfzNFH
ウィルス作りが捗るな

321:Socket774
13/03/10 18:50:58.03 HM935XU5
自己書き換え禁止って、計算可能性に変化はないのかな。
単に近道が塞がれるだけなのか、それとも
どう頑張ってもできないことが発生してしまうのか、どちらなんだろう

322:Socket774
13/03/10 19:01:23.23 QYs4STib
窓でも設定しないとシステム関係以外DEP無効だが

323:Socket774
13/03/10 19:54:20.85 CDXc302R
>>313
Level1の貧乏人乙

324:Socket774
13/03/10 22:24:18.10 6N6+bu4t
>>321
チューリングマシンでも書き換えるのはテープ部分だけで
プログラムに相当する状態部分は固定だから問題なさそう

325:Socket774
13/03/11 00:01:55.84 0m6eOIyC
自己書き換え懐かしい。

よくやられてたのは、
特定のイミディエート値を書き換えるとか、
inc を dec に変えるとか、
その程度の書き換え。

計算可能性には何の影響もない。
インタープリターのようなコードが書けるから、
データ部分の書き換えとコード部分の書き換えに差は出ない。

326:Socket774
13/03/11 00:06:59.62 snbyCndl
飛び先の変更とか

実行禁止ビット立ってる場合のトランポリンの実装はどうなったんだっけ

327:Socket774
13/03/11 01:30:38.63 Cy4MFWFe
なんか__enable_execute_stackとか呼んでるね、gccだと

328:Socket774
13/03/11 05:43:20.23 DEqCSMjv
セカンドキャッシュ外付けでも性能が上がったように見えたのはベンチマークに騙されていただけだったんだと
初代セレは教えてくれた｡

329:Socket774
13/03/11 06:48:38.81 DCTqE7kZ
一応突っ込むと初代セレはL2無ぇぞ。
「外付けL2意味無ぇ」という意味だったらすまぬ。

330:Socket774
13/03/11 14:47:56.04 4P8X48Or
いまでも特権モードで動くデバイスドライバは、ロードするたびにOS自体を自己書き換えしてるようなものだな

331:Socket774
13/03/12 00:21:10.53 m4aWXip6
>>321
チューリング完全でぐぐって。

332:Socket774
13/03/12 00:43:17.89 k03Grrfw
自己書き換えとかラベルが低い。昔は命令列の途中に飛び込むとひとつのコードが二つの用途に使えるという物もあった。
オペランドとオペコードが逆転して動くという。

333:Socket774
13/03/12 13:06:14.12 O4RQuNdo
>>329
2次キャッシュオンダイの河童は256bitクロック等速で半速64bitx2のKatmaiとはダンチすぎて
128KBの河童セレでも早かったぬ…遅い外付け2次キャッシュに意味はなかった…

334:Socket774
13/03/13 20:34:45.37 sq2b5Apk
>>146 より引用
＞ルネサスを含めた３社統合が難航しているのは、統合事業が折り合わなかったためとされる。
＞ルネサスは再建過程で、不振のモバイル端末向けＬＳＩ事業を統合対象と
＞することを望む一方、収益が高く「今後も資源を集中させる」（同社関係者）としている
＞自動車や産業機器向けなどについては自社で事業を継続させる意向が強い。

そしてその顛末は、、、

ルネサス、富士通・パナと事業統合断念　システムＬＳＩ
URLﾘﾝｸ(www.asahi.com)

ルネサス、モバイルSoC事業の売却検討を発表
URLﾘﾝｸ(techon.nikkeibp.co.jp)
＞RMCは、2010年12月にルネサス本体のモバイル・マルチメディア事業を分離し、
＞ここにフィンランドNokia社のモデム（ベースバンドLSI）部門を統合して始動した。
＞だが、スマートフォン市場の波に乗れず、「過去約2年間に多大な損失を計上している」（ルネサス）という。

スマホ向けアプリケーションプロセッサの悲惨な戦歴
MP5225 → 採用は2機種（101K、WX04K）
MP5232 → 採用なし
MP6530 → $200～400のミドル～ハイエンドスマートフォンに採用が決まっている・・・らしい

335:Socket774
13/03/14 10:50:53.05 fpgVFMcF
ルネサスのスマホチップはモデムもついてるの？
モデムがついてるなら、どこか買ってくれる会社はあるだろ

336:Socket774
13/03/14 23:28:26.33 doDhTRCs
Analysis: AMD Kaveri APU and Steamroller Core Architectural Enhancements Unveiled
URLﾘﾝｸ(www.brightsideofnews.com)

337:Socket774
13/03/14 23:54:16.38 FyDKo3G5
>>336
GJ！！

うぉい！！
メモリ空間統合されてるじゃねぇか！！
ガンガンHSAだわ。

ディスパッチャ分離とかどうでもえぇｗ

338:Socket774
13/03/16 00:11:18.96 C4g15OwE
日本半導体・敗戦から復興へ
早期退職者の内訳から見るルネサスの内部事
情那珂工場の旧日立社員に期待するしかない
URLﾘﾝｸ(jbpress.ismedia.jp)

339:Socket774
13/03/16 16:45:07.69 hiwQIuHS
>>338
うわぁ･･･ボロクソに書かれてるなｗ

NEC社員はプライドが高いのか。
なんかいっしょに仕事したくないなぁ･･･。

340:Socket774
13/03/16 19:22:35.49 d9f9YMLy
正直NECって日立や三菱と比べると格が落ちる気がするけど
変なプライド持ってるんだな

341:Socket774
13/03/16 19:31:34.50 hiwQIuHS
そういや、玉川にあるNECのビルに行ったことがあるけど、
あんなキレイな建物で仕事してたらエリート気分になりそうにｵﾓﾀｗ

342:Socket774
13/03/16 19:49:01.06 TnIPyUoD
元国営じゃなかったっけ？

343:Socket774
13/03/16 20:40:10.19 rMxxsFdR
>>340
どこも大きな会社だからどの分野に詳しいかによって印象は変わるだろう。

344:Socket774
13/03/16 20:48:29.85 k9PrqI4C
それぞれ住友日産三菱だから

345:Socket774
13/03/16 21:27:05.23 5OudwYbR
製造業は、管理部門が権力を持ちすぎて、官僚的な管理部門が全部取り仕切ると
おかしくなってくる

346:Socket774
13/03/16 21:34:33.74 k9PrqI4C
要するに製造部門が弱体化したのがそもそもの原因ということ

347:Socket774
13/03/17 13:00:35.11 5+bqpGmz
国営というか電電御三家の一角要するに天下り官僚の巣窟
ゴミを養う事を優先して金を生み出す事業を軽視し続けた馬鹿者共

348:Socket774
13/03/17 13:06:44.28 XJGgMVDe
盛者必衰か。

349:Socket774
13/03/17 14:52:07.80 lDNds26W
養ってもらってよかったな

350:Socket774
13/03/17 16:24:06.04 Q3lmIXQX
設備投資資金が無いからプロセスレースを降りたのに
降りた後に国費で支援とかチグハグすぎだな

351:Socket774
13/03/17 16:31:17.77 SBvycj7M
外資KKRサイドの記事に釣らんな

352:Socket774
13/03/17 16:33:17.26 XJGgMVDe
最新のデジタルガジェットに関しては日本メーカーを誇れなくなっちゃったなぁ･･･
みーんな海外だ。

353:Socket774
13/03/18 10:48:57.41 Y1SAJhRl
先端プロセスに果敢に投資して大成功したTSMCみたいな例もあるし、
リスクを避けたらより大きなリスクがやってくるとかよくあること

本業が重電とかの会社は、半導体でリスクを避けても本業回帰とかでなんとかなっても、
半導体が本業の会社がリスク避けて脱落したら会社倒産規模のリスクがやってきたって感じ

354:Socket774
13/03/18 13:53:25.25 tJlRRKmt
ルネサスの鶴岡工場ってTSMCに買収拒否られてたんだな
ﾜﾛﾀ

355:Socket774
13/03/18 21:10:56.00 POfNf56n
>>354
ﾜﾛﾀｗ

356:Socket774
13/03/22 07:49:10.26 jMx8h7/X
>5120D, 3120A, 3120P, 7120P, 7120X

Xeon Phi 5種類も売るんか

357:,,・´∀｀・,,）っ-○○○
13/03/22 20:13:07.39 v+SLiCa2
>>341
新幹線の品川-新横浜間通過時にみえるように作った建物だねあれは
岐阜にある三洋（現Panasonic）のソーラーアークしかり。

昔詰めてたときに仕事終わりに駅の近くの中華料理屋でよく飯くってたけど

358:341
13/03/22 20:23:46.85 Tp3O89NP
>>357
え！？
団子さん、あそこで仕事してたことあるの！？
うわぁ～、団子さんがいたところに行ったなんて、何かうれしいなぁ～ｗ

359:,,・´∀｀・,,）っ-○○○
13/03/22 20:55:13.62 v+SLiCa2
あそこの建物今ルネサスの「本店」でもあるのか・・・
NEC関連企業が雑居してるビルだよね

食堂はあんまり美味しくなかった覚えがある
あとエレベータの移動が面倒

360:Socket774
13/03/23 01:07:53.92 TF36b7hU
穴のあいてるビルだっけ
売ったとかいう話を聞いたような記憶があるんだが

361:Socket774
13/03/23 05:32:57.26 BzRTdhcM
穴の開いてるビルは新橋のあたりの本社ビルで、いま話題位になってるのは武蔵小杉（向河原）あたりにあるビルでしょ？
本社ビルは不動産屋に売って賃貸で借りてるんだっけ？

362:Socket774
13/03/23 17:21:25.97 Ad6E1HZX
富士通研、CPU間の大容量データ伝送に向けて4波長シリコン集積レーザを開発
URLﾘﾝｸ(news.mynavi.jp)

東芝、組込機器向けメニーコアLSIに対応する低消費電力OSを開発
URLﾘﾝｸ(news.mynavi.jp)

363:Socket774
13/03/23 17:30:22.44 QdVrg0eM
>>362
何かよーわからんがスゲーｗ
東芝、OS作るのかｗ

364:Socket774
13/03/23 17:48:59.12 NoOyPkeF
組み込み用OSは規模も大きくなく各社持っている

365:Socket774
13/03/23 17:53:41.37 QdVrg0eM
そうなのか！

366:Socket774
13/03/25 15:51:12.36 cJ/h6K7f
SandyBridge-EのCPUって64bit整数の33bit以上のシフトって何サイクルかかる？
32bitのバレルシフタだったら2サイクルかな？

367:Socket774
13/03/25 16:12:31.92 ANQeL9co
3万サイクル

368:Socket774
13/03/25 19:53:43.43 GVPngKrB
シフト量問わずレイテンシは1サイクルだが

369:Socket774
13/03/25 23:42:46.67 cJ/h6K7f
そうなんか。さすがIntelのCPUはすごいな

370:Socket774
13/03/25 23:54:09.10 H1sf+LMR
IntelさんはNo.1や。

371:Socket774
13/03/26 01:18:59.68 fWpzZUh5
そもそもシフト量関係なく1クロックでシフトできる演算ユニットをバレルシフタというんじゃないのか。
昔のCPUはシフトするビット数に応じてクロック数を要したぞ。

372:Socket774
13/03/26 01:23:44.70 JJwYImFN
>>371
> 昔のCPUはシフトするビット数に応じてクロック数を要したぞ。

歳がバレルシフタ

373:Socket774
13/03/26 01:34:41.20 aQwgGbGp
だからハードウェアリソースの制限（バレルシフタは結構なリソースを要する）で
語長より小サイズのシフタしか実装できなかったりすると1クロックじゃ処理
できないけど、実際のところどうなのよ？

って話だろ

374:Socket774
13/03/26 02:15:48.21 ERecHyy2
x86-64の実装で64bitのシフトが32bitに比べて遅いのはPrescottぐらいじゃね
Atomですら1クロックでこなす

375:Socket774
13/03/26 04:00:34.95 pGqidC2V
URLﾘﾝｸ(av.watch.impress.co.jp)
PS4のGPUはキャッシュを迂回して読み書き出来る
L2キャッシュにタグ付けた　タグ付きデータは直接メモリに書き込み
8つのパイプがあり、それぞれに8つの演算キュー
HSAは使わない
シェーダー言語は独自の物、その内OpenGLやDXも
OSはBSDベース

376:Socket774
13/03/26 08:23:19.17 jQLhvCa7
>>372
ﾜﾛﾀw

377:Socket774
13/03/27 00:29:43.77 gXFDyQ/+
>>372
おまえ、おもしろいな

378:Socket774
13/03/27 09:24:09.28 6wgafeSP
>>375を見るとCPUにも変態仕様をしこんで、封印していても不思議ではないか…
>>287のVector co-processorがサウス相当のセカンダリープロセッサについて
いそうな感じですね。コア速度がGPUとは異なるので別物みたいだし。
省電力＆発熱させないチップなので、低速コアの数値計算器となるのかな。

379:Socket774
13/03/27 09:28:05.58 DWLidSxY
>>378
何を言ってるのかよくわからないが、PS4についてはそんなものは無い

380:Socket774
13/03/27 09:46:31.85 LSn0mB/7
>>375
Cell もローカルメモリじゃなくて、キャッシュに明示的な
制御を加えてローカルメモリ的にも使える二刀流で
データパスの自由度もあったら
あれほど嫌われなかったのに、もったいなかったな。
それはもうCell じゃない？

381:Socket774
13/03/27 10:06:25.19 DWLidSxY
>>380
ローカルストアでなければ速くコンパクトにはならない。つまり、そんなものは作れない。

382:Socket774
13/03/27 11:09:01.20 LSn0mB/7
キャッシュシステムって単なるSRAMよりもずいぶん大きいの？

383:Socket774
13/03/27 11:20:36.18 XOVzpjSM
全く同じ技術で作ったとして、キャッシュとメインメモリが矛盾しないようにするための仕掛けがキャッシュには余計に要るだろ
逆に言えばローカルメモリだと、それだけコンパクト、あるいは大容量にする余地があるともいえる

384:Socket774
13/03/27 11:35:44.48 HUXXVx2i
CELLのSPEがあの小さなコアであそこまで高速だったのは、LSだったからだろ
メインメモリ共用なら、高速化するために複雑なキャッシュ機構が必要で、ダイが肥大化してた
そこまで肥大化するなら、PPE積んどけばいいじゃんみたいな話になるとおもう

385:Socket774
13/03/27 15:26:37.02 LSn0mB/7
差があることくらいわかる。尋ねたのは差の程度

386:Socket774
13/03/27 21:02:27.62 UUJPidYP
全9コアでコヒーレンシ持ったキャッシュ機構だと速度がL2相当、
つまりLSは6サイクルだっけ？あれが20～30サイクルに

またフルプログラミングDMAからハードウェアの自動フェッチだと
メモリ帯域の浪費も大きくなる

って辺りもあるんじゃないけ？

387:Socket774
13/03/31 20:16:59.30 czJ0oZnn
もしCellが作られたのが20nmプロセスとかなら、
各コアに1MBとかのLSのせてもっと使いやすくなってた気がする

388:Socket774
13/04/02 02:26:38.98 ryA01hHo
K7/K8/K10のROBって同時にデコードされた命令グループ単位での管理?

389:Socket774
13/04/02 03:22:58.93 RtmlqqQK
>>371
SHL AX,3　って出来る（１以外を指定できる）のがそうだと思ってた

390:Socket774
13/04/02 03:54:53.37 HvGUB9qH
CLレジスタの内容に応じて複数bitのシフトを行う命令は8086時代から実装
されてたが、当時の集積度ではバレルシフタなんて搭載不能だったんで
マイクロコードで1bitシフトをループさせてただけ

391:Socket774
13/04/02 19:33:33.13 qN3WC3vQ
ふと疑問に思ったんだけども、もし仮にNetBurstアーキを今の技術
(32～22nmプロセス、12MB、もしくはそれ以上の大容量キャッシュetc)
で作った場合でも、性能は振るわないものになってしまうのかな？

392:Socket774
13/04/02 19:48:30.88 11VYuxwG
>>390
歳がバレルシフタ。

393:Socket774
13/04/02 19:49:01.11 11VYuxwG
>>391
4GHz超えは余裕そうだよね。

394:Socket774
13/04/02 20:00:01.42 wL8GOjkX
ま、Coreシリーズより性能が上になるようならそっちを作ってるはずだから
少なくとも現行CPU以下なのは確実だよな

395:Socket774
13/04/03 00:45:52.11 McMkJYyA
古く少ないトランジスタのアーキテクチャを使って最新サイズのトランジスタを
疎に並べたら、冷却OCのような高クロックで動かせるんじゃないかと
前から思ってるが、最新ロジックを密に並べて熱密度でクロック上限が
決まるものに勝てないんだろうな

396:Socket774
13/04/03 00:47:48.40 1i4djCGL
Phiみたいに魔改造して数で勝負とか

397:Socket774
13/04/03 01:46:51.39 tvrGtync
旧いアーキテクチャはパイプライン段数が極めて少ないからそもそもクロックも伸びない

398:Socket774
13/04/03 01:59:30.12 U73Mgjam
じゃあパイプラインを30段くらいに分割すれば
20GHzくらいまでいけんじゃね?

399:Socket774
13/04/03 02:08:15.82 1i4djCGL
インテル版64ヴィットx86がどんなものだったか気になるな

400:Socket774
13/04/03 06:57:16.56 XxXaodNZ
Prescottのハイパーパイプラインは32段だったんだぜ。

401:Socket774
13/04/03 07:12:05.26 h8a7/J1K
ヴィット

402:Socket774
13/04/03 07:29:39.52 McMkJYyA
>>397
あまり詳しくはないんだが、
複雑さが似通っているなら、パイプラインが深い方がクロックをあげられるが
そもそも単純ならクロックをあげるために深くする必要性は乏しい
という理解は間違ってるのかな

403:Socket774
13/04/03 12:05:25.86 yIS+KUTa
当たり前だが同じ機能を実装するにしても
実装が単純(つまりトランジスタ数が少ない)であればあるほど
入力から出力までのゲートの段数は多くなるわけで
動作周波数を決めるFF間での遅延が長くなり不利

同じ段数のパイプラインで加算器を実装するとして
単純なリプルキャリで実装するのと、複雑なキャリールックアヘッドで実装するのと
どちらが周波数が上がるか考えてみな

404:Socket774
13/04/03 15:12:29.79 LoCZAsp0
NetBurstって当時のintelの予定だと最終10GHz以上で動作させる予定だったんだぜ

405:Socket774
13/04/03 15:16:57.17 e9uuFK7F
そのころには、CPUの排熱を利用したグリルとかオーブンとか炊飯器とかが作られるな

406:Socket774
13/04/03 16:08:48.50 tfyoL7n5
スクランブルエッグならやってたが

407:Socket774
13/04/03 16:51:05.13 4Vq0Cuny
>>404
20Gじゃなかったっけか。

>>406
その昔ASCIIだったかが486でうずらの卵焼いてた記憶。

408:Socket774
13/04/03 17:36:26.73 WgBttECk
たしかPentiumのころじゃなかったかPowerPC601と仲良く目玉焼き作ってた記憶がある
486のころのはあったかもしれないけど俺の記憶にはないｗ

409:Socket774
13/04/03 22:51:46.23 ToDN0oCL
姉妹誌のDOSV ISSUEはP2-266を400MHzまでOCしたり熱さに定評のあるK6Ⅲで焼いたり熱いと評判のCPUではひと通りやってたな
雷鳥だか馬では卵より先にCPUが焼けてた

410:Socket774
13/04/03 23:01:09.62 XxXaodNZ
>>409
アホすぎてﾜﾛﾀｗ

411:Socket774
13/04/03 23:08:20.20 xGC0ChLG
>>391
あの倍速ALUって奴がまっさきに動かなくなるから
倍速動作止めて再設計しないとキツイんじゃないか?

412:Socket774
13/04/03 23:11:40.78 XxXaodNZ
ドミノ回路とかすげぇよなｗ

413:Socket774
13/04/03 23:22:24.56 1i4djCGL
倍速ALUは一代限りだが

414:Socket774
13/04/04 02:13:30.63 zvVT+3/j
Willamette, Northwood, Prescott, CedarMillと4代続いてるがな

65nmだと9GHzで動くと言ってるURLﾘﾝｸ(ieeexplore.ieee.org)

415:Socket774
13/04/04 02:20:10.65 BoDZ1A2J
倍速のまま一部レイテンシが大きくなってたのか
URLﾘﾝｸ(ieeexplore.ieee.org)

willametteは完璧に忘れていた

416:Socket774
13/04/04 02:39:44.83 zvVT+3/j
Prescottで0.5サイクルごとに結果を入力側にフォワーディングするのをやめちゃったからね
依存関係のない命令は0.5サイクルごとに突っ込めるから、スループットは変わってないけど。

417:Socket774
13/04/04 17:01:37.13 xfuOXzKh
「メモリの壁」を破る次世代DRAM規格 HMC (ハイブリッドメモリキューブ)、1.0仕様公開

次世代DRAM技術 Hybrid Memory Cube (HMC) の製品化を目指すHMCコンソーシアムが、最初の仕様書 HMC Specification v1.0 を公開しました。
HMCはメモリチップの三次元積層とシリコン貫通電極 (TSV, Through-Sillicon Via)、メモリコントローラの統合など
新技術・新アーキテクチャを採用することで、現行のDDR3と比較して大幅な高速化と低消費電力、
実装面積の削減を可能にする新しいDRAM規格の名称。

HMCは Micron やサムスンが中心となって提唱した規格で、コンソーシアムには Developer Members として上記2社のほか
SK hynix や ARM、HP、Alteraなど9社が、Adopter Member と合わせて100以上の企業や研究機関が名を連ねています。
HMCは次世代を名乗るだけあって物理層も論理層も新しく、現行の DDR3 DRAMなどとは互換性がありません。
物理的には、メモリコントローラと外部のCPUやGPUとのシリアル通信インターフェースを兼ねるロジック層の上に、
TSVで貫通接続されたメモリチップを積層した構造。

TSV構造で広帯域と低消費電力を実現し、またメモリモジュール側にコントローラを内蔵してマルチレーンの
シリアル通信をすることで、マルチコアプロセッサやGPUが要求する並列アクセスに応えるとされています。

具体的な数字は、インターフェース速度はDDR3比で15倍以上、消費電力70%減、実装面積はRDIMM比で90%近く削減など。
複数レーンをまとめたモジュールとしての最大通信速度は160GB/秒、二倍束ねれば320GB/秒。
DDR4が現行の規格と互換性を保ったまま漸進的な高速化を図るのに対して、HMCはアーキテクチャから変革することで、
プロセッサの高速化に追いつけない「メモリの壁」を破る革新的規格という位置づけです。

今回正式仕様として承認された 1.0 spec は、プロセッサとの距離 8 - 10インチ(一般的なPCマザーボード程度)に対応する
SR (Short Reach)と、よりプロセッサに近い距離で実装する用途向けの USR (Ultra Short Reach)を定めています。
HMC コンソーシアムによると、SR規格のハイブリッドメモリーキューブは今年後半、USR規格のHMCは来年にも登場する予定。

URLﾘﾝｸ(japanese.engadget.com)

418:Socket774
13/04/04 18:27:21.23 qtVOOzO3
メインメモリが1byte/FLOPS程度になる予定と言ってた
NEC次世代SXとかどうするんだろう・・・

419:Socket774
13/04/04 18:59:39.79 1znQyjxO
メモリチップそのものは、今まで大して速くなってないんじゃなかったか('A`)
何か画期的な進歩があったとも聞かないし、またつなぎ方かわるだけなのかな('A`)

420:Socket774
13/04/04 19:00:19.44 U+mIHpIf
URLﾘﾝｸ(pc.watch.impress.co.jp)

＞IDFでは、IntelのJustin Rattner氏(Intel Senior Fellow and Director, Microprocessor Research Labs)が、
＞2010年には15～20GHzになると言う予測を示した。Nehalemが65nmで10数GHzなら、この数字も達成できる。
＞というのは45nmプロセスで15GHz以上を達成できる計算になるからだ。
＞次の30nmプロセスになったら、軽く20GHzを超える計算となる。

ラトナーたん、何適当なこと言ってんのｗｗｗ

421:Socket774
13/04/05 00:19:08.91 lLUzFl1A
nVIDIAもこの手の事言ってたし
まあハッタリ企業が勝つというのもある意味パターンなのかもしれんが

422:Socket774
13/04/05 01:22:37.69 3EtQf2JX
2010年に20GHzになるとはいった、いったが
時と場所までは指定していない
その気になれば10年後、20年後ということも可能……！

423:Socket774
13/04/05 02:07:15.33 wSmr+vjb
>>420
いわゆる伝統的CMOSスケーリングを
仮定した上での見積もりだったんでしょ

424:Socket774
13/04/05 02:31:27.97 vmLRkbAp
そうそう、AMDも似たような発表やってたよ、確か
プロセスルールで先行してたintelが先に躓いただけで
リークという現象はどこにも平等だった

425:Socket774
13/04/05 08:05:42.92 5Vi5drUo
>>422
2010年って年数指定してんのに「10年後、20年後」って何だよ。w

426:Socket774
13/04/05 08:18:28.65 DTMVqbke
インテル歴とかじゃねの

427:Socket774
13/04/05 09:52:09.14 RMzs7tAg
日本なんかもうずいぶん前から二千何百年だからな忘れたけどｗ

428:Socket774
13/04/05 10:00:21.49 68dHPNgn
神武天皇即位紀元（じんむてんのうそくいきげん）は、
初代天皇である神武天皇が即位したとされる年を元年
（紀元）とする、日本の紀年法である。

略称は皇紀（こうき）という。外にも、皇暦（こうれき）、
神武暦（じんむれき）、神武紀元（じんむきげん）、
日紀（にっき）などともいう。
年数の英字表記では、「Koki」や「Jimmu Era」などといい、
皇紀2660年を「Koki 2660」「Jimmu Era 2660」などと表記する。
紀元節（現在の建国記念の日）廃止までは、
単に「紀元」と言った場合には、神武天皇即位紀元（皇紀）を指していた。

西暦2013年は、神武天皇即位紀元皇紀2673年である。

429:Socket774
13/04/05 10:16:27.67 RMzs7tAg
なるほど、日本人って未来に生きてるのはそのせいかｗ

430:Socket774
13/04/05 16:13:38.84 5Vi5drUo
関ヶ原や大航海時代以前に20GHzのプロセッサが作られていただと……!!!!w

431:Socket774
13/04/05 16:51:07.63 GW6HTn06
Sandy BridgeでPRFからオペランドを読むのってスケジューラの前？後？

432:Socket774
13/04/05 19:06:44.51 03guHTsO
後じゃね
一元化したPRF使ってるのにわざわざ前に読む実装って知る限りでは初代SPARC64ぐらいしか無いような

433:Socket774
13/04/05 19:45:46.54 Vt5inYe/
>>432
わざわざ前に読むのは読み出しポート数をデコード幅で押さえるのが理由だろうが、
リザベーションステーションにデータを保持するということは即ちコピーが増えるということで、
低電力を目的に単一のレジスタファイルにしたSBとは相容れないように思える

434:Socket774
13/04/05 20:15:19.23 GW6HTn06
なるほど。Haswellの整数PRFはリードポートが結構凄いことになりそうだね。
Port4だけ1ポート、後は2ポート必要で8ポートあるから、計15ポート？

435:Socket774
13/04/05 20:36:57.89 x4QEekCO
早くHaswellいじりてぇ～！！

436:Socket774
13/04/05 22:32:55.72 jgbVCdfF
add reg, [reg+reg]みたいな3ソースオペランドのfused uopが4つ並ぶことを想定すると
フロントエンドで読んでもリードポートは減らんような。

437:Socket774
13/04/06 07:52:53.18 +ivOrgDO
そういった新仕様を最大限に生かすには、アセンブラorインラインアセンブラで開発するしかないんだけど、
おまえらインラインアセンブラとか使うの？

438:Socket774
13/04/06 08:12:02.89 MHgdk/Xm
どうしてもパフォーマンスが欲しかったらやるしかないわけで

439:Socket774
13/04/06 08:13:16.48 DOx2exEw
たいへんだしイヤだなぁ～、とか言いながら内心、メラメラと燃え上がるぜ･･･！！

440:Socket774
13/04/06 11:22:18.93 b6lfsXHP
HaswellはFMA3まで対応で、その次はFMA4に対応するわけだな

441:Socket774
13/04/06 11:28:51.98 DOx2exEw
>>440
何かめっちゃかっこいいなｗ
変身をあと2回残している、みたいなｗ

442:Socket774
13/04/06 11:28:53.86 XyUfh+Vb
要るの?

443:Socket774
13/04/06 12:26:19.92 xgRunQbW
Intelはもともと4オペランドのFMAを予定していたが
move命令のの削除機能があるので3オペランドになった

AMDはSSE5で3オペランドのFMAを予定していたが、SSEベースの
FMAはキャンセルされAVXのものが実装された
SSEではMOVE命令の削除が有効だが、AVXでは無効なので
FMAは4オペランドになった

444:Socket774
13/04/06 13:44:02.42 6sJrgpF5
Ivyのmov除去はリネーマーを通過する4uopのうち一つに対してしか適用されないようだから
Haswellでそのあたりがどうなっているかは気になる。

445:Socket774
13/04/07 23:24:57.70 7RQX/ONC
Power Struggles: Revisiting the RISC vs. CISC Debate on Contemporary ARM and x86 Architecturs
green-rabbit.sakura.ne.jp/note/2013/04/07/337/

タイトルだけは勇ましい論文

446:Socket774
13/04/08 01:26:23.71 flYdM3SL
それ少し前にRWT掲示板で話題になった論文だけど、内容はあんま読む価値がない
関係者もコメントしてるがお察しくださいレベル URLﾘﾝｸ(www.realworldtech.com)

スレッドはARM厨とLinus(x86派)が入り乱れて論文の中身とは関係のないx86 vs ARM論争でカオスになってて面白い
URLﾘﾝｸ(www.realworldtech.com)

447:Socket774
13/04/08 01:44:28.50 yqq2C0Je
シェアさえあればISAなんて関係ないよね!

x86がAtomより下に行けないのは確定しているが
あとはARMがCortex-A15より上に行けるかだな。

448:Socket774
13/04/11 16:27:28.41 OolACyt0
PPC G4やG5をもってしてもx86エミュの実効性能は実機を超えられなかったけど
ARMなら可能なのか？

449:Socket774
13/04/11 16:41:55.45 876X1rG3
>>448
何言ってる…超えられる訳ないだろw

実行性能で超えられるかどうかはともかく、実使用時で問題が無いかどうかは別問題だが。

450:Socket774
13/04/11 17:12:42.56 AAz/THY6
むかしの16bitDOSアプリならARMでエミュしてもちゃんと動くんじゃね？

451:Socket774
13/04/11 18:35:28.07 i+QDcaPk
そこで引き合いに出すならクロックでx86に大差をつけていた頃のalpha

452:Socket774
13/04/11 19:04:10.55 86JuWoXl
alphaはチョンで作ったりしたのがまずかったな。

453:Socket774
13/04/11 23:32:38.25 t2/8Cs6Z
当時はCISCよりRISCが有利だったからな
ところが、IntelがCISCにもキャッシュを増やしてスーパースケーラを実装して
どんどん高速化していって、結局CISCでもRISC並みの速度が出せるようになって
Alphaチップが消えた

454:Socket774
13/04/11 23:35:31.66 2XdLLfEU
Intelすげぇなｗ

455:Socket774
13/04/12 01:10:46.64 oM00gHjO
IntelはPentiumでCISCでの高速化を断念して以後はPentium4まではRISCへのコードトランスレータを組み合わせる実装、PentiumM以降はVLIWへのコードトランスレータを組み合わせる実装だからな。
CoreのuOPSはRISCではないがCISCというよりも固定長の1命令で複数の演算ユニットに命令を発行できるVLIW(にしてはしょぼいが一応)と捉えるべき実装になっている。
内部VLIWのx86に単なるRISCが勝てるはずがない。

456:Socket774
13/04/12 02:40:48.56 Ys8TBlNq
ま、ぶっちゃけIntelのプロセスが使えたならAlphaだって…となるけれど
売れる->金ががっぽがっぽ->新プロセス投資->つおいCPU、ってループだからな

とにかく売れなきゃ徹底的に負けてゆく、それが商売…

457:Socket774
13/04/12 08:07:24.00 hvyHHa/p
AlphaはドナドナされてAthlonになった

458:Socket774
13/04/12 08:37:00.86 lIGrty/l
x86を内部VLIWと捉えるのは一般的ではないと思うが。

459:Socket774
13/04/12 09:05:15.70 ZMWuQWla
K7はEV6のバスとおいしい機能だけつまみ食いだろ

460:Socket774
13/04/12 09:26:09.15 A7JXLZ+q
ユニットが高機能化しただけで、1uopが複数のユニットにディスパッチされる訳ではない

461:Socket774
13/04/12 10:03:05.73 oM00gHjO
>>458
正確には分類不能。
ただ固定長命令だからCISCではない、ロードストアと演算を1命令でやるからRISCではない、OoOスケジューラがあるからVLIWではないと見ていった時、
OoOは命令フォーマットと関係ないマイクロアーキテクチャーの問題だから命令フォーマットとしてはVLIWだよなという感想。
>>460
1uOPSがロードとストアオプション付き演算の2ユニットに行くんだよ。でないとロードが終わるまで演算ユニットがブロックされてOoOできないから。

462:Socket774
13/04/12 10:36:15.81 A7JXLZ+q
add reg,memなんかのことを言ってるのか？
atom以外はまさにその理由で2uopsになると思うが

463:Socket774
13/04/12 11:19:33.04 oM00gHjO
>>462
PentiumMからそこが1opになってるんだが。
URLﾘﾝｸ(pc.watch.impress.co.jp)

464:Socket774
13/04/12 11:33:44.08 A7JXLZ+q
何を言ってるんだ
アドレス計算のデータが揃った時点でVLIW的にALUにまで発行していたら
それこそデータのロード待ちが無駄じゃないか

465:Socket774
13/04/12 11:39:05.77 oM00gHjO
>>464
リンク先嫁よ

466:Socket774
13/04/12 11:41:18.06 A7JXLZ+q
図ではバラバラにissueしているのだが

467:Socket774
13/04/12 12:45:39.38 BJLg+B3F
そもそもVLIWは依存関係のない、同時にissue可能な命令群をpackするものだが
x86のload-op命令はバリバリに依存関係があるのだから別物だ。

uops fusionは単に1 x86命令を1 uopとしてデコードして
issueまでは分解しないからOoOリソースの節約になる、という話
分解しないで同時にissueしたら464の言うように実行ユニットの無駄遣いで本末転倒

468:Socket774
13/04/12 19:05:50.18 +XfkQRr6
　1つ質問があるのだけどもいいかな？
　(PCゲームにおいて)よくGPUの性能を引き出すにはCPUの性能も必要
(特にCPUの浮動小数点演算能力が大事)、等の話が出てくるけれども、
(ベンチマークサイトでもこの旨を示すようなことが書れているけれども)
これってどういう原理・仕組みでそうなるのかな？
　浮動小数点演算ってGPUの得意分野だからこれはGPUにやらせて、
CPUは別の演算・処理をすればいいと思うんだけど、どういう事なの？

469:Socket774
13/04/12 21:02:55.22 0IXwopqr
GPUの計算資源をCPUの肩代わりとして使うには
それ用のAPIが必要なんです
GPU直叩きしたら互換性維持できないし

470:Socket774
13/04/12 21:21:52.43 umtQIWpG
有名タイトルのプログラマはCPU、GPUのバランスの取れたPCで
ハードに遊んでいる部分がないように活かそうとする。そうしないと、
他のゲームタイトルに比べてすごいと言わせることができない。
CPU、GPUどちらかに偏った自作PCを作ったら弱い方が足を引っ張る。

471:,,・´∀｀・,,）っ-○○○
13/04/18 20:35:53.04 xBnk4aJJ
後藤さんが以前言ってたけどHaswellのFMAが3オペランドになったのはK10MのFMA仕様に
合わせるためじゃないの？
Opcode Mapが同じになってるし

URLﾘﾝｸ(www.sandpile.org)

472:Socket774
13/04/19 08:53:41.45 PN6qtR7p
AMDはGFでの生産が躓いてから悲惨な成績が続いているね。

AMDの2013年第1四半期成績(\100/$換算)
・AMD売上1.09千億円, 前期から6％減少、前年同期で31％減少。
・売上総利益率41％
・営業損失98億円、純損失146億円、1株当たり損失19円
・GAAP基準でない会計：営業損失46億円、純損失94億円、1株当たり損失13円
URLﾘﾝｸ(boardvote.com)

473:Socket774
13/04/19 14:43:26.97 ALWRPNq4
GFだけの問題じゃないだろ
32nmのAMDチップより、おなじ32nmのSandy Bridgeのほうが好まれてる状況だから、
プロセス以外にも差がある

シングルスレッド性能軽視が市場に受け入れられなかったんだろ

474:Socket774
13/04/21 01:14:59.44 tzpaHdA4
シングルスレッド性能の恩恵が何にもまして重要であるような
そんな使い方をしているユーザーの方が少ないと思うけどな。
でも一般人の選択も販売員の選択もイメージで決まる

475:Socket774
13/04/21 08:14:27.99 FMiZS9KM
シングルスレッドパフォーマンス、トータルパフォーマンス、コストパフォーマンスともに全部Intelを上回る
CPUをAMDが作れば売れるんじゃね？

476:Socket774
13/04/22 00:34:54.42 0K5ULLRL
あ

477:Socket774
13/04/22 00:35:23.75 r/qOmKKl
今はコア性能上げるよりワッパと低発熱でx86が相手ではなくARMが相手
だしな、結局、スマホやらタブレットにはARMがいいのか、x86がいいのか…。

478:Socket774
13/04/22 00:37:08.01 cfWjw80Q
絶対x86のがイイ。
Intelにまかせておけば安心さ。
AMDもGPGPUでがんばってくれるし。
ARMは気に入らん。

479:Socket774
13/04/25 00:48:14.46 20oqAd7O
一般的に炭鉱労働者は最も過酷な労働条件の故に、底辺労働者として扱われます。地域にもよりますが、
被差別部落出身者や在日の方も少なくありませんでした。
ちなみに麻生副総理の家系である麻生財閥が経営していた麻生炭鉱は、そうした被差別者を多く
含む労働者に極めて過酷な労働を強いたことで知られています。

本社会では、職業差別の背景として部落差別と民族差別が指摘されるケースが多いです

貧しい母子家庭で、子どもを育て、生きていくためには、日雇い労働をせざるを得ない現実があります。
日雇い労働者の子どもは「汚い」と言っていじめられています。論理的根拠もなく、特定の職業が「汚れ」と
結びつけられています。

麻生は労資一体による「君国奉公」を説いて労働者を働かせた。一九四一年には商号を麻生商店から麻生鉱業に改称した。
一九四二年からは海軍省の委託を受け、南ボルネオのロアクール炭鉱･ブラオ炭鉱の開発をおこなった。一九四三年には
新飯塚運送を新飯塚商事とし、産業セメント鉄道の鉄道部門を国鉄が吸収した。戦時のセメント需要のなかで日鉄･末松商店と
船尾鉱業を設立したが、この船尾鉱業はのち麻生に継承された。一九四四年にはセレベスのマカッサル事業所を設置した。
この年、麻生鉱業は軍需会社に指定され、採炭現場で「神風生産特攻隊」を組織した。
吉隈炭鉱へは一九四五年に連合軍俘虜三〇〇人が連行された。

麻生系炭鉱は労働者を酷使するなかで、戦時下に年一〇〇万トンを超える石炭を生産していった。

480:Socket774
13/04/25 00:56:52.95 20oqAd7O
安倍首相が目指すのは、北朝鮮のような自由も民主主義もない国家体制だと思っていたら、ついにモノの言い方まで北の首領様とソックリになってきた。
??【靖国参拝批判に首相「わが閣僚はどんな脅かしにも屈しない」】 -MSN産経ニュース URLﾘﾝｸ(sankei.jp.msn.com) …

481:Socket774
13/04/27 00:54:49.14 T+ouedKH
あ

482:Socket774
13/04/27 15:18:04.84 AvkOdCI3
::::::::　　　　　　　　┌──────── ┐
::::::::　　　　　　　　｜　FinFETが採用されたようだな　　　　│
:::::　　　┌──└──────ｖ──┬┘
:::::　　　｜フフフ…奴は微細化技術の中でも最弱 … |
┌─└────ｖ─┬────┘
｜　ARM如きに採用されるとは.　|
｜　低電圧技術の面汚しよｗｗｗ.│
└──ｖ─────┘
　 |ﾐ,　／　｀ヽ　/!　　　　,.─､　　　　　　
　 |彡/二Oニニ|ノ　　　 /三三三!,　　　　　　 |!
　　`,' ＼､､＿,|/-ｬ　　　ト `=j r=ﾚ　　　　 /ミ !彡　　　　 ●　　
T 爪| /　/￣|/´＿_,ｬ　　|`三三‐/　　　　 |`=､|,='| 　　　＿(＿
/人ヽミ='／|`:::::::/ｲ＿_ ト｀ーく＿＿,-,　､　_!_ / 　　(　ﾟωﾟ )
/　　`ー─'" |_,.イ､ | |/､　　 Y　 /| | | j　/　ﾐ`┴'彡＼ '　　　　`　
オンチップVR　ニアしきい値電圧技術　RFモジュール　パワーアンプ　

483:Socket774
13/04/27 15:33:30.91 mP1/feoo
>>482
パワーアンプﾜﾛﾀｗ

484:Socket774
13/04/30 15:58:47.93 JEogUtqz
富士通もマイコン撤退か。
Spansion、富士通のマイコン・アナログ事業の買収を発表
URLﾘﾝｸ(news.mynavi.jp)

485:Socket774
13/05/01 02:01:52.80 Qr6bLkDP
ある意味元鞘やん

486:Socket774
13/05/03 23:43:06.05 P2x75Em1
Cool Chips 16 - 分散メモリとなるNECの次世代ベクトルスパコン(前編)
URLﾘﾝｸ(news.mynavi.jp)
Cool Chips 16 - 分散メモリとなるNECの次世代ベクトルスパコン(中編)
URLﾘﾝｸ(news.mynavi.jp)
Cool Chips 16 - 分散メモリとなるNECの次世代ベクトルスパコン(後編)
URLﾘﾝｸ(news.mynavi.jp)

487:Socket774
13/05/04 09:41:28.19 6GW9TD/L
グローバルアドレスを使ってアクセスできるユニファイドアーキテクチャはそんなに大変なのか？
URLﾘﾝｸ(news.mynavi.jp)

488:Socket774
13/05/04 10:02:11.34 49LwD+IW
動かすだけならなんとかなるが、現実的なコードでまともな性能のものを実装するのは大変

489:Socket774
13/05/04 11:13:10.02 MuqNOp7X
ノード単体の演算なら、PC用CPU・GPGPUのほうがスパコンよりいい
スパコンの強みは、ノード間通信（帯域・遅延）くらいしか無くなった

逆に言えば、PCクラスタ・GPUクラスタが、スパコン並みのノード間通信を手に入れると
その時点でスパコンの存在意義がなくなる

490:Socket774
13/05/04 13:01:22.40 49LwD+IW
具体的には、どうやって手に入れるの?

491:Socket774
13/05/04 13:08:02.27 Yq56/E65
低遅延の100GbEが安く買えるようになるとかかな。

492:Socket774
13/05/04 13:16:04.24 49LwD+IW
まあこの先5年はないね。

構成要素の一つである演算チップが共通なだけで、インターコネクトやら耐障害性やら、システムとしてはまるで別物だと思うよ。

493:Socket774
13/05/04 14:22:49.82 Ga36NgXm
端末はもう高性能有線よりも無線だし
市場がサーバーやネットの一部だけだと
高性能有線が安くなるのには時間がかかるんだろうな

494:Socket774
13/05/04 15:31:19.84 6GW9TD/L
>>491
これの2.5倍速(10チャンネル)が必要なのか？
URLﾘﾝｸ(techon.nikkeibp.co.jp)

495:Socket774
13/05/04 15:41:42.66 6GW9TD/L
>494
こちらの方が分かりやすいかな？
低遅延なのかどうかは分からないが…
URLﾘﾝｸ(www.sony.co.jp)

496:Socket774
13/05/04 16:11:59.52 Yq56/E65
そんな中途半端なプロプライエタリソリューションじゃなくて100GbEだよ、100 Gigabit Ethernet。
アジアで大量生産して安く届けて欲しい。

497:Socket774
13/05/04 16:16:08.81 zjgTzis7
まず標準的なPCに乗るのは10GbEからでしょうね、次に100GbEに移行するでしょう。
10年以内に100GbEは来ると思う。8k以上の映像を扱う時代になると1TbEとか10TbEも
業務用では実現してそうだが

498:Socket774
13/05/04 17:31:42.46 C5MIDfjy
ホニャララGbEが安く手に入るようになるころには
HPC向けはそのホニャララGbEの1桁～2桁上のクラスが常用されとるわ

499:Socket774
13/05/04 17:36:15.29 Bapudhjj
10GbEですらNICやスイッチが普及価格帯に落ちるような気配はないしなあ
コンシューマ向けだとGbEで不足する用途がほとんど無さそうだから
PCで標準搭載になるかすら怪しい

GbEは規格制定から3年ぐらいで1万円以下の価格帯になってたとおもう

500:Socket774
13/05/04 18:56:04.91 fD3eKxyr
GbEのNICが1000円で買えるようになってからもうじき10年

501:Socket774
13/05/05 02:28:12.75 nxqt5iZL
例のフリーランチが終わっちゃったので
10GbEはなかなか消費電力が下がらなくて安くできんのですわ。
需要もGbEより圧倒的に弱いし。

502:Socket774
13/05/05 02:43:19.94 UkOxPb/6
つーかHPCにGbEに使うのなんてローコストにしたい時だけだろ
QDRやODRのInfinibandでもおっつかねえっつうに

503:Socket774
13/05/05 02:50:29.98 72rg0sgT
10GBase-Tは遅延が大きいのでスパコン並みのノード間通信という意味で全く使いものにならない。
copper wiringといっても既存のCategory 5eが流用できず結局引き直しになる。銅線をさっさとあきらめて光にするべきタイミングだった
次は同じ間違いを繰り返さず光に移行して欲しいと願っている

504:Socket774
13/05/05 04:29:02.11 SZ6O9jf1
>>503
光は結局、ファイバー曲げるのに注意必要だから構内回線としても敬遠されがちだからな～

505:Socket774
13/05/05 05:11:37.97 72rg0sgT
一度、折れるまで曲げる実験というのをしてみたんだけど、結局折れなかった。
U字状に曲げてペンチで挟んだら折れるかもしれないね
そんなに心配しなくてもいいのでは。

506:Socket774
13/05/05 05:18:03.44 oC08jTel
構内回線で光を大量に使用してるけど、
ラック内配線だと保護材がほとんどない細い光ケーブルだけど、
構内配線だと保護材が多い太い光ケーブルなので、普通に使ってる限り大丈夫だよ
あと、マルチモードファイバの場合、プラスチックファイバを使えば大丈夫だし

507:Socket774
13/05/05 05:31:07.60 SZ6O9jf1
>>505
>>506
それで済めば良いけど
現実的には配線時、光ファイバー敷設場所の確認作業工程は必須だからな

508:Socket774
13/05/05 06:45:47.46 nxqt5iZL
銅線嫌なら無理に10GBASE-T使わんでも、光ファイバの10GBASE-SRとかあるんだから好きに使え

509:Socket774
13/05/05 14:24:50.65 72rg0sgT
銅線を敷設するときは確認作業工程を省けるの？それはそれで怖い気が。

510:Socket774
13/05/06 12:40:47.93 RkBxugO7
そもそもEthernetのレイテンシってメタルか光ファイバかは関係ないような。

511:Socket774
13/05/06 17:11:49.00 ClCKnAic
「京」の100倍の性能　スパコンで世界一奪還へ
文科省、20年稼働目指す
URLﾘﾝｸ(www.nikkei.com)

512:Socket774
13/05/06 18:03:51.96 72Nht+jL
スーパーコンピューターは5年位しか持たないものらしい…
1000億円／5年＝200億円／年……少し高すぎやしませんかね(富士通のボッタクリ？)。
＞電力効率などを考えるとスパコンは5年程度が寿命で，RoadrunnerがTop500で1位となったのが
＞2008年6月ですから，2013年3月の退役は妥当なところです。

ロスアラモス、4月1日 ― 1Petaの壁を破ったロードランナーが古くなったので 3月31日に廃棄されました。
URLﾘﾝｸ(www.hpcwire.com)

513:Socket774
13/05/06 18:29:49.46 NC2bkP58
LINPACKで1位取るにはGPGPUだのPhiだのアクセラレータ型の構成と勝負しなきゃならんのだが
既存技術の延長で行くつもりなのかね

514:Socket774
13/05/06 18:44:21.53 HQL5PRJB
日本のスパコン予算の場合、プロジェクト全体予算で計上してる
１０００億っていっても、スパコンのハード代・開発費より、土地代・建物代やらのほうが上

アメリカのスパコン予算の場合、基本ハード（及び基本ソフト？）代しか計上されてなく、
パッと見ると日本が割高に見えるが実際はそうではない

515:Socket774
13/05/06 18:45:35.34 RkBxugO7
土地代が高いなら
北海道に作ればいいじゃない

516:Socket774
13/05/06 18:47:13.38 HQL5PRJB
いまは、
マスコミ→Linpackだけを話題
マスコミ以外のスパコン関係者→HPC Challenge Benchmarkを見る
って感じで、マスコミとマスコミ報道しか知らない一般人はともかく、
HPC Challenge Benchmarkのほうが重視されてるよ

517:Socket774
13/05/06 18:49:55.55 uyIMiRtp
まあ、Linpacクソとその信者は早く死んでほしいわな。

518:Socket774
13/05/06 18:57:09.26 uyIMiRtp
でも、
1000億の予算で全国の10拠点に100億のスパコン10台を購入することの効果と、
100億の予算で毎年1台のスパコンを購入することの効果と、
1000億円の予算で世界最速級のスパコンを1台購入することの効果は、
事前検討してほしいな。

519:Socket774
13/05/06 19:12:21.96 79eQtfSI
PCだって5年前のハイエンド（QX9770）は現在のバリュー～ミドルクラス
(i3上位～i5下位)あたり相当の性能になるが

520:Socket774
13/05/06 19:24:39.70 A3Fu0fp/
>>12
アラスカの一般家庭に送って暖房機にしようぜ

521:Socket774
13/05/06 19:26:12.80 A3Fu0fp/
みすった
>>12→>>512

522:Socket774
13/05/06 19:47:10.44 cKm2YO6Y
Roadrunnerの電気代は年間$1.2 millionだったそうです。意外と安いですね。
今Roadrunnerと同じ性能のスパコンは$6 millionで作成でき、電気代は年間$150,000で済むそうです

523:Socket774
13/05/06 20:46:33.52 e9VWtCrI
銅線でも10GBASE-Tだと、レイテンシが大きいらしい
URLﾘﾝｸ(pc.watch.impress.co.jp) だと
SFP+ Direct Attach、10GBASE-SR = 数100ns
10GBASE-T = ～2us

524:Socket774
13/05/06 20:48:02.00 72Nht+jL
>>522
$6 million　＝6億円(\100/$)　1Petaで、やっすー

525:Socket774
13/05/06 21:36:18.94 qyEhZT62
ミチバシリってCell/B.E.アーキテクチャの開発コストはゼロ換算？
ソニーを財布代わりに使うような芸当はもうできないと思うけど

526:Socket774
13/05/06 21:57:15.39 RkBxugO7
10GBASE-T固有のエラー訂正がガンなのか
電力的にもレイテンシ的にも

527:Socket774
13/05/06 22:12:45.34 HQL5PRJB
>>512
５年くらいしか持たないんじゃなくて、
５年くらいで入れ替えるのがいちばん低コストなんだよ

ムーアの法則やらプロセスルールの進化の速度が鈍化してきたり、
新技術が開発されると、この期間はある程度長くなったり短くなったりする

528:Socket774
13/05/06 22:13:06.14 Dd94gEWr
>>512
そりゃ、ハードウェアなんて5年もたてば(ry

5年前のGPUやCPUなんて、所詮は型落ちだ!!!(暴論

529:Socket774
13/05/07 11:37:53.79 tF6Q9KmY
俺らは人類の型落ち

530:Socket774
13/05/08 09:15:43.54 s1xhW14j
Green 500でトップを取ったマシンの電力効率が5年で1/8になるものか、
と思っていろいろ調べたら現行機Green 500トップだと1/5位になってるのな。

Roadrunnerの後釜に電力1/8の$6 million機を入れる気はなくて、
$50-100 million機を入れる予定みたいで、電力効率も現行機(GPGPU)よりもっと
良くならないとだめみたいなことを言っているから、後釜は100ペタ級みたい。

531:Socket774
13/05/08 09:38:43.81 nlZrGo+W
TOP500/Green500は、Linpackベンチでしか性能を計測しないので、
GPGPUクラスタにすればGreen500的な性能は良くなる
ところが世の中には単純にGPGPUクラスタではパフォーマンスが全然でない計算もある

532:Socket774
13/05/08 17:41:42.02 YriIibDU
10GBASE-Tに標準で対応するのは5年後ぐらいだろう。銅線で対応できる最後の世代でもある。

533:Socket774
13/05/11 13:32:20.98 oPguH93j
コメント欄炎上ｗｗ
・・・というほどの盛り上がりじゃないけど、
予想通り突っ込まれまくりの記事ｗ

1000億円という途方もないスーパーコン補助金
URLﾘﾝｸ(bylines.news.yahoo.co.jp)

534:Socket774
13/05/12 01:18:46.52 yxCGGHCC
記者が的はずしてるからコメントする側もいろんな方向向いちゃってる

535:Socket774
13/05/12 02:04:50.81 65Z7Vfm+
いずれにせよ箱物感覚でポンとデカい予算をつけるのはよろしくない
開発目標を課して複数の組織にコンペさせるとこから始めんと

536:Socket774
13/05/12 02:13:07.25 fCngRLQt
京は成功でしょ？成功者を罰するのはやめましょうや。

537:Socket774
13/05/12 02:43:57.40 D75LyVqm
技術的な目処がついてないものをどうコンペにするのか

538:Socket774
13/05/12 09:17:40.55 ww4XFcSm
金のかけようは問題ある気がする。
運転・冷却に発電所一箇所分ぐらいの電気喰うから気候が寒く、土地の安い網走
ぐらいに作って、スパコン操作は遠隔管理で東京とか大阪とかで管理と使用
をすればよい。本体に金をかけるのは、2位じゃだめなら、しかたない。
電気の送電ロスを考えれば、北海道の発電所の傍でも良いが…

539:Socket774
13/05/12 09:46:16.86 LB27QzHY
時間軸を無しに金額だけ論い、日本の国力を削ぐべく
ミスリードを誘う記事を書く売国奴が後を断たないねえ。。
以下、基本知識

米国は↓ （これ以外に詳細が非公開の国防費から出ている分も相当ある）

URLﾘﾝｸ(www.mext.go.jp)
＞米政府スーパーコンピュータ関連予算(公表部分)
＞2005年度約1,100億円から、2008年度約1,500億円に拡大

URLﾘﾝｸ(www.ipa.go.jp)
＞（２）米国連邦政府におけるスパコン戦略と予算の推移
＞スパコン予算も、2005年の967百万ドルから、
＞2010年には1,883百万ドルへと2倍弱に拡大している。

URLﾘﾝｸ(okwave.jp)
＞しかも、もう一つ言えるのが、科学技術財団の存在、スーパーコンピュータの
＞研究所とは別に、56億ドルの年間予算を持つ財団がありますから、
＞超速ネットワークなどの構築はこれから出すことも出来ます。

一方、日本は↓

スパコン「京」（用地取得や建物代や使途不明金等全てを含んで）
1100億 ÷ 8年 = 138億円/年

資金が潤沢な米国は中規模、大規模なプロジェクトを複数並列して走らせられるが
日本は予算が少な過ぎるから毎回1つの大ジャンプに賭けなきゃいけない

540:Socket774
13/05/12 10:54:50.83 WQ6vMh3o
あれだけ予算を投じても、メーカーは赤字だから国プロは不思議だよね。社会貢献と宣伝費に使ったと思わなければ、やってられない。

541:Socket774
13/05/12 11:10:33.65 DcwrWiDx
おまいらに支持されるより
スパコンのすの字も知らない一般人煽ったほうが儲かるから

542:Socket774
13/05/12 13:39:23.36 A+SRGJ7D
中国のXeon Phi使ったやつは、Linpack番長なのか、HPCCでも存在感あるのかどうなるんだろ？
いままでのパターンだとLinpack番長だよな？

543:Socket774
13/05/12 13:44:24.55 vIL8SPIy
linpackの結果で売ってきたのならそういう事だろう
他にも目を見張るものがあるのならぜ確実にアナウンスするだろうし

544:Socket774
13/05/12 16:48:32.89 n7pR1iK/
Xeon Phiのprogramming guideを斜め読みしたがコアがx86であるためTeslaよりは少しだけ作りやすそうだが,
ローカルメモリが少ないのでプログラミングにコツが要りそう。

545:Socket774
13/05/12 17:15:31.17 fCngRLQt
そもそもXeon phiは今後も開発を継続するプロダクトになれたのかね
Larrabeeと違って製品化には漕ぎ着けたが
次のSilvermont版がいつ頃になるとか発表はあったの?

546:Socket774
13/05/13 06:45:12.57 FCuJVFxU
例の国際技術ジャーナリスト・アナリストさんが
みっともない言い訳コラムを書いてるｗｗ

547:Socket774
13/05/13 07:27:34.88 zFTIZxRp
アメリカは、DoD・NNASA・

548:Socket774
13/05/13 07:29:44.73 zFTIZxRp
アメリカは、国防省・エネルギー省・全米科学財団をはじめいろんなルートで
大～中規模のスパコン開発をやってるから、日本みたいに一つに掛けるみたいなことをやってないんだよな

549:Socket774
13/05/13 07:36:13.74 suDBFdzi
TSUBAME<えっ

550:Socket774
13/05/13 08:25:35.73 7mN/QSX3
とりあえずお国のプロジェクトみたいなものは批判しとけばバカが感銘してくれるからな

551:Socket774
13/05/13 11:41:02.43 W1nXAox/
>>545
Xeon phiはPenⅠコアだからな・・・・
次のSilvermont版の発表はまだ無い。これがいつかCPUに内蔵される事を願う。
確実に10nm世代より先の話だけど

552:Socket774
13/05/13 21:24:14.17 eNfGRaH0
Knights Landing/Knights Hillというコードネームはもう出てるから
何かやってるのは確からしい

553:Socket774
13/05/13 21:40:13.27 Yn9H/Buf
Intelのコードネームｶｯｺﾖｽ

554:Socket774
13/05/13 23:34:11.71 6mKN8Yx/
ブ、ブルドーザァーー
スチームロゥラァァァｌーーー

555:Socket774
13/05/13 23:50:36.85 Ld8zjG1S
まんぐりがえしにはワロタ

556:Socket774
13/05/14 06:47:00.13 i/e12km9
あれはやっぱGoogle翻訳にあれを執拗に入力し続けた奴または集団がいるのかね。

557:Socket774
13/05/14 12:11:28.23 tl4z/BRO
>>554みたいな奴がたくさんいるんだろ

558:Socket774
13/05/14 16:30:49.69 taMDFWAA
>>550
国が事業を自分でやるとうまくいかないという経験則があるから
叩く人が多いんだよ

559:Socket774
13/05/14 20:43:46.21 QWeAHnjs
>>555
何のことかと思って検索してﾜﾛﾀｗ

560:Socket774
13/05/15 22:10:36.56 k/I9wsN8
富士通、名古屋大学情報基盤センターの新スパコンを受注
URLﾘﾝｸ(www.itmedia.co.jp)

「FUJITSU Supercomputer PRIMEHPC FX10」384ノード、
「FUJITSU Server PRIMERGY CX400」552ノードのハイブリッドで構成され、
総理論演算性能は561.4テラフロップスを実現する。将来的には、
3662.5テラフロップスまで拡張し、東海地区では最大のシステムとなる予定だ。

PRIMEHPC FX10は、スーパーコンピュータ「京」に適用した富士通のスパコン技術を
さらに向上させ、拡張性、信頼性、省電力性に優れた高性能スーパーコンピュータ。

CX400の552ノードのうち、184ノードはインテル Xeon Phi コプロセッサを搭載

561:Socket774
13/05/18 18:05:17.04 D0RkzbkX
ずいぶん変則的な構成に見えるが……？

562:Socket774
13/05/21 21:31:26.94 9+MQPzwv
>>560
Sparc部分はただのおまけだな。
実態はintel機。
「京」関連のパーツを混ぜないと予算出さないよ、と文科省の役人に脅されたのかね。

563:Socket774
13/05/21 22:05:43.08 dIbniI9U
561TFLOPSのうちコプロセッサのXeon Phi 184台が368TFLOPSを出し、
残りの193TFLOPSを936ノードのSparcが出すんですね。

564:Socket774
13/05/22 01:54:46.60 eSbIv2GR
書きやすいのはXeon PhiよりSPARC FXかなと。

565:Socket774
13/05/22 02:50:50.20 w/s+feQY
大規模SMPじゃないとはかどらない研究もあるのでね

566:Socket774
13/05/22 12:29:34.06 Be88cXVD
>>562
Xeon phiの構成はだいたいどこも一般的なCPU＋Xeon phiだろう。
SPARCはおまけじゃないが、SPARCである必要は全くない、どころか不自然。

567:Socket774
13/05/22 12:38:10.87 Opq0TktK
いろいろ混ぜたところで性能をたたき出す研究とかじゃねえのん？

568:Socket774
13/05/22 16:16:54.39 k+gpcyAH
これ面白いがオラクルは文句言わないのかな

>OracleなどのデータベースはCPUやコア単位でライセンス料が決まっており，
>CPUやコアが増えるとそれに比例してライセンス料が高くなります。
>しかし，このvSMP Memory ExpansionならCPUカウントはCPUノードの
>サーバ分だけで，多数の安いサーバのCPUはアプリは走らないので，
>カウントに入らず，ライセンス料も安く上がります。
URLﾘﾝｸ(www.geocities.jp)

569:Socket774
13/05/22 16:18:38.33 k+gpcyAH
>名大
FX10はそのまま京で走るソースを準備するための演習場だろう。

570:Socket774
13/05/23 23:25:37.37 4e+uuGDu
>>566
本質は豆腐インタコネクタによる密な結合だろ
SPARCなのはそれ使ったスパコンがそれしかなかったからで

571:Socket774
13/05/24 09:03:55.71 PU330X3O
>>562
全然そんなことは無いよ
Intel部分はまさにベンチ番長、ノード間通信がしょぼくてもパフォーマンスが出るアプリ向け
SPARC部分は、高いノード間通信が必要な計算でも速い

572:Socket774
13/05/24 09:05:40.43 JKEKpXfU
日本のスパコンはどの段階から hardware transactional memoryを実装するのかね？
PS4はhardware transactional memoryを実装しているとの噂もあるが…

URLﾘﾝｸ(arstechnica.com)

573:Socket774
13/05/24 09:07:50.04 PU330X3O
そもそも、HPC分野でhardware transactional memoryでパフォーマンスアップする用途って何があるんだ？
RDBやらJava VMみたいなのをHPCで使うわけじゃないし

574:Socket774
13/05/24 09:14:12.70 JKEKpXfU
>>573
>572はIBMの最新スパコンBlueGene/Qの記事なのだが、読めば分かるよ。

575:Socket774
13/05/24 10:12:24.87 gGUCF9T7
>>572
PS4にそんなものはない。
スレッド数が16とか32超えるような世界でないと意味もない。
HPCはちょっと違う。

576:Socket774
13/05/24 10:55:55.05 aBMOp7Qa
URLﾘﾝｸ(news.mynavi.jp)
>この機構でトランザクションの衝突を検出できるのは同一チップ内の
>コアの間だけであり、何千、何万ものチップを使うシステムでの
>有効性は筆者には良くわからない。

1CPU　L2 32MB/16Core
Sequoia　98304CPU　1572864Core

577:Socket774
13/05/24 11:03:25.53 JKEKpXfU
>>575
メインメモリーからGPUのシェーダーコアに、直接データを受け渡せます。要は、
GPUのL1・L2キャッシュをバイパスできるんです。もちろん、データの読み込み
だけでなく書き込みもできます。
我々はL2キャッシュにちょっとしたタグをつけました。我々は「VOLATILE」タグ
と呼んでいます。キャッシュの中で、この属性を持つものとそうでないものを
マーキングしてコントロールできるようにしています。このタグを使った場合、
メモリーに直接書き込まれます。
URLﾘﾝｸ(av.watch.impress.co.jp)

IBM only implemented transactional memory within the confines of a single chip
using a tagging scheme on the chip's level-two cache memory.
URLﾘﾝｸ(www.electronics-eetimes.com)

メインメモリに直接読込・書込する場合に、ロックシステムに頼らないで効率
的に処理するのがhardware transactional memoryだからね。
transactional memoryの技術そのものがCellのSPUをHPC用途で活用させるため
にソフトウェアで開発されたようなもの。キャッシュコヒーレンシされている
既存のCPUと、隔離メモリを使うGPUにはこのような方法はいらないが、
SPUは爆速CPUだがメインメモリにDMAで直接読み書きするのが問題だった。
URLﾘﾝｸ(www.lsc.ic.unicamp.br)

このシステムが最も効果を発揮するのはGPUではなくて、CPUのSPUなのだが…

578:Socket774
13/05/24 11:19:57.15 aBMOp7Qa
HPCってことならトランザクションメモリよりこちらの方が気がかり

>PGAS(Partitioned Global Address Space)
URLﾘﾝｸ(news.mynavi.jp)

579:Socket774
13/05/24 11:27:08.04 aBMOp7Qa
>>577
ゲーム関係者は動作予測が困難なキャッシュハードウェアの
裁定に丸投げするのが好きじゃないんだろうな。

方向性はこれに似てる気がする
URLﾘﾝｸ(news.mynavi.jp)

580:Socket774
13/05/24 11:44:18.23 PU330X3O
CellのSPEは、コアごとに独立したローカルメモリっていう構造なおかげで、
小さいコアなのに結構性能があった
とくにローカルメモリで完結する演算に関しては爆速だったからな

581:Socket774
13/05/24 14:34:17.80 QnAlUu2H
>>577
なんというデタラメ
TMは投機的なメモリへの書き込みをロールバックする仕組みだよ

582:Socket774
13/05/24 14:49:41.81 SgQu/nOu
TMは、すごく使いにくそうなテクノロジだね。
よくよく考えて作らないと、発生頻度が低いが重大なデータ壊れが発生するバグが出そうで怖い。

583:Socket774
13/05/24 16:09:27.42 QnAlUu2H
BGのTMでは同一のメモリアドレスを複数のキャッシュラインに割り当ててバージョニングする
あるバージョンが捨てられる際には持ち主のスレッドには通知がいくようになっている

584:Socket774
13/05/25 00:52:28.34 ohV/r7oZ
トランザクションなのでデータ破壊は起きないが
TMの実装等によっては任意回のロールバックがありえるので
適切にバックパスを設計しておかないと

一定回数HTMで投機実行してみて、うまくいかない場合は
ロックに切り替えるようなアルゴリズムがいる

585:Socket774
13/05/26 09:28:09.92 pmsP/bx/
このスレは難解なCPUアーキテクチャについて話すスレで、英文読めない人
お断りのスレで、新聞程度のニュースソースでは触れられない専門情報を
扱う所のように思っていたが、IntelがHaswell以降のCPUにhardware
transactional memoryを導入することを知らないということはないよね？

Haswell のトランザクション同期
URLﾘﾝｸ(www.isus.jp)

586:Socket774
13/05/26 10:24:26.02 T0n0DRYp
>>585
211 ：Socket774 sage ：2012/07/08(日) 11:47:26.86 ID:BliILcdQ
graph500でBG/Qがぶっちぎりみたいだけど、理由はなんだろう。
トランザクションメモリ型のL2 とか関係してるのかな。
URLﾘﾝｸ(www.graph500.org)

Hot Chips 23 BG/Qチップ L2キャッシュでトランザクションメモリをサポート
URLﾘﾝｸ(news.mynavi.jp)

BG/Qと関係ないけど
トランザクションメモリのサポートが明らかとなったIntelのHaswell
URLﾘﾝｸ(news.mynavi.jp)

587:Socket774
13/05/26 10:49:51.78 DFM4SyiU
HPC分野でトランザクションメモリをHWサポートしたからといって
それによって性能は伸びるとは思えないけどね

588:Socket774
13/05/26 11:26:43.37 pmsP/bx/
>>587
「トランザクションメモリはマルチプロセサ時代のプログラム作成を容易にする
切り札の1つと見られている。」
URLﾘﾝｸ(news.mynavi.jp)
と言われているのに、

＞HPC分野でトランザクションメモリをHWサポートしたからといってそれによって性能は伸びるとは思えない

その理由を教えてくださいなw

589:Socket774
13/05/26 11:27:13.10 ZpbIPepr
プログラミングの煩雑さが緩和されるなら意義があるんだけど、どうなんだろう？

590:Socket774
13/05/26 11:55:39.21 mr0bH61H
>>588
HPC分野では最大限のスループットを得るためにアルゴリズムによってデータ競合そのものを避けるから。

>>589
Haswellでの実装は、さらなる煩雑さと引き換えに多スレッド(8コア以上)環境でのスケーラビリティを得るもので、
今のコードが簡易になったりする効果はないかと。

591:Socket774
13/05/26 12:33:39.40 D8BAR7QF
確かにプログラミングモデル的にはロックよりトランザクションのほうが優れているが
実際の所HTMはハードウェア的な制限があったり、
競合が激しい場合はロックベースのアルゴリズムのほうがスループットが良かったりと
問題点もあるから、切り札はちょっと言い過ぎな感じも無くはない

トランザクショナルメモリがあればみんな幸せっていう単純な話にはならないだろう
もちろん無いよりあったほうがいいけど

592:Socket774
13/05/26 12:35:22.95 0bsFtm0e
IBMは、ハードウェアトランザクションメモリの効用を、JVMのパフォーマンスアップっていってたな
サーバサイドJavaを高速に動かすのに役に立つって感じ

593:Socket774
13/05/26 12:36:09.94 T0n0DRYp
トランザクションメモリが威力を発揮するケースはこんな感じか？
・並列化の可否を左右する依存データについて、受け渡しのタイミングを
　完全に掌握していなくても並列処理のソースを書くことができる。
・タイミングが動的に変化するプログラムの場合、手書きだと
　最悪ケースを基準にしなければならないが
　ハードウェアトランザクションメモリがあれば、
　実動作時に最悪よりもましな動作になるようなソースを書くことができる。

594:Socket774
13/05/26 12:44:27.19 pmsP/bx/
意外と英文を読まないみたいなので、日本語で…

世界最速スパコン、セコイア(IBM Blue Gene/Q)の凄さの秘密に迫る
URLﾘﾝｸ(sssslide.com)
45頁にSoftware Innovationsが書いてある。

595:Socket774
13/05/26 12:45:10.33 eme8vsco
HTMが導入されても計算機の動作を把握しないで並列プログラムを書くのは依然として不可能。

596:Socket774
13/05/26 13:12:37.66 ZpbIPepr
英語とか全然読めん。
英語スラスラ読める人、尊敬する。

597:Socket774
13/05/26 15:05:28.41 pmsP/bx/
トランザクションメモリがそもそも必要なのは共有メモリ方式の時であって、
大規模実データを一体として取り扱う必要がある場合、例えば大規模災害等で
突発的に発生してリアルタイムに状況が変化し早急な解決が望まれる問題など。
たんぱく質折りたたみのように単純に足せばよいものは分散処理で十分。
(例)大規模グラフ最適化アルゴリズム
ベクトル・スカラープロセッサから成る不均質でかつ分散共有メモリから成る
大規模並列環境において高性能なグラフ最適化を実現する必要あり
大規模グラフ格納基盤：ペタバイト級の大規模グラフデータ
•高速なグラフ解析に不可欠なランダムアクセスや細粒度I/O処理を提供
URLﾘﾝｸ(imi.kyushu-u.ac.jp)

598:Socket774
13/05/26 15:06:09.78 pmsP/bx/
(>>597続き)
共有メモリでは多数のコアが作業するので、データにハッシュタグを付けてDB化。
あるコアがDBで読み書きする時に他のコアが使えないようにDB全体(粗粒度の)
ロックをかけると、1スレッドで処理遅い。DBを多数に分割して(細粒度の)
マルチスレッド化して高速化すると、容易にDB間で多重ロックになりフリーズ多発。
はい、プログラマーさん頑張って仕事してねと言われても、大規模になると無理ゲー。
なら、ハードウェアがプログラマーの代わりに処理しましょうというのがHTM。
URLﾘﾝｸ(www.isus.jp)
URLﾘﾝｸ(news.mynavi.jp)

599:Socket774
13/05/26 15:08:08.08 ZpbIPepr
安藤先生の記事は他と一線を画すな。

600:Socket774
13/05/26 15:19:38.99 5Avt4dxd
他と違って某有名なプロセッサ設計を実際にやってた人だからね

601:Socket774
13/05/26 18:02:20.97 T0n0DRYp
Haswell-xがサポートする「干渉」の範囲って、広くてもQPIでつながってる
プロセッサまで、狭かったらプロセッサ内コアまでだよね。
大規模なHPCはほとんどE5 DP の多ノードだが
どれだけ影響あるのかな

602:Socket774
13/05/26 18:10:26.99 T0n0DRYp
NUMAlink のSGIなら256ソケット（現行UV2000）以上を
干渉範囲にできるのだろうか

603:Socket774
13/05/26 18:50:54.48 pmsP/bx/
Cool Chips 16 - 富士通がハイエンドプロセサSPARC64 Xを発表
URLﾘﾝｸ(news.mynavi.jp)

SPARC64 Xは28nm CMOSプロセスで作られ、16コアと24MBのL2キャッシュを集積している。
倍精度浮動小数点のピーク演算性能は382GFlops、メモリバンド幅は102GB/s。
メモリバンド幅が律速となるStreamでは17倍の性能向上。
10進浮動小数点演算(104倍速)と暗号処理用の新命令(29倍速)のサポートが追加。

604:Socket774
13/05/26 20:14:27.09 N676A10G
10進浮動小数点演算のハードウェアサポートは、そのうちIntelもXeonプロセッサとかでやるんじゃないかな？

605:Socket774
13/05/31 16:26:49.15 rAnZKfDU
L2でかくね？

606:Socket774
13/05/31 16:59:51.70 QVWVomMH
キャッシュのトポロジーが違うと考えればいいんじゃないか。
XeonはL3が20MBだし。

607:Socket774
13/05/31 22:37:59.62 sSc6MdeR
10進浮動小数点演算なんて何に使うんだよ。

608:Socket774
13/06/01 00:33:14.11 lp7cCz5w
そりゃ十進演算だろ

609:Socket774
13/06/01 01:52:13.40 WecnSN1b
>>607
金勘定では普通

610:Socket774
13/06/01 04:10:48.19 sPJSfaHE
新しめの言語やCOBOLに10進数型FPが存在したり端数の丸め指定入ってるのは無いと困るからだ

611:Socket774
13/06/01 04:19:59.79 lp7cCz5w
小数が入ってくると二進数と十進数では誤差が出てくるからな
もちろん無限桁使えれば数学上等しいようにはできるんだけど（1=0.99999……みたいに）
実際には有限桁でやらなきゃいけないので誤差が出る、と。

612:Socket774
13/06/01 09:42:52.22 bX97KTg6
2進数では0.1を正確に表現することができないから一切の計算誤差が許されない金勘定に2進数の浮動小数点実数は使えない。
昔のPCソフトでは1万倍した整数の形でdoubleの箱に保持する一種の固定小数点型とかもやっていたが、乗除算で誤差が出ないようにするのが面倒くさいので今は10進実数の通貨型がサポートされる処理系を使ってライブラリに丸投げする。
ただ計算が遅いからハードウェアサポートが欲しいという要求がでる。計算過程で随時指定の桁数で丸め処理が必要だったりするので単純な計算でも案外演算量は多かったりする。

613:Socket774
13/06/01 12:03:56.77 s+FU9WyX
doubleじゃねえだろ

614:Socket774
13/06/01 12:22:14.59 WecnSN1b
doubleだろ。
単精度で4桁を小数点以下に割り当てたら
3桁しか残らないぞ。

615:Socket774
13/06/01 12:29:07.43 da9m/vIr
浮動少数点で格納したら意味ないじゃん
普通は4バイトとか8バイトの整数型に入れる

616:Socket774
13/06/01 12:36:23.24 bX97KTg6
>>615
お前の月給じゃないんだから10000倍して4バイトに収まる訳がなかろうに。
ちなみに64bit整数は昔の処理系では使えない。

617:Socket774
13/06/01 12:38:49.01 da9m/vIr
10000倍じゃないけど、100倍して4バイト整数という処理系はある
というつもりで書いた

618:Socket774
13/06/01 12:40:05.29 WecnSN1b
ごめん、1万倍した64bit integerだった。

619:Socket774
13/06/01 14:09:29.86 QOXMkgH9
それならば納得です。

620:,,・´∀｀・,,）っ-○○○
13/06/03 13:17:00.10 4KZ1rlFJ
.NETにも独自のDecimal(128ビット10進浮動小数点型）がある

621:Socket774
13/06/03 15:14:01.10 hOF5O3dh
Jaguarのバックエンド、単精度乗算のレイテンシが2サイクル(加算が3なのに)だったり
水平加減算のスループットのペナルティが無かったり
2パイプしかないのにシャッフルユニットが2つだったり
無駄に力が入ってるな

キャッシュ含めてメモリシステム周りが貧弱なので相殺されそうだが

622:Socket774
13/06/03 15:29:25.96 L6/dA0Jg
お金の計算は計算方法が異なると困るから、規格ができたら右にならえでは。
「IEEE754-2008規格では10進の浮動小数点形式が規定」

623:Socket774
13/06/03 16:15:01.89 hcWixZJg
>>622
統一規格でも現在の運用に合わないものは使えないし、合っていれば規格が違っても相互運用できる。

624:Socket774
13/06/03 20:34:34.16 05B5Gxjq
>>621
独特の設計だなｗ

625:Socket774
13/06/03 22:51:55.97 BNh0TYhZ
SilvermontがFPをそこまで重視していないのとは対照的だが……

626:Socket774
13/06/04 00:38:27.58 KDX8wf26
目指す所が違うから名

627:Socket774
13/06/04 11:10:22.95 PBRqjwV5
>>625
そのへんの割り切りはIntelは得意だよね
デコーダーもComplex 1基とSImple複数って構成だし
LoadとかStoreも非対称（過去形？）だったりするし

628:Socket774
13/06/04 11:15:17.37 Y6v5PD0x
正直モバイルでFPは用途が
？

629:Socket774
13/06/04 12:49:32.44 xDRLwVCt
>>622
そもそもIEEE754-2008でやっと2進数FPの厳密な丸めかたが決められたけど
10進FPは一緒に規定されるまえに主要言語は軒並みDecimal型として実装してたよ

次ページ