CPUアーキテクチャについて語れ 44at JISAKU
CPUアーキテクチャについて語れ 44 - 暇つぶし2ch363:Socket774
18/09/08 22:54:13.60 jwUEvaPi.net
供給不足を早急に解消しないと、
Intelに札束で買収されちゃうぜ。

364:Socket774
18/09/08 23:29:51.96 Mv8iZV9E.net
IntelがAMD買収するとか独禁法関連から考えて
各国政府に認可されるわけがないから気にしないでいいだろう

365:Socket774
18/09/09 08:41:01.05 fs+DEMVW.net
>>361
但しソレはイールド用の下位だから
コスト勘案するとちょっと良くなった程度だろう
14nm先行の効果がデカかったお陰で結果的にダメージ低減出来たとも言える

366:Socket774
18/09/09 14:08:50.26 UNSbuxUX.net
>>352
cascade-lakeがそうだというソースが見当たらんけど

367:Socket774
18/09/10 15:02:00.67 ZnQPdZTM.net
>>364
ウェーファ供給企業の話だよ。

368:Socket774
18/09/10 17:49:50.81 ZTuGP5ME.net
ウェハを確保できても作る工場が足りてないんだけどね。

369:Socket774
18/09/10 23:02:06.50 kPqnrdxG.net
>>350 >>352
これやろ
URLリンク(www.nextplatform.com)

370:Socket774
18/09/11 07:59:12.79 +WDiZar+.net
IntelがTSMCに14nmのプロダクトの一部をアウトソーシングとの話
coffeeや組込み(Atom)、特にSKL-SPの需要が大きすぎるというのは以前あったけど
ここまでとは

371:Socket774
18/09/11 08:17:42.61 pv8u6orF.net
IntelはCPUを最先端プロセスで作って、チップセットを古いプロセスで作る傾向があるけど、
10nmへの移行が遅れたせいで後ろが詰まってきてんのかね

372:Socket774
18/09/11 08:21:53.40 JJX7L2Kk.net
RYZENとEPYCに対抗するためにダイサイズ増やしたらキャパが足りなくなったのでは

373:Socket774
18/09/11 08:27:31.40 aVUlYsmN.net
今頃10nmに移行している前提で生産計画立ててたし
14nmの生産能力が増えないのに6コア8コアとダイの種類を増やしてるんだから当然だよね。

374:Socket774
18/09/11 11:05:46.79 7cxO/mcu.net
>>371
今年からチップセットが14nmになってパンクしたのかも

375:Socket774
18/09/11 17:19:07.53 bb3WW9Zm.net
>>372
間違いなくソレだと思うよ
廃棄分はかなり増えたんじゃねぇかな

376:Socket774
18/09/11 18:33:53.04 NdbL7Nvw.net
XeonでもCoreでもコア数増し増しだからな
そら足らんわ

377:Socket774
18/09/11 18:55:28.55 NdbL7Nvw.net
しかしまあクルザニッチは製造出身だけれど
一体どうやってこんな計画を了承したのだろうか
本人が目標述べて製造トップが頑張ったが無理だったのか
製造トップから出された数値を特に検討せず行けると思ってゴーサイン出したのか
或いは……
最初の計画の実質9nmから実質12nmへの変更はgdgd過ぎる
2年前に計画変更を示しておけと

378:Socket774
18/09/12 20:21:25.50 27CiI+DR.net
RyzenショックでIntelは急遽ミドル4→8コアと倍にせにゃならん。
10nmプロセルの遅延、欠陥のハードウェアレベルでの再設計・・・・・
Zen2はSkylakeのIPCを確実に抜いてくるから状況は厳しいね。
AppleもIntel見切ってMAC専用の自社製SoCを開発してくると
面白いんだがなあ。

379:Socket774
18/09/12 21:49:54.58 eoh94FIS.net
AppleによるAMD買収まだですかー

380:Socket774
18/09/12 22:53:48.43 Jxvwc+pQ.net
AppleがAMD買収するメリットってなんかあるのかしら、と
iPhoneのプロセッサは命令セットArm系列だし
次期AirもArmという噂というか推測があったりするから
何らメリットはない気がする

381:Socket774
18/09/12 23:05:04.22 /ciOc0Kw.net
むしろワコム買え

382:Socket774
18/09/12 23:05:34.18 bVGPsuZG.net
>>380
CPU、GPU関連の特許とか

383:Socket774
18/09/12 23:26:47.46 UuuCPm/u.net
むしろAMDを分社化して特許はAppleに本体は支那に継承させたらいい。

384:Socket774
18/09/13 00:22:07.05 gejNb4V3.net
AMD買収は政府からの横やり入るから無理
過去検討したとこは他にもあったが、あまりに困難すぎてやめた
そんくらいめんどい
GF作るときですら糞めんどくさかったし

385:Socket774
18/09/13 01:17:13.60 yS+9JSEH.net
>>382
パテント維持するのも金がいるし
x86/x64やAMD GPUのパテントをAppleが必要とするとも思えないなぁ
将来的にiPhone SoCのGPUをAMD系に変えるのならともかく
そんなしちめんどくさいことしないだろう

386:Socket774
18/09/13 07:38:14.21 yP4T8zs3.net
URLリンク(news.mynavi.jp)
Hot Chips 30 - 自動運転などの頭脳となるNVIDIAのSoC「Xavier」(前編)

387:Socket774
18/09/13 08:31:43.58 pUINsTw9.net
>>381
ワコムは、ライバル社が参入してこないからぼったくり値段で売れてたわけで、
ライバル社が参入してきたからもうダメだろ
ライバルメーカーも初期のやつはワコムに比べてダメダメだったのが、
ライバルメーカーの製品が進化してワコムとかわらなくなった
いまやライバルと同じ製品を2倍高い値段で売るメーカーになった

388:Socket774
18/09/13 08:32:39.95 pUINsTw9.net
>>385
パテントはあればあるほどいいんだよ
コンピュータ業界なんて、みんなお互いにパテント侵害しあってるか、
クロスライセンスしてるかどっちか
パテントでもめたり、クロスライセンス交渉になったときに、
こっちのパテントがあればあるほど有利な位置に立てる
まあいまじゃパテントだけ持って実製品を作らない会社も増えてきたけど

389:Socket774
18/09/13 10:15:12.73 gejNb4V3.net
M,MIPS……

390:Socket774
18/09/13 12:35:10.69 SZV8NGJ6.net
富士通が明かした日本の次期フラッグシップスパコンの心臓部
URLリンク(news.mynavi.jp)
>消費電力は発表されなかったが、かなり低電力のグリーンなスパコンになっているという。
>低電力になった理由にArmアーキテクチャに替えたことがどの程度
>貢献しているかと質問したところ、まったく関係ない。低電力化は
>富士通のマイクロアーキテクチャの改善によるという答えであった。

391:Socket774
18/09/13 19:59:13.98 pUINsTw9.net
appleが、高性能CPU2コア+低消費電力CPU4コア+機械学習8コアのヘテロコアCPUを投入してきたな
ただし機械学習コアが内部的にどういった接続なのか不明
CPUコアの1つみたいにつながってるのか、それともiGPUみたいにある程度独立してつながってるのか、
まったく別のコンピュータみたいな感じでつながってるのかは不明

392:Socket774
18/09/13 20:48:30.54 sTTqSA/H.net
CNNのInferenceオンリーだから、どーせ
あとソフト実装のほうが大事なので全く期待できないで終わり

393:Socket774
18/09/13 21:16:16.41 oSPX4q5O.net
アポ糞は性能だけ盛っても自社囲い込みが災いして生かせずに終わる

394:Socket774
18/09/13 21:30:47.92 6sWWhpYD.net
AppleはiPhone向けプロセッサ外販してないし
Android採用のArmアーキテクチャに対しても優位性保ってるんだから
どこに問題があるのかと
iPhoneの利益率はかなり高かったはずだし

395:Socket774
18/09/13 21:34:59.57 io9nbuep.net
>>391
TMSC 7nmプロセスで高性能コアは2.5Ghzで動く
A11のヤツが2.4Ghz
Geekbenchでシングルが1割ほどアップ(Appleの発表だと最大15%)
1次キャッシュを128Kとかなり大目に積んでんのね
A12Xは出るとしたらどういう高性能コアと低消費電力コアの数が
どうなるか楽しみではある

396:Socket774
18/09/13 21:38:18.34 io9nbuep.net
TMSCじゃトヨタモーターズクラブだなw
TSMCだった

397:Socket774
18/09/13 21:54:22.00 sTTqSA/H.net
>>394
そういうことを書いてるんじゃないんだよ
今まで基礎やってこなかったんだから応用なんかろくに出来ずに終わるというか
ハードが出せるスペックとは別の話だよ

398:Socket774
18/09/13 21:57:58.92 Q8HHc7v3.net
生かせずって言うけど
別にappleとしちゃ、自社製品に必要な部品だから作っただけで
汎用的wとかって考えは塵芥程度に思ってる気がす(ry

399:Socket774
18/09/13 22:16:10.60 6sWWhpYD.net
>>397
iOSやiPhoneのカメラ周りであまり悪い評判聞いたことないんだけど
探せば出てくるだろうけど、それはAndroidでも同じことだし
完全無欠のOSやCPUなんて存在しないんだし
Appleが自社開発OS等で当社比前世代の何%増しとかいうのは問題ないと思うけど
例えば泥だとNPUとか大仰な名前で売り込んできたHuaweiのKirin970だって当社比なわけだし

400:Socket774
18/09/13 22:16:58.51 sTTqSA/H.net
その可能性もあるが、深層学習が盛り上がってるからなキャッチアップしなきゃ感が強い
50社以上買収とかだっけ?AIスタートアップを、まあなかなかの数をした
けどFacebookのような新興よりもいまだに圧倒的に弱い
ただまあそういうのに必要な文化がない(クックじゃなくてジョブズのせいである)から、どうしようもない気がするけどね

401:Socket774
18/09/13 22:17:52.39 sTTqSA/H.net
>>399
うん、だからその
凄くずれてるんだよ‥‥

402:Socket774
18/09/13 22:18:11.40 iqe5H+oq.net
こ・・・今度こそx86互換ですよね???

403:Socket774
18/09/13 22:28:45.64 RvNQcvPG.net
VLIW、EPIC
皆頑張った

404:Socket774
18/09/13 22:30:59.88 R7W82A0I.net
EDGEが来てる

405:Socket774
18/09/14 06:34:29.76 hHbHsaSj.net
すばる
いすゞ
やまは
nvidiaへ

406:Socket774
18/09/14 13:40:43.56 JS38+fGH.net
そういや消費電力当たりの性能って触れちゃいけないんだっけ?

407:Socket774
18/09/14 14:35:20.30 EpMAGvLv.net
上がダメな子は、文が理解できなくて大変だねえ

408:Socket774
18/09/14 14:46:25.03 EpMAGvLv.net
バイクは原付しか乗ったことない
持ってる人て今どんだけいるんだろ

409:Socket774
18/09/14 17:26:41.63 Yus70TIr.net
>>390
ARM・ISAが消費電力に関係あるかのような酷い言説が流通してたからな
インタビュアーもわかってて否定してもらうために聞いたんじゃないか。

410:Socket774
18/09/14 17:40:00.39 3oApFRIk.net
ISAも十分関係あると思うがな
副次的あるいは間接的ではあるだろうけど
大体馬鹿食いと言われるx86にボッコボコにされた時点で前代のアレはつまり、、、

411:Socket774
18/09/15 02:11:25.42 J3rEFp7N.net
SPARCやMIPSのISAは100万~1000万トランジスタで最適なマイクロアーキテクチャであるシングルスカラパイプラインの32bitプロセッサに最適化されている。その代表的なものがdisp30の分岐命令と遅延スロット。
これを32bitマイコンからスーパースカラの64bitプロセッサまで広範囲に使えるものに調整したものがRISC-V。
ARMは用途ごとに異なるISAを切り替えて使うがRISC-VはシームレスになっていてOSの対応が楽になるものの実用上差はない。

412:Socket774
18/09/15 04:29:50.11 judthqJp.net
100万Tr  RISCが効率的だよね
1千万Tr  VLIWが効率的だよね
1億Tr~  RISC風CISC?CISC風RISC?が効率的だよね


413:Socket774
18/09/15 08:04:28.30 2AkpGIid.net
一周回ってCISCになりそう

414:Socket774
18/09/15 09:03:35.19 NCVdR3tE.net
動作クロックが上限に達すると1サイクルで出来ることが多いCISCが有利になる
ただしこれはシングルスレッド性能に限った話でマルチスレッド性能やワッパはまだRISC有利だと思う

415:Socket774
18/09/15 09:45:53.02 Ey3n/HQR.net
廃れそうなのはマルチプロセサの方か
世界を覆う不況の影~

416:Socket774
18/09/15 10:40:11.78 Kk7gIBaG.net
一周回ってCISCの次はデータフローだな
ただこれを従来のCPUアーキテクチャといえるかどうかは人によるけど

417:Socket774
18/09/15 10:57:50.33 J3rEFp7N.net
スーパースカラの命令デコードの都合で高性能プロセッサは32bit固定長命令が必須。その上で複雑な命令は複数の命令に分割して実装しデコーダで連結して元に戻すことになる。ついでに32bitに複数の短い命令を詰め込むことも考えられる。これってRISC?CISC?VLIW?

418:Socket774
18/09/15 11:42:44.28 6EZLIfN1.net
>>416
Out of Order実行はデータフローみたいなものだ。

419:Socket774
18/09/15 20:20:16.39 Yl6bBjm+.net
いいやIA-32廃止だけは確実にしてもらう

420:Socket774
18/09/15 20:47:39.87 judthqJp.net
べつにIA-32廃止しなくても、
IA-32コードは高速で動く必要なし扱いにして、実装・デバッグの手間を下げるってのが
いちばん妥当では?
いまは、16bit命令とか、x87命令とかがすでにその扱いだよね
これらは高速で動く必要なしの扱いを受けてるので、レガシーアプリつかってる人は
CPUを新しくしたらパフォーマンスが落ちるとかの現象があった
CPUメーカーのドキュメントで使用を推奨しない命令に設定した後、
ほぼつかわれなくなったレガシー命令は、順序高速化の必要なし扱いにしていけばいい
将来は32bitコードもそうなるでしょう

421:Socket774
18/09/15 21:11:48.31 Yl6bBjm+.net
だからIA-32(CPU)の廃止であってWOW64(アプリ)の廃止とは言ってない

422:Socket774
18/09/16 02:28:07.18 mrXxh1Eq.net
AMDがプリフィクス増やしてIA32以上にダメなISAになってるx64を何とかしないとな。

423:Socket774
18/09/16 04:15:56.64 RtAXEQZJ.net
AMD64のIA-32互換系をある程度オミットすればスッキリする
足手まとい

424:Socket774
18/09/16 05:30:43.88 8kCt10Wo.net
>>417
>その上で複雑な命令は複数の命令に分割して実装しデコーダで連結して元に戻すことになる。
RISC-Vはマクロフィージョン前提で作られてるようだからな
命令長に関してはx86のようにデコードが複雑な可変長の命令セットは効率悪いけど
RISC-Vのようにデコードしやすい形なら固定長の命令にこだわる必要も無いと思う

425:Socket774
18/09/16 06:29:54.77 55B+w8R8.net
>>424
デコードしやすい可変長ってなんかおかしくね
長さ変わるから面倒だつってんのにさ

426:Socket774
18/09/16 06:34:39.78 8kCt10Wo.net
>>420
x86のIA-32とx86_64はARMと違って全く違う命令セットじゃないからな
例えば、32bitのオペランドでR8-R15を使わない命令は
IA-32でもx86_64とほぼ同じマシン語になる
微妙に違うところはあるけど、
x86_64はIA-32に必要な時だけREXプレフィックスを付けたものだからな
REXプレイフィックスが付く時はR8-R15レジスタを使う場合と64bitオペランドを使う場合
それ以外はほぼIA-32そのまま
だからIA-32だけを廃止するのは意味がない
ARMの場合はx86とは違い32bitのAArch32と64bitのAArch64は別物だから
富士通のA64FXのようにAArch32をサポートしない設計に意味は出てくる

427:Socket774
18/09/16 06:35:58.92 8kCt10Wo.net
>>425
命令の長さに規則性があって、ある一部分をみただけですぐに判断できるフォーマット
TRONチップのような考え方

428:Socket774
18/09/16 06:54:36.42 EITYCNZ2.net
>>425
先頭から何bitか見れば長さが分かるだけでデコードしやすい訳じゃない。オペランドごとにオペコードが散らばってたり結構汚い。

429:Socket774
18/09/16 06:54:51.69 8kCt10Wo.net
RISC-Vの命令長フォーマットはこんな感じ
16bit命令 xxxxxxxx xxxxxxaa  aaは11以外
32bit命令 xxxxxxxx xxxxxxxx xxxxxxxx xxxbbb11  bbbは111以外
48bit命令 xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xx011111
64bit命令 xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx x0111111


430:Socket774
18/09/16 07:00:09.71 8kCt10Wo.net
>>428
複数の命令を同時実行するには命令の切り出しが大事だからな
だから簡単に命令の長さが判別できる必要がある
RISC-Vはそういうように設計されてる

それにRISC-Vの基本命令は
RISC-Vの命令長フォーマットはこんな感じ
このページに書かれてるようにデコードがしやすい
URLリンク(news.mynavi.jp)
URLリンク(news.mynavi.jp)
RISC-Vの基本命令は次の図に示す32ビットの固定長命令で、4種類の形式がある。
どの形式でもrd/rs1/rs2のレジスタ指定ビットの位置は同じでデコードがやり易い設計である。

431:Socket774
18/09/16 08:10:44.39 8kCt10Wo.net
RISC-Vは完全フリーの命令セットで
RISC-Vで都合がいいのは日本や中国、韓国、インドなどの
独自のCPUの命令セットのエコシステムを持ってない国だよな
特にアメリカと敵対していて
半導体技術向上に力を入れてる中国にはとても都合のいい命令セット
日本や韓国などアメリカと友好的な国ならライセンス料を払ってARMを使ってもいいが
中国の場合、もし、ARMが米国企業に買収されたら
安全保障上の理由から利用が制限される可能性があるからね

432:Socket774
18/09/16 09:01:00.92 EITYCNZ2.net
>>430
だから16bitと32bitを混在させることしか考えてない。
32bit命令のオペランドを拡張した48bit以上の命令は無理に作ってもほぼ別命令扱いになる。

433:Socket774
18/09/16 10:29:31.13 TkaI3ZOo.net
>>426
>x86のIA-32とx86_64はARMと違って全く違う命令セットじゃないからな
そこが一番の問題
x86互換CPUで中国産やロシア産含めMeltdownなんて恥ずかしい脆弱性抱えてるのはIntelだけだからな
>>422
Intelは自社存続というエゴのために脆弱性対策と称したコード汚染を拡大する汚物そのものなのだが
既存のソフトウェア資産を放棄してまで忖度しろと妄言を吐くIntelこそが消えるべき

434:Socket774
18/09/16 14:20:43.46 B9WNoYax.net
RISC-Vは完全フリーと言ってもある数量以上量産するとパテント料を支払う規則になっているよ
まだ量産品がないから完全フリーに思えるだけ料金が幾らかは判らないが

435:Socket774
18/09/16 14:58:42.15 55B+w8R8.net
>>427
うーん
判別機構が簡素に成ればコレでも良いとは思うけど、x86系よりは遥かにマシだし
ただ多倍長の時点でデコーダの額面上の幅設計だけでクッソ厄介だろ
長かろうが完全固定長に勝るもんでは無いと思う

436:Socket774
18/09/16 17:48:30.70 Z2al4btk.net
RISC-Vって、ARMの禿税回避できること以外に利点があるの?

437:Socket774
18/09/17 00:22:04.82 mqag4KeJ.net
そ、そ、そふとばんく

438:Socket774
18/09/17 20:05:28.07 VEPYkdIU.net
A12 biocnicが搭載してる高性能CPU Vortex(2.5Ghz)はgeekbenchの
シングルはCore i7-7700に匹敵する
クロックあたりの性能なら越えてる部分もある
MACもIntel採用止めて高性能コアベースの自社製CPUに切り替えた方が面白いわ
Appleは自社製GPUの詳細もソロソロ明かしてくんないかね
PowerVRの特許の問題があるかもしれんが・・・・・

439:Socket774
18/09/17 20:53:20.44 tqRS4QnA.net
2.5GHzのCPUと3.6のCPUのIPCを較べて何の意味があるんだか。

440:Socket774
18/09/17 22:22:36.49 VEPYkdIU.net
KabylakeのIPCも越え、シングルスレッドも3.6Ghzに匹敵するなら
MACでも使える話をしてる

441:Socket774
18/09/17 23:30:08.58 N+kUvlgq.net
Geekbench自体あまり信じてないし、iOSだとAppleがベンチマークソフトを検出して何かしてそうで余計信じてない

442:Socket774
18/09/18 00:08:54.66 hgE63jXU.net
geekbenchは3から4になった時にスコアがかなりiPhone寄りに出るようになった
追加するテスト項目次第でスコアの重み付け出来るけど意図的なものかモバイルで重要な項目を重視した結果偶々そうなったのかは不明

443:Socket774
18/09/18 00:53:57.28 Cm/3YPmM.net
iPhoneはOSとSoC共自社製でどこよりも最適化されてる
泥とスナドラのバラバラの組合せよかベンチで高い性能がでるのかもしれん
PS4はPCよりCPU性能貧弱でも直接ハードに叩ける分ゲーム最適化しやすいのと似た理屈

444:Socket774
18/09/18 01:04:13.07 sVd1hiHM.net
>>405
これか
ヤマハ、NVIDIAと協業し自律動作の農作業車/ヘリ/ボートなどを開発へ
9/13(木) 12:40
スバル、インプレッサにAIドライブコンピュータ「NVIDIA DRIVE PX 2」を搭載した自動運転プロトタイプ車
9/14(金) 5:00
いすゞ自動車がNVIDIAのプラットフォームを使って自動運転技術確立を目指す
9/16(日) 6:03

445:Socket774
18/09/18 12:54:20.92 hfi3TGOa.net
risc vはARMのシェアを奪うほど伸びるでしょうか?

446:Socket774
18/09/18 13:25:40.46 u6nu8QBZ.net
もうちょっと早く出てきてればポスト京に最適だったんだが
そこをARMに取られちゃ後は一銭も払ってくれない中華しか市場はない。

447:Socket774
18/09/18 18:04:13.42 LK0K9iuH.net
欧州はARM+RISC-Vアクセラレータじゃなかったっけ?

448:Socket774
18/09/20 14:38:38.98 wdeSbBNw.net
兆芯、“第7世代Core i5並みの性能”を実現した「開先KX-6000」の写真を初公開
URLリンク(pc.watch.impress.co.jp)

449:Socket774
18/09/20 16:12:23.92 JiWKqNUa.net
>>448
KX-5000 8C でi3-6100 2C4T 相当と言っていた。
KX-6000 8C はi5-7xxx 4C4T相当に向上したわけか
448からたどれるKX-5000の記事にあるけど
こういう性能でも膨大な開発リソースが費やされたようだ
>x86は1つのアーキテクチャを設計するのにおおむね30億ドル
IntelやAMDに比べたら手本があることやビジネス環境の経費の低さで
30億ドルにはならないだろうけど、それでも多額だろう

450:Socket774
18/09/20 16:53:03.96 bCXrHDvP.net
やっぱ今更x86互換に新規参入ってすっげぇ金かかんのね

451:Socket774
18/09/20 17:53:42.16 +cltU5y7.net
街中でiPhoneにマウスとキーボードを接続して使っている人を全然見かけない謎

452:Socket774
18/09/20 17:55:45.81 +cltU5y7.net
性能以前にHPCからモバイルデバイスまでターゲットにするとか無茶杉だろ
消費電力100Wのプロセサをスマホに載せるとか

453:Socket774
18/09/20 18:28:00.74 NbtPzeDU.net
あんだけの値段するならキーボード付けてディスプレイに繋げばMacにもなります
くらいな林檎フォンであってくれよ

454:Socket774
18/09/20 23:45:16.09 2mO1abz2.net
まあモバイルはタブレットとかノートとかが限界だろう
禁輸された時対策だろうけど逆に関税かけられたという。
>>446
ベクトル命令がなんかもめてるみたいなブログ記事読んだけど今はまとまってるのかね?
まあPostKに採用されてたら問答無用でSVE追加されてただろうけど。

455:Socket774
18/09/21 06:36:58.74 QH66OMkw.net
>>454
SVEは配列演算専用でベクタ長を意識する必要がないGPGPUの代替目的なんだろうけど全命令がmask指定を持つのは無駄が多いんだよね。
そこまでmaskを多用するならグローバルmaskレジスタを用意してそれを設定したら以後の命令にはすべてそのmaskが適用される仕組みにして演算命令のオペランド数を増やした方がいい。
でもお客さんの言うことなのでお客さん専用命令ということでARMとしては不本意ながらOKを出したってことだろう。

456:Socket774
18/09/21 10:08:23.74 kUHCmar1.net
コプロやバリエーションなどのヘテロ編成も視野に入れてるからなのでは

457:Socket774
18/09/21 12:45:50.85 6imJ/LPP.net
ARMじゃVNNIのようなAI用命令は無理だの云々て議論が1年前にあったっけ

458:Socket774
18/09/23 00:22:04.35 tBnidTU9.net
SVEがお客さん専用なら
そのうちNEON256とか……だいぶ先か。

459:Socket774
18/09/24 15:40:55.10 Kl3YxSMe.net
NEONは64bit演算器を2回回す前提の128bitモードから作り直さないときつい。

460:Socket774
18/09/24 17:08:11.66 jhSnWeDl.net
次世代京は時期が悪いとしか言えないな
SPARCは実質ディスコン、RISC-Vはまだまだ、っていう微妙な時期に作らないといけない

461:Socket774
18/09/25 21:27:43.92 OKcuqfxK.net
Samsung M3のパイプラインがZenより豪華に見える
プロセスが違うしSMT対応の有無もあるけど、モバイルも力強くなってきたなあ

462:Socket774
18/09/25 21:35:12.82 /Or/4OZ3.net
>>461
どこで見れる?

463:Socket774
18/09/25 21:38:36.44 E5vpMlKp.net
>>461
ちょっと重すぎない?
コレモバイルSoCだろ?

464:Socket774
18/09/25 21:41:18.61 mH0q+LMH.net
いやあれはなんかコンパイラでチートしてんじゃねて気がするが

465:Socket774
18/09/25 21:42:07.01 OKcuqfxK.net
>>462
URLリンク(news.mynavi.jp)
URLリンク(news.mynavi.jp)
URLリンク(news.mynavi.jp)
AndoさんがHotChipsの取材記事を出してるよ

466:Socket774
18/09/25 22:02:42.79 E5vpMlKp.net
>>464
ARMでそれをやらない所なんて無いだろ
RISCベースなんだから積極的にコンパイラで超最適化しないと性能なんか出ないぞ

467:Socket774
18/09/25 22:35:02.13 /Or/4OZ3.net
>>465
thx!

468:Socket774
18/09/25 22:44:21.52 /Or/4OZ3.net
>>465
マジですげぇ

469:Socket774
18/09/26 02:52:01.48 0lFAvVHS.net
>>465
この記事この画像を使ってA75より性能/Wが高いって書いてるけどデマじゃん
URLリンク(news.mynavi.jp)
URLリンク(news.mynavi.jp)
まぎらわしいけど上画像のGBシングルスコアは青ラインがA75だけど
下のパーワットの方だと青ラインはM2に変わっててA75が比較対象に無いっていう

470:Socket774
18/09/26 03:07:14.68 0lFAvVHS.net
M2に比べてM3はサイクルあたりで平均+60%
最高クロック+17%でその時の電力性能は平均80%?
同クロックなら電力性能が平均140%?
ってことは最高クロックだと電力は2.3倍
クロックを2.3GHzまで落としてもM2より電力が多い
M3の2.7GHzはモバイル電力の枠を軽く踏み倒してるが
A75を全ベンチで上回るグラフ作るための見せ球オーバークロック設定ってこった

471:Socket774
18/09/26 04:03:02.94 oLhHVOcS.net
計算間違ってない?

472:Socket774
18/09/26 04:27:38.16 +OrkqPOI.net
いつものポエマー算だぞ

473:Socket774
18/09/26 07:13:41.33 0lFAvVHS.net
>>471
M2に対してサイクルあたり性能1.6倍
2.7GHzはクロック1.17倍で性能1.87倍
2.7GHzの性能/Wを踏まえ1.87 / 0.8 = 2.34
最高クロック時の電力は比較対象M2の2.3倍程度

474:Socket774
18/09/26 07:29:09.46 0lFAvVHS.net
それにベンチを見るとAI向けの行列演算で3.4倍と平均を押し上げているが
整数系ベンチでは2.7GHzでもM2比で1.6倍程度の性能に留まってるものが多いことから
実際のアプリ環境では印象ほど性能は伸びず、
また設計として高電力に振れていることからゲーティングが効き難く電力消費が大きくなるだろう
スマホチップとしてはもっと微細化を進めないと厳しいっていうのが実態じゃないか

475:Socket774
18/09/26 07:42:47.44 ARMLBo5L.net
単なる爆熱チップかよ

476:Socket774
18/09/26 07:57:07.12 k6A6Ve55.net
実際にはベンチほど早くはないが
消費電力シングル~オールコアで3.1~3.5Wと
A75搭載スマホとかと消費電力は変わらん

477:Socket774
18/09/26 11:41:16.88 UVNROZ9O.net
デコード幅が1.5倍でIPCが1.6倍に増えてるのは面白いね
さらに広げてもまだ性能伸ばせそうだ

478:Socket774
18/09/26 11:53:20.72 3jAVEDp2.net
10nmLPPは0.35V
7nmはどうなるんだろうか、Samsungはパフォーマンス寄りにプロセス設計を振ってるが

479:Socket774
18/09/26 15:50:22.82 sAjARt8u.net
TSMC/Samsungともに、10nmからは~200mm^2以上のビッグダイ(?)チップは作るのが難しくなってきてるとの話があるが
4年前のIntelが味わった地獄を今体感してる感じかね

480:Socket774
18/09/26 16:08:43.03 oIGQxGvw.net
Samsung Galaxy S9 のGeekbenchだとM3は1.8Ghzだとわかる
発熱・消費電力の性でかなり低く抑えられてんだな
シングルで3300程、同クロックならA12bionicのVortexと同等になる
ハイエンドスマホSoCの高性能CPUは、ノートPC並の消費電力枠(15~25W)に
すれば同枠のCoreやZenにひけはとらんな
AppleがMACを自社製CPUに切り替えるのも時間の問題かもw

481:Socket774
18/09/26 16:47:54.51 sAjARt8u.net
まずGBに対しては単純に比べられんてのと(特にx86とその他RISC)
TSMCも150mm^2辺りまでが精々なのに、それ以上の巨大なダイを出せるのか?
出せたとしても熱がすごそうな気がするけど……電圧をそんなかけていいのかしら

482:Socket774
18/09/26 16:55:46.70 sAjARt8u.net
勿論、HPC用途だとビッグダイでも(多大なコストを転嫁、チップの値段に転嫁することで)いけるだろうけど
コンシューマ用途が殆ど、末端相手しかやっていけないとこは難しいかと
てかMACて書くのはちょっと……

483:Socket774
18/09/26 16:56:36.48 j+GWu035.net
Centriqは10nmで400mm2だし、7nmのVega20やA64FXはまだサンプリング段階だけど200mm2は越えてるでしょう
大きなダイを作れないという問題に直面してるとは特に思えないけど

484:Socket774
18/09/26 17:02:44.91 pgOurvfz.net
スマホという媒体とスマホゆえのTDP上限でしょ

485:Socket774
18/09/26 19:07:41.78 Rqw/MCKc.net
>>483
それってHPC用途じゃん

486:Socket774
18/09/26 19:32:23.99 T6B20U6C.net
appleがMACを切り替えるっ見て
「え?物理層?モデムチップ、5Gでは自社製使う計画あったっけ?」
と、ちょっとだけ思ったのは秘密だ

487:Socket774
18/09/26 19:55:39.74 zYyR+FYQ.net
Centriq 2400は最低でも$888だし
>>466ということもあって、元とろうとしたら難しい
あのAMDちゃんがPOWER9とEPYCでタメ張ってたりするとこみるに
なんていうかかずるい感じがするよ・・・・・誰かも以前書いてたっけ?

488:Socket774
18/09/26 20:24:41.64 zYyR+FYQ.net
連レスだが、なんか結局あれやめてたんじゃ?
カムバックするぜ!的なことは言ってたけど
事業としてはあの値付けでも難しかった可能性も低くはないのでは

489:Socket774
18/09/26 20:48:29.07 RNGmX05n.net
>>488
厳しいと思うよ
そもそも旧RISC勢が86にボッコボコにやられた理由がそこにある
焼き直したところで所詮は同系列の類似コンセプト
少なくともハイパフォ帯に於いてはあんなもんゴミでしかない
結局ハイパフォ化してもどうせx86_64には勝てん
ワッパが多少いい程度はシステム丸ごと入れ替えるのに見合わない、かと言ってパフォーマンス落としたら論外
結局ISA非互換のデメリットがそっくりそのままなのよ
加えて旧RISC勢は有効なダイ面積の利用が難しい、固定長で単命令を多くってのはキャッシュの利用効率そのものは良いが、サイクル効率はどう見積もっても悪くなる

490:Socket774
18/09/26 21:44:55.29 5M0tVUB0.net
POWERは金融取引ではユニークだったりとかそういう強みはあるけどね
ファイナンス評価(シミュ)だとXeonがくっそ強いけど
他のRISCもSPARCはデータベース処理に一時期強かったりしてた気もする

491:Socket774
18/09/27 01:36:00.63 hnqqtV4G.net
>>476
M3の消費電力はSPECintでA75の概ね2倍、最大は量子計算テスト中で4.8Wにまで達する
URLリンク(images.anandtech.com)

さらにM3スマホの実効の電力性能がベンチに比べ悪すぎたためカスタムファームを用意して改善を模索した話
URLリンク(www.anandtech.com)
結局アプリではいまいち性能が出ず、バッテリー持ちはA75にもM2にも劣る結果に
つまるところファーウェイのベンチブーストと根本が一緒だろう
見栄の張りすぎ

492:Socket774
18/09/27 08:34:05.72 Ryl1oRdv.net
>>466
コンパイラでチートって演算結果の使われない無意味なループを飛ばして計算量を減らすとかコンパイル時に計算しておいて計算結果を書いて終わりとかを特定ベンチに特化したロジックで派手にやらかすベンチマーク対策のことだぞ。

493:Socket774
18/09/27 08:51:33.97 oSOCFPPJ.net
M3はタブレットかCromebookにも載せてほしいな
高性能と消費電力はトレードオフなので
スマートフォンではサーマルスロットリングで厳しいだろうし

494:Socket774
18/09/27 09:40:40.70 KpoJFM9+.net
>>492
それはそもそもマトモにベンチが走って無いじゃん
論外だよ
コンパイラのチートってのはそれ専用にカリカリにやる事
汎用コードじゃなくてな
SPECでみんなやってる故に数字に意味がないアレね
で有れば何処まで許容されるのかと言うとまたそれは別の問題だけど
コレをやった上で、やって無いヤツと同格では伸び代が違うだろ
そういうことだよ

495:Socket774
18/09/27 11:26:59.52 GfgX5rRS.net
>>494
同一結果になる複数の命令があるとき最も高速なものを使うのは最適化の基本だぞ。×2乗算を加算に置き換えるとか太古のコンパイラからやってる話だ。 x86でx3,x5,x9の乗算にleaを使うテクはそのままARMに応用できる。
特定マイクロアーキテクチャ依存にしてもスーパースカラを前提にした命令スケジューリングとかやってない方がおかしいレベルだし。
L1キャッシュサイズ依存のループアンローリング量の調整とかまでくればどうかという気はするが、数式そのままに計算しないのはそろそろループをSIMDに展開するのが常識になりつつあるからなあ。

496:Socket774
18/09/27 12:09:47.93 wAqTYZmO.net
URLリンク(prtimes.jp)
ゴードン ベル賞のファイナリスト 6チームのうち5チームが、NVIDIA Volta Tensor コア GPUを利用

497:Socket774
18/09/27 12:24:59.84 bxfihKDs.net
>>493
ハイエンドスマホ用SoCは高性能CPUだけ
見ると消費電力の制限厳しすぎで勿体よなあ。
リッチすぎてスマホじゃオーバースペックな気がする。

498:Socket774
18/09/27 12:27:21.85 2/51wWmZ.net
>>495
だから線引きはまた別の問題
本来で有ればベンチマークは実運用でログ取るのが最良だけど
そうはなってない故に、ね
特に単命令主体ともなるとフロー上の仕様を考慮した組み方は特定のプロセッサに向けて効くだろう
ただ、そのコスト分のゲインがあるのかは別とするしかない

499:Socket774
18/09/27 13:07:41.80 GfgX5rRS.net
>>498
実アプリを使うと非効率なメモリアクセスが大量に発生してしまい、それが弱点故に集中して対策を講じてあるIntel大勝利で終わってしまうのだが。

500:Socket774
18/09/27 13:51:11.48 sI+lxcf+.net
Internal Server Error

501:Socket774
18/09/27 16:11:13.02 KpoJFM9+.net
>>499
あたりめというか、手抜きの正当化と言うか
ASLRウォーク可能かつ容易な構造という意味で、受け取り方としては逆が正しい
だからこそ当然そうなると言えるし、MT前提の高負荷条件では軽くひっくり返ったりする
予測のスパンが長く精度が高いほど、スラッシングに弱い

502:Socket774
18/09/28 19:19:48.29 UYSQJWEY.net
スマホ用ゲーミングドックと、対応スマホかあれば、スマホのCPUの性能を出し切れる気がする
ゲーミングドックは、AC電源からの電源供給+空冷ファンでスマホ冷却の両方するとか
ゲーミングドックにとりつけたしたスマホは、リミッター解除して最高速度で動作

503:Socket774
18/09/28 20:41:36.74 tfVi5JEl.net
ファンと外付け電源追加して可搬性犠牲にした瞬間に高いだけのゴミになるやろ

504:Socket774
18/09/28 22:02:42.25 GF9QZ6e2.net
ゲームやりたきゃゲーム機買え
いまんとこポータブルゲーム最強はSwitchだから
SMACH Zがどうなるかはしらんが

505:Socket774
18/09/28 22:25:16.74 4nEYHq8e.net
あんな在庫処分チップがバカ売れなんだから
結局はソフトなんだよなぁ

506:Socket774
18/09/30 08:30:22.50 e4tBHCeh.net
ソニーはA76にPOWERVR8で新チップ起こせばスイッチ超える
けどやらないので今はただのチキン

507:Socket774
18/09/30 20:34:29.02 pY+DVg7C.net
>>502
iPhoneでこういうヤツ来て欲しい
iOSとOSXが統合された新Macなら
歓迎
URLリンク(pc.watch.impress.co.jp)
>>506
A76でPascalアーキのTegra搭載版Switch上位機種の方がいいわ
PS4に対するPS4proみたいなヤツ

508:Socket774
18/10/01 00:50:01.97 9C8hZvVn.net
>>506
ソフトがないとダメだろなぁ
SIEも傘下のソフトウェアメーカーあるけど海外のAAAクラスばかりで大規模ゲームでターゲットはPS4のみ
海外ではVITAは日本以上に鳴かず飛ばず(日本のXbox市場ほどでは無いと想うけど)
XPERIAブランド(も赤字続きでかなり失墜してるが)でスマホゲー作ってる方がまだマシかと
スマホゲーはFGOとマギレコが好調でソニー黒字の大きな一要素にもなってるし

509:Socket774
18/10/01 01:35:26.10 OcFVS3BT.net
今powervrは問題ないん?
買収とかされたんじゃ?
かといって他にGPUは……DMPとか?

510:Socket774
18/10/01 01:35:52.33 FK7CAMgV.net
>>507
お前Mac使った事ないだろ

511:Socket774
18/10/01 18:22:45.11 uOdoPiIv.net
URLリンク(www.watch.impress.co.jp)
Andoさんどこに引っ越すかな
まさか辞めるとかないよね

512:MACオタ
18/10/01 18:25:50.86 Pps93z3i.net
安藤氏が MYCOM でここ数週間 Hot Chips のレポートを書いているすけど、今回は RISC-V の OoOE デザイン BROOM の話す
URLリンク(news.mynavi.jp)
現段階で Cortex-A9 程度の性能ということすけど、設計がオープンソースで出回るコトで影響は大きいと思うす

513:Socket774
18/10/01 18:41:20.01 0zcow0z8.net
A9レベルより
A7みたいな性能と消費電力のバランスが良いコアで
4コア程度のマルチコアIPが
オープンかつ只なら
採用広がるかもね

514:Socket774
18/10/02 04:52:23.62 VQsttIPT.net
組み込みとかなら良いけど、スマホとかハイパフォ/メインストリーム系とかは無理だな
クロック低くても良いから周波数あたりのマークをこの3倍くらいにカチ上げないと


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch