【統計分析】機械学習・データマイニング24at TECH
【統計分析】機械学習・データマイニング24 - 暇つぶし2ch450:デフォルトの名無しさん
19/05/23 19:09:57.33 B/nEPIrOa.net
どこかわかるわ

451:デフォルトの名無しさん
19/05/23 19:10:53.84 81P91tUsM.net
えーどこどこー?

452:デフォルトの名無しさん
19/05/23 20:25:57.11 ChjJRZiS0.net
>>440
オレ1人で月の売り上げ5千万以上、年に7億稼いでたけど給料800万やった。
(2割は利益を出していた)
体壊して辞めたけど。

453:デフォルトの名無しさん
19/05/23 20:30:25.84 eCymInjh0.net
TJOがあんなポジショントークする奴だとは思わなかった
ガッカリ

454:デフォルトの名無しさん
19/05/23 20:31:11.91 KSjfeaufM.net
それはいかん。自分は零細ITにいたけど上の方は1千万超えてたよ

455:デフォルトの名無しさん
19/05/23 22:27:38.39 6Szxdpex0.net
>>419
いやそれだとAIの進歩に時間かかりすぎじゃない?
CNNが発明されたのって90年代だよね?

456:デフォルトの名無しさん
19/05/24 00:21:08.49 s0JZ13JH0.net
>>452
あそこは技術者一人当たりじゃなくて社員一人当たりなんで
経理も総務も含めて、かつバイトも使っていないしね。

457:デフォルトの名無しさん
19/05/24 07:06:03.33 +y8seB4Ia.net
>>453
AutoMLのこと?

458:デフォルトの名無しさん
19/05/24 07:44:19.65 I9WDb3qi0.net


459:デフォルトの名無しさん
19/05/24 10:44:00.43 PyBT4/Drd.net
>ID:nwZRkhw20
内容を盛るな

460:デフォルトの名無しさん
19/05/24 11:45:01.97 85WKPh7U0.net
需給予測は市場規模小さい業界だと思ったが
今は広がってんのかね

461:デフォルトの名無しさん
19/05/24 11:46:32.82 85WKPh7U0.net
>>455
昔のPCでNNの計算なんてとてもやってられん

462:デフォルトの名無しさん
19/05/24 12:03:40.99 CZsiC+PjM.net
自然言語処理を専門にするか、画像認識を専門にするか…

463:デフォルトの名無しさん
19/05/24 12:19:35.24 OLZB0xfya.net
画像認識のがいいよ

464:デフォルトの名無しさん
19/05/24 12:51:54.61 MIOpJWB2M.net
自然言語のほうがいいよ

465:デフォルトの名無しさん
19/05/24 13:00:34.07 WtzG6gjzM.net
これからは強化学習だよ

466:デフォルトの名無しさん
19/05/24 13:16:34.07 zawpyxYKa.net
>>自然言語処理を専門にするか、画像認識を専門にするか…
>画像認識のがいいよ
>自然言語のほうがいいよ
耳の不自由な人を
画像認識と自然言語で支援しなさい

467:デフォルトの名無しさん
19/05/24 16:44:12.22 Dri14T8iM.net
gunってなんの役に立つんだろうと思ってたけど結構gunを使ったサービス増えてきたね

468:デフォルトの名無しさん
19/05/24 16:58:18.90 kUwj1SkL0.net
機械学習には適切なデータが大量に必要と言っている人がいたけど、
別にそこまで適切ではなくてもいいんだよ
ある程度信頼できれば
URLリンク(gigazine.net)

469:デフォルトの名無しさん
19/05/24 16:58:34.59 kUwj1SkL0.net
>>467
GANな

470:デフォルトの名無しさん
19/05/24 18:11:30.03 s0JZ13JH0.net
>>467
実務上は、少ないデータでいかに使える結果を得るかということが
必要とされることが多いですからね。

471:デフォルトの名無しさん
19/05/24 21:35:22.94 MIOpJWB2M.net
そうそう
ビッグデータというけど
続けて標本サイズの小さい仕事をやってる。
n=40個ほどしかないけど
説明変数200ほどあって
14種類の機械学習試したら
どの方法でもなんとか予測できた。
同僚の手腕がいいので助かってる。

472:デフォルトの名無しさん
19/05/24 21:49:38.41 t/lJBqRi0.net
教師無しではデータの量と質が要求されるけど、
教師有りでは過学習に陥らないように学習させれば、1/10ぐらいの量でもイケルという認識

473:デフォルトの名無しさん
19/05/25 06:04:38.31 uqI/ytR10.net
嘘松( ´・∀・`)ソーナンダ

474:デフォルトの名無しさん
19/05/25 08:41:04.76 GmewsWkw0.net
GUNは業務では使えんけど見栄えいいから公開に向いてるってだけだぞ。

475:デフォルトの名無しさん
19/05/25 08:46:24.90 uqI/ytR10.net
ぐん?

476:デフォルトの名無しさん
19/05/25 09:03:03.05 H9G4SGp2a.net
>>472
そんなん問題によって違うとしかいいようがない
学習をしやすい問題とそうではない問題がある
機械学習の基本中の基本

477:デフォルトの名無しさん
19/05/25 09:20:50.22 /FLyHH1C0.net
教師データの水増しに使われてるよ

478:デフォルトの名無しさん
19/05/25 10:07:48.15 c7a1xFWv0.net
>>431
> どうやって仕事とってるの? どんな感じの内容?
「フリー」と書きましたけど、自営業というより「非正規」という意味で書きました。
元々統計学を専攻してたけど卒業してからIT企業にてSEやってました。
その会社でいろいろイヤなことがあって辞めて、
メーカー系列のPG作成のアルバイト募集で面接にいったとき、
統計学を専攻していたと言ったら
ちょうどデータ分析の人を探しているということで
アルバイトしませんか?といわれたのがはじまりです。
その後は、請負い、契約社員、SES契約、派遣社員と
いろいろな契約形態でやっていましたけど、
そろそろ正社員になるかもしれません。
正社員になると年収は少し下がりますけど、
もうすぐ不況になりそうな予感がするので、
さっさと正社員になったほうがいいと思っています。

479:デフォルトの名無しさん
19/05/25 10:55:38.38 HkxaNc28a.net
教師あり学習って教師なしに誤差ゼロの特徴量が加わっただけだから大した差はないのになぜか別物扱いしてしまう人が多いよね

480:デフォルトの名無しさん
19/05/25 11:19:48.34 yOpOJb7D0.net
伝統的に別として説明する教科書が多いからだよ

481:デフォルトの名無しさん
19/05/25 11:24:42.57 dxGKXP5f0.net
フリーで月200万もらえてたとかじゃなさそうね。

482:デフォルトの名無しさん
19/05/25 12:14:49.26 FHjbLbB2a.net
>>479
誤差ゼロって何に対する誤差だよ
ラベルの事を指してるんだろうがラベルは予測に使わないし特徴量ではない
教師ありとなしは完全に別物だぞ

483:デフォルトの名無しさん
19/05/25 12:28:42.88 95Ybe8BPa.net
ラベル以外の特徴量から何らかの方法でラベルに近そうなものを計算して、その計算結果と実際のラベルを比較して誤差を調べる
誤差が大きければ計算方法を修正する
そうして最適なラベルの算出方法を決定するわけで、「予測に使う」というのが学習過程で使われるという意味ならラベルもその他の特徴量もしっかり予測に使われている
教師ありではラベルは絶対的に正しいこと(=誤差ゼロ)を前提とするのでラベルとの誤差が精度の良い評価対象になるが、
教師なしでは誤差混じりの特徴量しか得られなかったがために別の評価指標を使っているだけのこと
理論の上では本質的な違いはないんだよ

484:デフォルトの名無しさん
19/05/25 12:49:19.46 uqI/ytR10.net
損失、じゃなくて?
誤差なの?

485:デフォルトの名無しさん
19/05/25 12:55:03.49 9EmqmScDr.net
>>483
学習途中の話?予測に使うというのはモデルに入力するという意味
運用時にラベルは与えられないだろ?
教師なしは学習時と運用時で使える情報は同じだが教師ありは違う
自動車と金槌の本質的な違いは?って聞かれても答えに困るわ
逆に理論のどこを見て本質的に同じだと思うのか
用語の意味を都合よく解釈しているようにしか思えない

486:デフォルトの名無しさん
19/05/25 13:04:20.15 9EmqmScDr.net
>>484
誤差の大小と損失の大小は同じなのでここではどちらでも良い

487:デフォルトの名無しさん
19/05/25 13:07:36.46 t7lA5k1Lp.net
>>483
前から教師ありとなしの本質的な差がないと主張する人がいて、その真意を聞きたかった
例えばMNISTで教師なしで分類したとする
全部で10種類とクラスの数を固定すれば、教師なしでもおそらく正しく分類してもらえ、本質的な差がないという主張は理解できる
ではクラスの数が不明としたらどうだろう?教師なしではどんなにデータを増やしてもクラスの数が不明な限り同じ結果は得られないだろう
この辺りの説明をしないで本質的に同じと説明すると、機械学習は本質的には最小二乗法と同じと言ってしまい炎上したのと同じ危うさがある

488:デフォルトの名無しさん
19/05/25 13:53:46.85 S47qxAlEd.net
元々数学的な手法がいろいろあって、機械学習の分野のやつが勝手に2つに分類しただけ。
教師有りと無しで基礎原理は大きく異なる。

489:デフォルトの名無しさん
19/05/25 14:05:38.03 O1zpSt3I0.net
まあ何らかのモデルの式のパラメーターを最大/最小にする問題と考えると大差はないかもしれん
正解ラベルとの誤差で式を立てるかそれ以外の式で立てるかどうかの違いでしかない
数学的に考えれば

490:デフォルトの名無しさん
19/05/25 14:07:27.49 S47qxAlEd.net
???

491:デフォルトの名無しさん
19/05/25 14:07:51.79 S47qxAlEd.net
>>489
原理わかってないの?

492:デフォルトの名無しさん
19/05/25 14:09:45.78 S47qxAlEd.net
489の条件は絶対的でないよ

493:デフォルトの名無しさん
19/05/25 14:23:18.41 rW5FDb6DM.net
ディープラーニング使ったらCGとかも今よりずっと低コストで作れるんだろうな
個人でスターウォーズなみの映画とか作れたりとか
特に流体の表現でかなり効果を発揮しそう

494:デフォルトの名無しさん
19/05/25 15:42:51.81 /Qx1Z2J/a.net
3水準以上の多重比較検定は偶然の確率が上がるから棄却域を下げるっていうのが納得いかないんだけど
ABCの3水準があってAとBに差があるかだけが知りたい場合Cとの検定は関係ないのでは?(極論を言えばCとの検定を行わない)
どこかに差があるかを調べたい場合のみ有意水準を操作すればいいの?

495:デフォルトの名無しさん
19/05/25 15:49:22.03 LV9LUlXva.net
>>489
そうだな、犬も猫も人間も哺乳類と考えると大差はないかもしれん

496:デフォルトの名無しさん
19/05/25 16:19:05.08 997oQV33F.net
データサイエンティスト育成講座
URLリンク(www.hanmoto.com)

497:デフォルトの名無しさん
19/05/25 16:40:11.40 997oQV33F.net
・手取り足取りデータの前処理から予測モデルの作成、チューニングまで一通り網羅
・質の良い参考書がたくさん紹介されており、これから先もある程度示してくれる
・学術書でないので、安い
欠点: いずれも入門書である以上当たり前ですが
・アルゴリズムの数学的なところはすっとばし
・実務の前処理地獄はこんなもんじゃない
・この本の内容ができる程度で「AI人材」を名乗るな

498:デフォルトの名無しさん
19/05/25 16:42:30.74 uqI/ytR10.net
まず松尾豊の研究室から
論文とデータサイエンティストが生まれてから
本を出せや

499:デフォルトの名無しさん
19/05/25 16:45:51.62 997oQV33F.net
執筆者ではない
監修ですらない

500:デフォルトの名無しさん
19/05/25 17:10:51.99 UpoKtTek0.net
現在、AI事業が流行ってるわけではなく、AI事業を育成するための事業が流行中。
実績?わらわら。

501:デフォルトの名無しさん
19/05/25 17:21:31.34 MDBcKokxx.net
>>494
若干スレ違いとも思うけど検定の多重性問題だね
ロジカルに考えると分かると思うよ
例えば3学級A, B, Cの算数の試験で、学級Cは他学級よりも優秀か調べたい
つまり (C > A) AND (C > B) を調べたい
検定としては(A = C) OR (B = C)を帰無仮説としてこれを棄却したい
棄却域をそれぞれ5%とすると、5%の可能性で(A = C)がFalse, (B = C)がFalseとなる
(A = C)と(B = C)の両方がFalseにならない限り、(A = C) OR (B = C)はFalseにならない
この場合はA = Cを帰無仮説とした検定とB = Cを帰無仮説とした検定の2つを行って良い
別のケースで、学級Aあるいは学級Bが学級Cよりも優秀か調べたい場合を考える
つまり (A > C) OR (B > C) を調べたい
検定としては(A = C) AND (B = C)を棄却したい
上記同様に棄却域をそれぞれ5%とすると、5%の可能性で(A = C)がFalse, (B = C)がFalseとなる
(A = C)と(B = C)のどちらかがFalseになると(A = C) AND (B = C)はFalseになってしまう
つまり棄却されやすくなってしまっているので有意水準を調整する必要がある

502:デフォルトの名無しさん
19/05/25 17:36:49.30 suGe7WeyM.net
>>493
どゆふうに流体と関係あんの?

503:デフォルトの名無しさん
19/05/25 18:13:45.67 BEAwB+2w0.net
>>496
この本見たけど初心者には訳わからんし上級者には役に立たなさそうで何とも惜しい感じがした

504:デフォルトの名無しさん
19/05/25 18:20:19.51 69q3ULG00.net
>>502
流体の境界条件・初期条件に対する流体の解析処理結果を学習データとして使用すれば、それをもとに自動的に流体のアニメーションを生成してくれるものができるはずって意味です
今までの流体解析はスーパーコンピュータ使ったりしてすごくコスト高かったけどAI使えば低スペックPCでもよりリアルな流体表現ができるよねって話

505:デフォルトの名無しさん
19/05/25 19:52:31.11 C+z4Q3r1a.net
>>501
出したい結論次第ということか
あと質問なんだけど、
前者の帰無仮説の(A=C)と(B=C)をそれぞれ棄却域5%で検定したら
全体では棄却域1-(1-0.05)*(1-0.05)=9.75%で検定したことになりませんか?

506:デフォルトの名無しさん
19/05/25 21:18:20.43 MDBcKokxx.net
>>505
前者は(A=C)の検定と(B=C)の検定を合わせて全体でという考え方はしない
帰無仮説の説明からしたほうが良さそう
「Aの平均とBの平均は異なる」を検証するのに、わざわざ帰無仮説として
「Aの平均とBの平均は同じである(A = B)」という仮説をするのか?
それは「同じである」ことはケースとして1ケースしかないが
同じでないことはケースが無限に存在し検証ができない
「平均が同じ」という仮説を立てることで、現在発生している状況が
どのくらい起こりにくいことなのかを計算することができる
後者の(A = B) AND (B = C)は書き直せばA = B = Cで
これはケースとしては1ケースしかないので帰無仮説として利用可能である
しかし前者の(A = B) OR (B = C)は、片方を満たせばもう片方は無限のケースを許してしまい
これは帰無仮説として設定しても計算できない
大元の質問に戻って、ABCの3水準がある場合にCの検定をする必要がないのでは?
という質問については、帰無仮説として「A=B=C」が設定できないのであれば
当然多重比較検定の前提条件を満たしていない

507:デフォルトの名無しさん
19/05/25 21:54:09.32 yOpOJb7D0.net
>今までの流体解析はスーパーコンピュータ使ったりしてすごくコスト高かったけどAI使えば低スペックPCでもよりリアルな流体表現ができるよねって話
ありえねーわ。
微分方程式の数値解求めるアルゴリズムと
補間曲線フィッティングするアルゴリズムは目的も用途も別。
ちなみにCAEとAIは相性自体は良い。
CAEはデータを無限に生成できるからな。
昔からアンテナシミュレーションソフトに最適化っていう機能あって
古い機械学習アルゴリズムがついていたりした。

508:デフォルトの名無しさん
19/05/25 22:17:07.06 j+1UCpGZ0.net
>>506
同時にfalse positiveが発生しない限り間違って棄却されないから問題ないってことか

509:デフォルトの名無しさん
19/05/26 02:54:23.04 Twzbio4W0.net
>>507
AIを使った流体のCG表現が不可能である理由はなに?
人間には手書きで流体のアニメーションを書けたりするけどAIには無理ってこと?

510:デフォルトの名無しさん
19/05/26 15:06:35.97 Twzbio4W0.net
>>509
今ゲーム業界はレイトレーシングだなんだと騒いでるけどこの技術が確立されたらより現実と見分けがつかないグラフィックのゲームとかできそうだね

511:デフォルトの名無しさん
19/05/26 15:41:51.01 7eYATO63r.net
sim2realとか使って荒いシミュレーションで大雑把なグラフィックを作ってAIでリアルに仕上げたりできそうだね

512:デフォルトの名無しさん
19/05/26 15:43:31.27 FDD59Vgs0.net
今の機械学習では仮説形成と演繹ができないと言われているが
仮説と演繹と帰納を識別できる判別器を作れないものなの?

513:デフォルトの名無しさん
19/05/26 15:49:47.77 KAaQkTQwa.net
演繹しまくりじゃね

514:デフォルトの名無しさん
19/05/26 16:06:05.73 FDD59Vgs0.net
>>512
×機械学習
〇深層学習

515:デフォルトの名無しさん
19/05/26 16:07:30.86 jVNot2dUp.net
分類としては3つしかないけど難しそうだね
--(帰納)-->(仮説)--(演繹)-->
ループとかも問題になりそう
ニワトリ → 判別機 → 卵の演繹です!
卵 → 判別機 → ニワトリの演繹です!

516:デフォルトの名無しさん
19/05/26 18:28:41.21 ZW+JHuoB0.net
必要か?

517:デフォルトの名無しさん
19/05/26 19:59:54.33 MRHfC0tka.net
>>514
ニューラルネット自体が関数近似器でしか無いから根本的に厳しいような気もする

518:デフォルトの名無しさん
19/05/26 20:03:16.17 Suq0krAi0.net
その手のことは組合せ爆発を伴うから
機械学習で連続的な取り扱いで楽することが流行っとるわけよ。

519:デフォルトの名無しさん
19/05/26 20:05:37.77 MRHfC0tka.net
というか演繹って機械学習と真逆の考えだからなあ
出発点の事実から論理をどう組み上げるかだから学習の余地は無くて、組合せ最適化あたりだろうか

520:デフォルトの名無しさん
19/05/27 01:28:00.88 CXLCqwWfM.net
学習した識別器をつかって答えを予測することは演繹とは少し違うのかな
そこら辺の概念的なことをよく理解できていない

521:デフォルトの名無しさん
19/05/27 05:32:58.30 t6QjrYpW0.net
バックプロパゲーションについて勉強してます
URLリンク(qiita.com)
このページの式13.14.15に突然yって出てくるんですがこれはどういういみですか?
何故ここでyが出てくるのかわかりません
どなたかわかりやすく教えていただけないでしょうか?

522:デフォルトの名無しさん
19/05/27 07:48:28.29 DsUkLbuS0.net
>>521
(9)式の y のことだよ。(10)式の微分を考えると出てくる。

523:デフォルトの名無しさん
19/05/27 07:54:02.92 t6QjrYpW0.net
>>522
なるほど!ありがとうございます

524:デフォルトの名無しさん
19/05/27 11:50:06.57 KdEWqt5uM.net
初歩的な質問で申し訳ないのですが
2値分類の評価指標に関して教えて下さい
accuracyはデータが偏ってる場合には適さないという理由は理解できました
データの割合が均等な場合(正常50% 異常50%)の場合でもaccuracyは評価に適していないのでしょうか?

525:デフォルトの名無しさん
19/05/27 13:29:27.61 /16uSnZGp.net
>>524
例えば犬と猫の写真があって
犬の写真を犬と判断 TP
犬の写真を猫と判断 TN
猫の写真を猫と判断 FP
猫の写真を犬と判断 FN
Acc = (TP+TN)/(TP+TN+FP+FN)
だから、TPとTNは式の形から全く等価
犬を猫と判断しまくってもOKなの?
あなたのやりたいことがOKなら使ってもいいし
NGなら別の指標

526:デフォルトの名無しさん
19/05/27 14:54:42.55 /16uSnZGp.net
思いっきりミスってた
こういうのは犬とか猫より正常、異常のが間違いがないな
正常な写真をX枚、正常を正常と判断する確率をα
異常な写真をY枚、異常を異常と判断する確率をβ
とすると、それぞれの枚数は
TP = αX
TN = βY
FN = (1-α)X
FP = (1-β)Y
Acc = (αX + βY) / (X + Y)
仮にXとYが同じ枚数ならX=Yとして(α+β)/2
偏りがなければ使っても良いかといえば、αとβを等価に扱って良ければOKだし、等価に扱えないなら別の指標

527:デフォルトの名無しさん
19/05/27 17:23:55.48 KdEWqt5uM.net
>>526
とても分かりやすい説明ありがとうございます
正答率は説明頂いた特徴があり、それでも参考書や記事などで正答率を算出する事が多いのは単純に説明がしやすいからでしょうか?

528:デフォルトの名無しさん
19/05/27 17:28:43.12 KJQjBYp00.net
タスクとエラーのリスクに応じて個々で検討すべき事柄だから
大体は省略されてる

529:デフォルトの名無しさん
19/05/27 18:05:50.75 otLNcE2UH.net
機械学習にしろディープラーニングにしろデータを元に「学習」するわけじゃないですか
でその「学習した結果」に新しいデータを通すとそのデータに対応する答えを「結果」が弾き出しますよね
このときの「結果」って一体なんなんでしょうか。小人さんがマシンの中にいるわけでもなし
パラメータがx1x2...xnってあったときに結果としてf(x1, x2,....xn)な関数が生成されるみたいな理解でいいんでしょうか?
もしそうならその関数が実際どんな数式?なのか見る術はありますか?kerasで勉強しています

530:デフォルトの名無しさん
19/05/27 18:22:40.43 2deMEJc2a.net
補間

531:デフォルトの名無しさん
19/05/27 18:24:14.91 2deMEJc2a.net
一回単純なモデルでいいからライブラリ使わずに実装してみるといいよ

532:デフォルトの名無しさん
19/05/27 18:57:20.00 cl2rg6uY0.net
補間だが演繹

533:デフォルトの名無しさん
19/05/27 19:00:05.40 Ne4UfqvxM.net
あー、今日も仕事終わった
だりィ、
データ分析やらせろボケ上司!
書類仕事はイャダ-!

534:デフォルトの名無しさん
19/05/27 19:02:36.82 w8JoPjjJM.net
データ見せる為のWebUI作ってる。書類よりはマシだな

535:デフォルトの名無しさん
19/05/27 19:12:00.16 nYz1CYbBa.net
>>529
簡単な最小二乗法を試してみるといい
エクセルでできるから

536:デフォルトの名無しさん
19/05/27 19:20:32.76 w8JoPjjJM.net
AI人材って普通に理系なだけだな
騒ぐほどのモンではないと思うけど、文系を引きずり下ろせるチャンスなわけだ

537:デフォルトの名無しさん
19/05/27 19:59:53.30 T/hWbhauM.net
データサイエンスで経営戦略方面から射撃
AIエンジニアリングで花形現場からの射撃で十字放火や

538:デフォルトの名無しさん
19/05/27 20:01:57.78 mqq2cpZZa.net
それを安く使い捨てたいから文系様がAI人材量産計画を叫んでいるのが現状

539:デフォルトの名無しさん
19/05/27 20:01:58.26 cpnvt74A0.net
いや、sum関数やvba位の位置づけになるかと

540:デフォルトの名無しさん
19/05/27 20:10:01.28 T/hWbhauM.net
計算資源ドカ食いするExcelやでぇ

541:デフォルトの名無しさん
19/05/27 20:12:55.37 izC7ByhK0.net
エクセルの最小二乗法は怪しくなかったか?

542:デフォルトの名無しさん
19/05/27 20:23:42.82 /16uSnZGp.net
>>529
イメージとしては間違ってないと思う
kerasならmodel.layer[i].get_weights()で重み取れるから見ることはできるけど意味はないかな
AND OR XORくらいなら重み見て頑張れないこともないが

543:デフォルトの名無しさん
19/05/29 21:10:53.74 AMD232/i0.net
パーセプトロンの勉強してる
分類問題なら出力層は当然その分類する項目の数になるだろうとは思うのね。0から4を判別するのに学習データのラベルが[0 0 1 0 0]みたいな
んで回帰問題の出力層のノードが複数になるケースってある?住宅価格予想みたいに答が一つに定まるのが回帰問題だから当然出力層はノード一つだよなとか思ってたんだけど
なんかそうじゃないっぽい?

544:デフォルトの名無しさん
19/05/29 21:13:20.60 7nrnLjkN0.net
>>543
勉強にお勧めの書籍やサイトはありますか?

545:デフォルトの名無しさん
19/05/29 22:11:55.58 XEw54qYY0.net
「15分後の株価」と「30分後の株価」とか

546:デフォルトの名無しさん
19/05/29 22:17:48.69 qjKa/CEa0.net
>>545
株価予想って機械学習で一般人でできるのかね
どれだけ質のいい情報が入手できるかのほうが重要そう
トランプのツイッターが原因で中国の株が乱高下してても中国の個人投資家はなんで相場が動いてるのか分からんかったとかいう話聞いたし

547:デフォルトの名無しさん
19/05/29 22:32:21.01 tZl3oLaI0.net
株価って突発的な出来事の影響が大きそうだし予想できるもんなんかね

548:デフォルトの名無しさん
19/05/29 22:32:43.30 pf0Cg+pWx.net
>>543
銀行1の株価、銀行2の株価、とか?
同じ業種の株価は連動するから、入力も出力もグループ化するよ
>>545
個人でも儲かる方法はあるよ
詳細は言わないけど、どうしても大手とは違うやり方になる

549:デフォルトの名無しさん
19/05/29 22:36:38.33 uNZ63kmU0.net
>>546
中国株触るのにトランプの動向チェックしないなんてありえないから
たぶん中華投資家は情報統制食らってるんじゃないかな。

550:デフォルトの名無しさん
19/05/29 22:37:08.35 pf0Cg+pWx.net
>>547
予想というより結果を大事にする
ボラティリティ(分散)はGARCHでかなり上手くモデルに当てはまる
ボラティリティが予想できるなら、オプションで儲けられるはずだけど、そもそものオプション価格がそれを見越した価格設定がされていて手数料負けする
なので違うやり方になる
株価自身の予想は統計的には予想できないことになっている
でも、儲ける方法はある
こんな感じ?

551:デフォルトの名無しさん
19/05/29 22:38:46.58 DaGU3Mz0a.net
株価は短期なら意外と当たるんだが、
たまに来る、予想と違う方向へどかんと動いて固定
これが怖い。大体これにやられて退場する人が多い
最近だとリーマンショックとか。

552:デフォルトの名無しさん
19/05/29 22:42:11.57 pf0Cg+pWx.net
あまり儲からないけど、ほぼ確実なのは鞘どりだね
連動する株価を反対売買する
これは機械学習するまでもなく従来の時系列データ解析で十分できるけど、今なら機械学習で簡単にできるよ
この方法は手数料がとにかく安くなるようにするのがポイント

553:デフォルトの名無しさん
19/05/29 22:53:33.08 qjKa/CEa0.net
>>549
中国国内からは通常の方法ではtwitterとかgoogleとかyoutubeとかは見られないらしいよ

554:デフォルトの名無しさん
19/05/29 23:20:45.39 w1YMyBUf0.net
VPNで何とでもなりそうだけど、どうなのかね

555:デフォルトの名無しさん
19/05/30 06:16:41.72 3VEQV70R0.net
vpnでどうにかなった

556:デフォルトの名無しさん
19/05/30 09:08:02.19 8juV0fmw0.net
機械学習で株価って、ずいぶん前からやられていることだから
結果については、その人の力量次第

557:デフォルトの名無しさん
19/05/30 10:22:31.99 3C4CVC+50.net
>>551
それでも儲けるハゲタカ

558:デフォルトの名無しさん
19/05/30 10:44:39.22 niFMShc3a.net
株価の予想に頼らない売買法さや抜き。

559:デフォルトの名無しさん
19/05/30 14:38:28.57 8juV0fmw0.net
>>558
株であれば会員業者
為替は取引業者じゃないと
手数料の関係で儲けるのは大変難しい

560:デフォルトの名無しさん
19/05/30 19:09:07.15 aU6K3cRFM.net
transformerてcnnなの?

561:デフォルトの名無しさん
19/05/30 19:20:01.02 Ec3P7ZkhF.net
>>543
出力5通りしかないなら3bit出力でもいけるはず

562:デフォルトの名無しさん
19/05/30 19:52:55.23 0qwHKIKpa.net
2進数表現は分散表現だから個々のbitに意味がない限りone-hotの方がいい

563:デフォルトの名無しさん
19/05/30 20:41:03.18 Ec3P7ZkhF.net
人間の脳だとどっちなんだろ

564:デフォルトの名無しさん
19/05/30 20:45:39.63 s4B+etfT0.net
理論上はデルタヘッジしときゃ儲かるんでないの?

565:デフォルトの名無しさん
19/05/30 22:19:08.77 PBHpgwjDp.net
>>564
鞘どりと同じで枚数を多く買って微調整が必要だから手数料負けする
デルタヘッジは相場が動けば儲かるように書かれてるけど、実際にやると始値終値で仕掛けない限り理想の価格で買えない
あとデルタ調整を毎日できるマメな性格と、急激に動いた時に即座に対応できる暇人の能力が必要になる

566:デフォルトの名無しさん
19/05/30 22:57:28.17 s4B+etfT0.net
>>565
なるほど。
>実際にやると始値終値で仕掛けない限り理想の価格で買えない
この視点は完全に抜けてたわ。

567:デフォルトの名無しさん
19/05/31 08:33:35.49 8Nq4J3at0.net
TJOの本名ってなに?
著書を読みたい

568:デフォルトの名無しさん
19/05/31 08:56:09.46 JBiczG6TM.net
>>566
俺は違う考え方。
予測と売買手法はペアで考えるべきと思います。
というか関係深いので、
予測手法と売買手法の
適切な組み合わせを
模索すべきでしょう。
使ってるデータも予測手法も明らかにしてないのに
始値と終値が理想と言われても
ピンときません。

569:デフォルトの名無しさん
19/05/31 09:50:20.29 vi/KBQMNM.net
板情報も予測に含めるのは、出来たらいいけどデータ集めが無理そう

570:デフォルトの名無しさん
19/05/31 12:06:44.13 Ff6e28/xH.net
ステップ関数で閾値を超えたら1超えなかったら0
閾値を移行して+b=-thresholdでバイアスに置き換えると計算楽でなるほどー
とか思ってたんだけどさ
シグモイドなんかだと断絶してないじゃん。どの値入力されても連続的に出力されて閾値無いじゃんと思うの
んで閾値が無いなら上の定義からバイアスも無いんじゃね?って思うんだ
バイアスってなんなんだろう閾値じゃないんか

571:デフォルトの名無しさん
19/05/31 12:25:46.27 anN+B1rmr.net
シグモイドが0.5を超えるかどうかが境目じゃね

572:デフォルトの名無しさん
19/05/31 13:41:13.67 kJS62wWPp.net
>>568
予測と売買手法はデルタヘッジという言葉に含まれていて分離されているわけではないよ
デルタヘッジは売買手法のことで、ボラが大きくなることを予想した場合にとる手法のこと
理想価格というのは、検証に使った価格と同じ価格で売買できるかという事

573:デフォルトの名無しさん
19/05/31 20:08:15.95 Y4zgyW5lM.net
【機械学習】株価予測
スレリンク(tech板)
過疎ってるこっちを使ってやってくれや

574:デフォルトの名無しさん
19/05/31 21:03:34.70 SYuh0ZxQ0.net
少なくとも今はボラティリティーはかなりでかい相場と見ていいだろう。
これでボラティリティー低いとか言ったら安定とはとか思い出すわ。

575:デフォルトの名無しさん
19/06/01 00:21:56.03 6lfNl3yX0.net
>>573
めっちゃ過疎ってたw

576:デフォルトの名無しさん
19/06/01 09:12:18.05 HfNJIaaua.net
正直株価予想興味ない

577:デフォルトの名無しさん
19/06/01 11:05:39.49 FEy0/cL3a.net
こんな素人レベルの考えで株価予想できるなら当然世界中の投資家が既にやっていて多額の金が動いている
そうすれば上がりそうなら買い、下がりそうなら売りが即座に入るので結果的に株価の変動がほぼなくなる
現状そうはなっていないので誰にもできていないということ

578:デフォルトの名無しさん
19/06/01 11:41:45.97 KmtNp3Ps0.net
今は予測どうこうより
他人より早く変動をとらえて
差額をかすめ取る方が勝つ
だからFPGAが流行る

579:デフォルトの名無しさん
19/06/01 14:42:54.57 RQeh12YpM.net
AIも結構負けてるらしいけどね

580:デフォルトの名無しさん
19/06/01 16:20:19.02 WS2F10M10.net
>正直株価予想興味ない
そこだよな
技術者って株やってるやつがそもそも少ないんだわ

581:デフォルトの名無しさん
19/06/01 16:30:05.62 hwSQjOfA0.net
取引用のAPIとか流行ってないのもあると思うけど

582:デフォルトの名無しさん
19/06/01 17:34:56.30 dhP+frpUx.net
>>581
GMO証券が昔やってたけど、プログラマーが業者間アービトラージやりすぎて禁止にしたんだわ
同じUSDJPYでも業者間で開きがあってね、でも基本は同じ価格だから監視して反対売買するだけでノーリスクだったんだ
そしたらシステムの不備をついての取引はなかった事にするって決められて取引ノーカン、待て待てお前らもシステムの不備で個人に損失押し付けてるだろってなって、GMOがめんどくせ、でAPIごと無くなったw

583:デフォルトの名無しさん
19/06/01 17:38:45.74 hwSQjOfA0.net
GMO API懐かしい。
なるほど、そんな裏話があったとはw

584:デフォルトの名無しさん
19/06/01 18:51:47.90 GYFwl+wK0.net
「手を動かしながら学ぶ ビジネスに活かすデータマイニング」尾崎 隆
禿げてるくせにアイコンではドフサなのなw

585:デフォルトの名無しさん
19/06/01 21:33:13.93 q5GNYH3B0.net
これはひどいw
フレーム問題は解決済みというこのブログの62からの書き込みをご覧下さい。
ななしさんvs田方さんの議論が続いているけど
田方さんはひたすらコピペを繰り返すのみw
どちらの意見の方が正しいと思いますか?
URLリンク(robomind.co.jp)

586:デフォルトの名無しさん
19/06/01 22:20:06.45 6lfNl3yX0.net
>>585
わたしはナナシさんに一票ですかねー

587:デフォルトの名無しさん
19/06/01 22:41:25.66 2XldKqBd0.net
双方、定義が曖昧で詰め切れてないような
言葉で説明するより、数式化した方が解りやすい議題では?

588:デフォルトの名無しさん
19/06/01 22:47:35.18 6lfNl3yX0.net
確かにそんな感じはするよね
ナナシさんの方は人間すら解けない一般化フレーム問題について言及してそうだし
田方さんの方は条件が揃えば有限推論にまで落とし込めるレベルまで来てるって話してる
自分はまだ後者すら怪しいと思ってる

589:デフォルトの名無しさん
19/06/02 03:44:15.71 2KxPItQH0.net
ボーナス出たらPC買い替えたいんだけどみんな自宅でどんなPC使ってる?
コンペ出てる人とかはモンスタースペックなんだろうか
今使ってるのが下のスペックなんだけどGPU積んでるやつそろそろほしい
ノートPC
メモリ8G
SSD128G

590:デフォルトの名無しさん
19/06/02 06:15:33.28 IIH/Ft8W0.net
>>589
ゲーミングPCにUbuntu入れてる
Core i7-8700
32GB
RTX-2080Ti
30万円くらいしたけど15万円くらいのノートPCにして残りはクラウドでも良かったかな

591:デフォルトの名無しさん
19/06/02 08:49:41.97 sOEEtAtn0.net
automlでいいじゃん

592:デフォルトの名無しさん
19/06/02 11:39:59.34 KRm86vg2a.net
colabでタダで使えるGPUが50万ぐらいするやつだから、それ以上の金をつぎ込むかどうしてもオフラインで使えなければならないとかでなければ
PCはできるだけ安価にして機械学習の実行はcolab使った方が圧倒的にマシ

593:デフォルトの名無しさん
19/06/02 11:42:57.91 +FZaNNUF0.net
EC2のp2インスタンスで優雅に実行してる

594:デフォルトの名無しさん
19/06/02 11:49:22.08 fhCQazd50.net
URLリンク(headlines.yahoo.co.jp)

595:デフォルトの名無しさん
19/06/02 16:16:23.54 sOEEtAtn0.net
向こうにデータが流れちゃうんだっけ?

596:デフォルトの名無しさん
19/06/02 16:54:44.09 bAFc1zkP0.net
>>594
だれが責任取るんだろうな

597:デフォルトの名無しさん
19/06/02 19:01:56.94 J26IJNP50.net
AIも居眠りするんか

598:デフォルトの名無しさん
19/06/03 00:44:11.05 ovfSzwnAM.net
seq2seqをrnnではなくcnnでやる論文が出たの、まだ一年前か
あまりにも技術の進歩が早すぎて辛い。学習コストが高すぎてプライベートを侵食してる

599:デフォルトの名無しさん
19/06/03 00:59:05.77 XztrACRT0.net
初歩的な質問ですいませんがAI系の論文てどこで見れるんですか?

600:デフォルトの名無しさん
19/06/03 01:17:14.89 M+xUF/Q70.net
URLリンク(arxiv.org)

601:デフォルトの名無しさん
19/06/03 01:39:49.35 XztrACRT0.net
>>600
英語なんすね・・・(^_^;)
ありがとうございます

602:デフォルトの名無しさん
19/06/03 07:44:41.95 uDEDVvyl0.net
グーグル翻訳かけろよ

603:デフォルトの名無しさん
19/06/03 08:08:44.21 3/CobnB+0.net
てかクソみたいな日本語解説よりも良い論文てのは読みやすいもんだから。

604:デフォルトの名無しさん
19/06/03 08:52:30.51 laJYrrTta.net
英語なんすねと言ってる時点で論文読むのは無理

605:デフォルトの名無しさん
19/06/03 09:05:36.33 lmgaybdAM.net
日本語の論文?で完結する分野あるのかね。歴史、宗教、文学くらいかや

606:デフォルトの名無しさん
19/06/03 09:51:04.68 NMMhu3n80.net
>>605
だとしても前者ふたつは古文書という難関が待っているw

607:デフォルトの名無しさん
19/06/03 10:21:07.26 KMfIyW070.net
美人シリーズ第4弾
URLリンク(youtu.be)

608:デフォルトの名無しさん
19/06/03 12:03:19.08 e0wnqHBFa.net
今中国がアメリカ追い越したからアメリカ人は中国語に四苦八苦してるって聞いたが

609:デフォルトの名無しさん
19/06/03 12:12:24.36 ZJy6OnVgF.net
日本語で書いてあっても読めんとか言うよこういうモンスターは

610:デフォルトの名無しさん
19/06/03 12:55:46.32 4oSq2JT3a.net
数学と英語苦手な時点でこの分野はやめた方がいい
これまでのIT土方と違ってそれなりに頭は必要な分野

611:デフォルトの名無しさん
19/06/03 15:18:59.46 KMzFsLrVM.net
そう
英語と数学は勉強したほうがいいね
じゃないと仕事にならんでしょ

612:デフォルトの名無しさん
19/06/03 15:24:19.33 IZ54YEPMp.net
プログラマー、ソフトウエアを目指す限り、英文からは逃れられないよ。
そこがクリアできてもIT土方が沢山いるのに。
そもそも何かわからなかった時に、どうやって解決法を見つけてるんだよ。 日本語で間に合ってる? よほど時代遅れの知識だな。

613:デフォルトの名無しさん
19/06/03 16:28:44.31 dNq8yLNDM.net
そこそこなアプリ作るのと機械学習ってどっちが難しい?

614:デフォルトの名無しさん
19/06/03 18:06:46.78 S2kjcDL10.net
【速報】クオカード五百円分とすかいらーく優待券をすぐ貰える   
URLリンク(pbs.twimg.com)  
    
① スマホでたいむばんくを入手
② 会員登録を済ませる 
③ マイページへ移動する。    
④ 招待コード→招待コードを入力する [Rirz Tu](スペース抜き)   
   
今なら更に4日18時までの登録でクオカードとすかいらーく優待券を両方ゲットできます    
    
数分で出来ますのでお試し下さい

615:デフォルトの名無しさん
19/06/03 18:44:54.25 IFRF1HL70.net
>>613
機械学習だけやるならそんなに難しくないでしょ
フレームワーク使えば理論知らなくても結果だけはだせるし
基本的にバッチ処理だし
この地味な作業を楽しいと思えるかが重要

616:デフォルトの名無しさん
19/06/03 19:02:00.26 KMzFsLrVM.net
今のところPythonのライブラリに
データ突っ込むだけで仕事になってしまうからなあ。
今後はそれだけじゃあダメだと思うけどね。
若い人は今のうちに英語と数学を
勉強しておくべきと思いますね。

617:デフォルトの名無しさん
19/06/03 19:11:49.90 K3p1xLZi0.net
>>614
CM見てインスト済み

618:デフォルトの名無しさん
19/06/03 19:36:10.22 TWqm3GopM.net
そんな仕事あるんか
解釈性もくそもないな

619:デフォルトの名無しさん
19/06/03 19:50:11.89 3/CobnB+0.net
英語は必要だとは思うがそもそも日本語で十分なところもできてない奴は多い。
そういう意味では英語わからんでも十分。

620:デフォルトの名無しさん
19/06/03 20:03:16.10 uDEDVvyl0.net
chainer(笑)のやつか
松尾豊(笑)のやつなら日本語だろ

621:デフォルトの名無しさん
19/06/03 20:29:56.17 VGERDnng0.net
>>619
意味不明、日本語を勉強したらw

622:
19/06/03 20:36:09.49 4mhHvrQR0.net
>>608
アメリカ人に中国語は無理でしょうね…
まず漢字を1万ほど覚えなくちゃならないですから

623:デフォルトの名無しさん
19/06/03 20:53:44.42 VGERDnng0.net
帰化シナ畜の発言は重い

624:デフォルトの名無しさん
19/06/03 20:57:59.06 uC3eXgjBM.net
なんで日本人が作るAIってレベル低いの?

625:デフォルトの名無しさん
19/06/03 21:06:24.06 9zscLiuLM.net
AIは日本人の仕事を奪うからな。

626:デフォルトの名無しさん
19/06/03 21:12:54.57 tuBqQaKmM.net
ジェネラリストに作らせるからじゃない?

627:デフォルトの名無しさん
19/06/03 22:12:54.02 3/CobnB+0.net
アメリカだろうと中国だろうとまともに応用されてる機械学習技術なんてそう多くはない。
単純に当たりづらいものに規模で負けてりゃそりゃそうなるわ。

628:デフォルトの名無しさん
19/06/03 22:21:54.97 XztrACRT0.net
最新の論文を読んでないと仕事にならないとか思い込んでるからなんだよな
人のアイデアをパクってても新しいものは生まれない

629:デフォルトの名無しさん
19/06/04 00:45:55.87 8xHD1vRka.net
大半のエンジニアはパクる能力から発展して新しく生み出す能力を身につけるんだけどな
無から生み出せるのなんて一握りの天才だけなのでそんなのを前提に物事考えてはならない

630:デフォルトの名無しさん
19/06/04 02:01:41.10 KLSsoQXNM.net
無から生み出せるなんて
神のみだよ
人は脳の物理的限界を
超えられないんだ
サルと同じようなものさ

631:デフォルトの名無しさん
19/06/07 22:31:32.71 NFFQc2wE0.net
>>616
>今のところPythonのライブラリに
>データ突っ込むだけで仕事になってしまうからなあ。
将来的には、似たようなことが主流になるだろう。
通常言われる専門の技術者が作ったものは信用されなくなると思う。
信用度の高いものが、パッケージのような形で供給され
それを使うのが一般化してくると思う。
今までの数理技術系と同じ流れになると思うよ。

632:デフォルトの名無しさん
19/06/07 22:51:34.40 SEIOZ3Zi0.net
機械学習の難所は、その突っ込むデータの選定としかるべき前処理かと

633:デフォルトの名無しさん
19/06/08 00:17:58.14 K02PGDcbH.net
その前処理もAIがやるようになるだろうなあ
スペシャリストの中のスペシャリスト以外は働けない世の中になりそう

634:デフォルトの名無しさん
19/06/08 00:39:31.90 VVVFFkBt0.net
>>632
それはその通りなんだが
AI関係の人はほとんどが、旧来からの分析者に比べると
その辺りを嫌う傾向、および軽視するがあるように見受ける。

635:デフォルトの名無しさん
19/06/08 05:49:01.12 2hi7btAr0.net
データは社内のデータベースにある
そこから引っ張るとしてとりあえずSQL文は書けないといけないが
AI系の人でまともにデータベースやSQL知ってる人を知らん
画像処理や自然言語処理も知らん
コモディティ化した今のディープラーニングなら
理論知らなくても解析できるし
その辺理解してるデータエンジニアだけが生き残りそう

636:デフォルトの名無しさん
19/06/08 08:18:18.40 JxaHk6L10.net
>>631
知ったかしてるところ悪いが「数理技術」はそこまで安定したことは一度もない。

637:デフォルトの名無しさん
19/06/08 08:23:50.60 5drHbnb00.net
機械学習やってる研究者って天才の実装パックてるだけやん。。。
まあ数学者じゃないから仕方ないけどもう少し数学的なとこを考えてほしい

638:デフォルトの名無しさん
19/06/08 08:28:17.16 JxaHk6L10.net
CNTK とか数学的アプローチはある。ただ恐ろしく実用的ではない。

639:デフォルトの名無しさん
19/06/08 09:45:57.34 VVVFFkBt0.net
>>636
おそらく言っている意味と、あなたが捉えている意味が異なるんだとおもう。
たとえば、医薬など、学会や国際的な組織に亭主るする際に、この手法は
私があらたにプログラムしましたでは、信用してもらえない。
その論文などのために、みんながデバックしろという話になってしまう。

640:デフォルトの名無しさん
19/06/08 10:29:12.95 o8w0Fi6UF.net
そやな、閉じた世界なら何でもいいけが信頼性考えるとご免こうむる。
金融の資金運用でも自己資金ならどうでもいいが、預託資金の運用だと
説明責任もあるから、分析などのコアには信頼度の高いもの使う。

641:デフォルトの名無しさん
19/06/08 10:42:37.12 3e6+W68wH.net
AIやってて画像処理も自然言語処理も知らないって何やってた人なのだろうか

642:デフォルトの名無しさん
19/06/08 10:43:11.34 o8w0Fi6UF.net
考えたら機械学習でPython利用が多いというのも、流用できるからが多いわけだから、このの世界も次第にそうなって行くだろ。業務と手法のインターフェースに成れる人、あるいは、商用パッケージ作る人以外は職が難しくなるかもまだ先だろうけど。

643:デフォルトの名無しさん
19/06/08 11:01:05.35 o8w0Fi6UF.net
>>641
AIで画像処理中心は今に始まった話だからね

644:デフォルトの名無しさん
19/06/08 11:03:57.06 pkTweyaS0.net
>>639
馬鹿乙

645:デフォルトの名無しさん
19/06/08 11:10:54.44 ryWt2GlsF.net
日本が遅れてる理由を垣間観た気がする

646:デフォルトの名無しさん
19/06/08 12:03:39.89 uBDMoQSsa.net
ベイジアン最適化は学習を自動化させる目的で使われてるよ

647:デフォルトの名無しさん
19/06/08 12:22:42.56 88WJsb000.net
>>641
AI作れた?

648:デフォルトの名無しさん
19/06/08 12:26:12.19 ZCxD/IFaa.net
>>647
AIって何を言ってる?

649:デフォルトの名無しさん
19/06/08 12:39:27.20 TXqpB7K3M.net
東大は松尾豊も
叔父さまのコネで
東大の教授になったのね
なんであの馬鹿たれが
異常に若くて教授になれたのか
不思議だったんだ

650:デフォルトの名無しさん
19/06/08 12:40:53.96 CckI98TW0.net
馬鹿ばっかり

651:デフォルトの名無しさん
19/06/08 12:57:59.23 JxaHk6L10.net
>>639
実際問題信頼できる統計計算なんて回帰分析ぐらいのもので、
random forest系統、deep learning 系統など少しでも複雑な手法の場合、
安定した実装なんてものは未だかつてない。
ただ有名どころを使ってまっせってアピールが蔓延っただけで
その種の業界の信頼度が揺らぎまくったというのがここ数年の流れだろう。
何かを発見する際の手法としては使われてても
何かを保証するツールとしてはまだ全然だし、もしかしたら原理的に無理、もしくは不可能の可能性は結構ある。

652:デフォルトの名無しさん
19/06/08 13:34:26.87 CckI98TW0.net
コネで東大教授になれるのかw

653:デフォルトの名無しさん
19/06/08 15:36:30.34 tdlQ+u900.net
なれるだろ
iPSでなんかやらかした人も東大教授(准教授だったか?)だし
特に機械学習なんて日本のレベル低すぎてどんぐりの背比べなんだから
コネにならない方がおかしいわ

654:デフォルトの名無しさん
19/06/08 15:57:40.02 2hi7btAr0.net
松尾さんって人まともな論文出してるの
日本でヒントン氏レベルの扱いなんだが

655:デフォルトの名無しさん
19/06/08 16:10:48.96 wPg0m4E00.net
>>652
最低限の実力(外部資金獲得)があること
他に同じ研究をしている人が学内にいないこと
コネはないよりあった方がいい
論文はあればいいが、最近の大学はどこも金がないから産学連携を前面に出せる人を欲している

656:デフォルトの名無しさん
19/06/08 16:17:22.39 wPg0m4E00.net
>>654
東大で教授まで来ると研究時間はほとんど取れないから、研究方面での活躍は余程いい弟子が来ない限り難しいだろう

657:デフォルトの名無しさん
19/06/08 16:29:43.96 CckI98TW0.net
>>655
工学部の事情はしらんが、そんな当たり前のことは聞いていない

658:デフォルトの名無しさん
19/06/08 16:31:12.45 2hi7btAr0.net
>>656
研究できないって訳がわからない
最高学府のAI研究室だよ?

659:デフォルトの名無しさん
19/06/08 16:32:47.46 CckI98TW0.net
>>639
こういうプログラムを書いたことのない馬鹿ばっかり

660:デフォルトの名無しさん
19/06/08 16:50:05.05 wPg0m4E00.net
>>658
こればっかりはもう、本当に情けない話だが事実だ
研究時間が取れるのはせいぜい准教授までだ
優秀な弟子を育てるためのフレームワークを組むのが彼の仕事だと私は思うが、責めるべきはそこじゃないかね

661:デフォルトの名無しさん
19/06/08 19:28:31.58 dgEPQa3n0.net
Geoffrey Hintonはlast authorが多いけどfirst authorが今でもある
一方、松尾は無い
松尾の研究室からでる論文は東大のわりにショボい
誰の意向か分からんが
日本でのai広報担当ポジを得てる

662:デフォルトの名無しさん
19/06/08 19:49:27.00 XbfNvLSpp.net
>>661
First Authorについては70歳を超えて学内事務など皆無の爺ちゃんと比較するのはフェアではないな
比較するならLeCunだろう
それより二つ目の件がむしろ問題だな
良質な論文を量産できる環境構築を早急に行うべきだ
東大はとにかく学生指導を甘く考えている

663:デフォルトの名無しさん
19/06/08 20:53:36.86 JxaHk6L10.net
日本でAIで金引っ張ってくるのが上手いやつは詐欺師しか見たことない。

664:デフォルトの名無しさん
19/06/08 22:09:40.78 dgEPQa3n0.net
>>662
松尾研がしょぼいのは
環境がしょぼいからじゃないだろ
あれで環境がしょぼいなら
東大より下の研究室はショボくて当然ということになる
松尾はnvidiaやベンチャーとも組んでて
あれは環境のせいじゃない

665:デフォルトの名無しさん
19/06/08 22:28:05.56 UWafBj2Ca.net
>>663
そいつらのせいで第三次AIブームも終わりそうだしな
データがない奴らが騒ぎ立てて結果出ませんってそりゃそうだろうと

666:デフォルトの名無しさん
19/06/08 22:52:51.14 wPg0m4E00.net
>>664
環境とはハードウェアがすごいとか予算が潤沢とか意味じゃない

667:デフォルトの名無しさん
19/06/09 01:10:28.23 fjoZT5gcM.net
>>662
松尾自身が論文書くことを捨てて
マスコミに出て有頂天なんだよ
ただの馬鹿だろ?

668:デフォルトの名無しさん
19/06/09 01:39:02.58 iJmQ5mgDa.net
金儲けも大事なのは事実だけど常に最優先事項であるとは限らないのにこんなこと言ってるしな
ディープラーニングは儲けてなんぼ! エンドユーザの付加価値を考えろ!松尾豊氏
URLリンク(ainow.ai)

669:デフォルトの名無しさん
19/06/09 01:46:57.58 fjoZT5gcM.net
> ディープラーニングは事例は増えているがビジネスになっていない
そりゃそうだ.
アホ学者どもがワンサカ群がってきて
無理矢理事例を作ってる。
実は表に出ないだけで
すごくビジネスになってる。
金も動いてる。
今の景気を支えてるのはAIビジネス
だからね。

670:デフォルトの名無しさん
19/06/09 02:08:43.27 w6PGXrHH0.net
ビジネスになってないのはすごく感じる
TensorFlowのサンプルをコピーしただけの
監視カメラの画像認識サービスの多さは酷い
こんなのを売り物にしようとしてるのは詐欺に近い

671:デフォルトの名無しさん
19/06/09 09:26:20.21 NAUdcA9m0.net
監視カメラ関連で内製する求人もここ数ヶ月で3件は見たよ。

672:デフォルトの名無しさん
19/06/09 09:26:57.56 /FZVYwra0.net
だって品質あげても苦労が多いだけで給料上がらないじゃん。
下手したら更に安い金で更に工数のかかる精度を要求されるようになるし。
査定精度の低いところがこういうことに手を出すのがそもそも間違いなんだよ。

673:デフォルトの名無しさん
19/06/09 09:33:54.75 NAUdcA9m0.net
要件定義怪しそうw
従来型ITって仕事でも要件定義怪しいの沢山あるもんね

674:デフォルトの名無しさん
19/06/09 10:08:18.40 /FZVYwra0.net
従来のSIer的な要件定義は基本無理。
だから機械学習を本番運用するのは難しいんだよ。
精度策定で結局嫌になってアリバイ作業に徹するようになる人は本当に多い。

675:デフォルトの名無しさん
19/06/09 13:33:10.54 w6PGXrHH0.net
精度が要件になってたらアウトだしな
やってみないとわからないし
一回でも下回ったらアウトなのか
精度でなかったらどうするのか
ビジネスになる訳がない

676:デフォルトの名無しさん
19/06/09 13:55:38.89 xN+bC573a.net
機械学習に限らず特にIT業界においては「作ったものを売って終わり」というタイプのビジネスは確実に減少を続ける
とは言え、継続的に開発を続ける形式の契約を他社と結ぶのは面倒なので大企業でも内製が増えている
これまで大企業で内製があまり行われなかったのは「IT=社内システム開発」で一旦完成すれば開発要員はほぼ不要になるので正規雇用などできなかったから
今はむしろ「IT=本業」なので常に案件が存在するので直接雇用してあれもこれもやらせた方が効率的となる
だから従来式のSIerが今のような規模では存続不可能と散々言われている

677:デフォルトの名無しさん
19/06/09 14:31:52.84 iQc3/8+U0.net
>>651
>>実際問題信頼できる統計計算なんて回帰分析ぐらいのもので
これすんごいそう思う。
なので、この分野で日本はまだきのこれるんじゃないかと妄想してる

678:デフォルトの名無しさん
19/06/09 14:42:15.14 xN+bC573a.net
回帰分析といってもモデルの選択肢を一般化線形モデルにまで広げてみれば山ほどの可能性があり、
その中でどういった実装を行うかは解析の経験値やドメイン知識に有無に大きく依存するわけで
「安定した実装」が何を指すかは不明確だけど、「この手順通りにやればOK」みたいなものを求めているならそんなものはない

679:デフォルトの名無しさん
19/06/09 15:28:50.25 fjoZT5gcM.net
ここで一般化線形モデルまで行くのか?
ちょっと極端すぎね?

680:デフォルトの名無しさん
19/06/09 16:06:14.14 z1WXn/lH0.net
>>676
まとめ
SI市場が無くなった

681:デフォルトの名無しさん
19/06/09 16:06:22.37 vzathb3ta.net
多くの人は単回帰や重回帰のことを指して回帰分析と呼ぶがこれらは一般化線形モデルの中で様々な条件を仮定したものにすぎない
もちろんそれらの仮定が分析対象にとって妥当なものなら何の問題もないが、最低限の数学や統計学が分からないと妥当性など判断できないはずなのに
そんな知識のない人が何となく単回帰・重回帰で直線・曲線を引いてみて何となくフィットしてるのを見せてドヤ顔している例が多い

682:デフォルトの名無しさん
19/06/09 17:11:03.41 /FZVYwra0.net
>回帰分析といってもモデルの選択肢を一般化線形モデルにまで広げてみれば山ほどの可能性があり、
>その中でどういった実装を行うかは解析の経験値やドメイン知識に有無に大きく依存するわけで
>「安定した実装」が何を指すかは不明確だけど、「この手順通りにやればOK」みたいなものを求めているならそんなものはない
こういうめんどくさい人が登場してあれこれ言うことも含めて安定しないので普通の回帰にしとけと。

683:デフォルトの名無しさん
19/06/09 17:52:27.15 yPvpM3IBa.net
統計モデルなら実データとどのくらい分布や分散が一致してるのか調べられる

684:デフォルトの名無しさん
19/06/09 19:19:45.77 vT6Mp8oIa.net
現実問題として回帰モデル以上のモデルを準備しても
過学習するだけだからな

685:デフォルトの名無しさん
19/06/09 19:28:50.93 kmadDgcNa.net
>>682
普通の回帰って何のことか分からないけど内部的に最小二乗近似してるなら誤差分布が正規分布でないのに使ったら明確に間違いだぞ

686:デフォルトの名無しさん
19/06/09 19:59:05.39 /FZVYwra0.net
そこまでノイズが複雑な場合、何やってもダメだろ。

687:デフォルトの名無しさん
19/06/10 01:05:22.06 fcJW0GWO0.net
>>685
誤差分布が正規分布ではない分布に従うモデルのことを一般化線形モデルと言います
ちなみに正規分布に従うものを一般線形モデルと言います
自由の女神ほどのナイス日本語訳まで行かなくてもいいが、もうちょい訳語考えろと言いたい

688:デフォルトの名無しさん
19/06/10 01:35:01.39 fcJW0GWO0.net
>>681
なんとなく単回帰・重回帰でドヤ顔する人と
一般化線形分析で謎のハイパーパラメータ持ち出してドヤ顔する人の区別がつきません

689:デフォルトの名無しさん
19/06/10 01:57:16.14 RiY8Pa+r0.net
回帰なんて今や面倒なこと考えずにニューラルネットにぶち込むだけだと思うんだが

690:デフォルトの名無しさん
19/06/10 02:18:48.96 eq86jRmO0.net
間違いだらけのことをどや顔で臆面なく言っちゃうのがこのスレのレベル

691:デフォルトの名無しさん
19/06/10 05:40:36.59 +XEUhSwt0.net
須山に修正してもらおう

692:デフォルトの名無しさん
19/06/10 06:12:15.29 3mQ7PTgOM.net
>>685
それ間違い
>>686
意味不明

693:デフォルトの名無しさん
19/06/10 06:13:50.37 3mQ7PTgOM.net
>>687
それも間違い

694:デフォルトの名無しさん
19/06/10 06:14:37.92 3mQ7PTgOM.net
>>688
こんなところで
聞いても無駄

695:デフォルトの名無しさん
19/06/10 07:03:46.89 fcJW0GWO0.net
>>689
そういう局面はあるだろうけど、本気でそう考えているなら恐ろしい

696:デフォルトの名無しさん
19/06/10 07:53:37.33 2I4+V8i80.net
ニューラルネットするなら回帰王♪

697:デフォルトの名無しさん
19/06/10 07:57:41.79 +XEUhSwt0.net
>>695
どっちでもよくね?

698:デフォルトの名無しさん
19/06/10 12:20:20.62 g6tidy/FF.net
別に回帰しかやってなくても
精度出てればそれでも良いと思うし
統計がなんでもかんでも悪いとは思わないが
それを「ブラックボックスだ」とか「信用出来ない」とか
「人間より優秀とは思えない」とか「責任誰がとるんだ」とか
言って欲しくないな
人間がやってそれ以上の精度出るのか?とか間違わないか?とかスピードは?とか
考えると「ブラックボックス(実際はそうじゃないが)」で良いと思う

699:デフォルトの名無しさん
19/06/10 12:21:40.70 g6tidy/FF.net
>>687
合衆国が一番の迷訳

700:デフォルトの名無しさん
19/06/10 12:30:18.47 QmI1edQr0.net
>>699
美国は?

701:デフォルトの名無しさん
19/06/10 12:52:27.52 g6tidy/FF.net
美国は文脈的に的外れだからどうでも良い
合州国じゃなくて合衆国を選んだのが迷訳っていう意味だし

702:デフォルトの名無しさん
19/06/10 13:35:48.80 OXwxgYdVH.net
>>698
アカデミックの人かな?
ビジネスの領域ではそんなこと言ってられないのよ

703:デフォルトの名無しさん
19/06/10 19:46:57.52 rY9Mn9x+0.net
機械学習初心者なのですがディープラーニング以外の機械学習って覚える必要ありますか?手法が無限にありすぎて覚えられないです。

704:デフォルトの名無しさん
19/06/10 19:47:28.66 zRTuBs9kM.net
ビジネスだけど?

705:デフォルトの名無しさん
19/06/10 20:15:35.50 laqTwvRyp.net
>>703
何がやりたいかによるかな
覚えるという言葉から察するに応用したいんだと思うけどkeras使ってfit回すのと、scikit-learn使ってfit回すのでは、ソースコードは殆ど同じように思う
そういう意味では、やりたい事と手法のマッピングをすることに意味があって、その手法がDeep Learningだろうがそうでなかろうが、あまり意味がないと思う
統計モデリングは少し腰を落ち着かせて勉強しないと身につかないので、世の中のデータサイエンティストでも活用できている人は少ないのではないかと思う

706:デフォルトの名無しさん
19/06/10 21:09:57.64 RiY8Pa+r0.net
>>703
今のところ必要ないと思う
今一番成果が出てる手法だけを使うべき

707:デフォルトの名無しさん
19/06/10 22:36:21.02 EQVv/EW6a.net
統計モデルについてはこの動画の説明が分かりやすいからこれ見ろ
URLリンク(youtu.be)

708:デフォルトの名無しさん
19/06/10 22:39:30.02 cl88emhA0.net
赤本読めよ

709:デフォルトの名無しさん
19/06/10 23:11:32.89 +ahrTwMVa.net
>>703
実用を考えるとディープラーニングができるほど綺麗なデータが大量に使えることってあまりないからむしろ他の機械学習手法の方を知っていると強い

710:デフォルトの名無しさん
19/06/10 23:29:42.63 A95SX7z40.net
>500

711:デフォルトの名無しさん
19/06/11 02:42:37.45 ZQzbuTIBM.net
>>709
禿同
>>706
馬鹿

712:デフォルトの名無しさん
19/06/11 18:09:22.34 6NZpwaykM.net
機械学習って楽しいですか?

713:デフォルトの名無しさん
19/06/11 18:36:41.34 SdCAq12yd.net
楽しくはない。
機械学習はあくまでもサブ技術。
メインに専攻すべきではない。

714:デフォルトの名無しさん
19/06/11 18:48:27.85 QClOim5zM.net
ひとによるだろ
そんなこと聞いてどーすんの?

715:デフォルトの名無しさん
19/06/11 19:01:09.34 ZQzbuTIBM.net
>>712
大好き!楽しい!
統計学の勉強も楽しい!
現在、統計学の応用の5本目の
論文書いてるところ。
ただ、仕事から帰って書いてるだから
時間足りなさすぎ!

716:デフォルトの名無しさん
19/06/11 19:39:18.49 XL/fn5z60.net
という夢をみたのであった

717:デフォルトの名無しさん
19/06/11 19:40:07.84 XL/fn5z60.net
嫉妬野郎でござった

718:デフォルトの名無しさん
19/06/11 19:44:25.65 ko492/aS0.net
そろそろ論文もAIが書くよ
てか生成系のモデル悪用の将来はいかに

719:デフォルトの名無しさん
19/06/11 19:46:19.65 rt/UvHAD0.net
論文はAIが書き、人間はアノテーション作業に明け暮れるのであった。

720:デフォルトの名無しさん
19/06/11 21:18:16.47 tg9Aa7Nc0.net
アノテーションって転移学習とかで自動化出来そうで出来ないな

721:デフォルトの名無しさん
19/06/12 05:09:56.24 fMVFjy++0.net
文章生成系を生成系というと怒る人がいる

722:デフォルトの名無しさん
19/06/12 08:31:05.93 fMVFjy++0.net
ソフトバンクの社外取締役っていくらもらえるんだろう。。。
1億円くらい?

723:デフォルトの名無しさん
19/06/12 08:34:59.71 +0pwNKukM.net
そん正義が連れてきたインド人役員は
100億円もらってたんだよね
ま、インド人だから高いのよ
中国人も高い
次は韓国人
奴隷は日本人
在日ならソフトバンクに
行けばいいよ
韓国名で応募してね!
仕事は通名(日本名)でOk

724:デフォルトの名無しさん
19/06/12 09:01:52.01 k5XrsZPH0.net
ソフトバンクの社内役員は基本的に1億円。孫正義も同額で全額被災者に寄付を続けている。
他にストックオプションなども有るだろうけど。

725:デフォルトの名無しさん
19/06/12 09:26:41.42 3wcfQWS2M.net
松尾豊はソレで研究し金に

726:デフォルトの名無しさん
19/06/12 09:27:07.85 R4nJHUbN0.net
太陽光発電所を作ります(大法螺)

727:デフォルトの名無しさん
19/06/12 12:38:17.82 Wmv+D3tsM.net
>>724
へー本当に寄付してんだ
口先だけかと思ってたよ
で、どこに寄付してんの?

728:デフォルトの名無しさん
19/06/12 17:00:13.34 cGak2oaxp.net
>>726 たくさん作ってるじゃん。 サウジのやつは没になったけど。 国内では最大手に近いんじゃないのか?

729:デフォルトの名無しさん
19/06/12 19:12:40.23 yRay9q0a0.net
>>728
埼玉県にきまってるだろ

730:デフォルトの名無しさん
19/06/12 19:19:26.93 yRay9q0a0.net
計画はすべて尻つぼみ(笑)

731:デフォルトの名無しさん
19/06/12 19:24:11.00 yRay9q0a0.net
メガソーラーは1都道府県ごとに事業会社を設立して運営する考え。仮に20メガワット規模
の発電所が1年間稼働して売電すると、売上高は8億円規模になるという。国の規制で実現
していない発電した電力の全量買い取りや電力会社が持つ送電網との接続などが事業成立
の条件で課題は山積みだ。また発電事業とは別に埼玉県や神奈川県など地方自治体と
自然エネルギーの普及促進へ政策提言する団体「自然エネルギー協議会」も設立する。

732:デフォルトの名無しさん
19/06/12 22:40:31.71 BSq+d1KN0.net
機械学習って色んな手法あるけどみんなどれも覚えてるもんなの?
参考書やってて種類多すぎてどのケースでどれ使えばいいのかすら分からん

733:デフォルトの名無しさん
19/06/12 22:50:24.33 mQ+7g/y1d.net
手法を覚えるって、手法の何を覚えるんだ

734:デフォルトの名無しさん
19/06/13 09:44:39.89 g8amv0Zv0.net
>>732
手法を使えよ

735:デフォルトの名無しさん
19/06/13 11:41:27.81 qBC/YmXXM.net
名前と特徴、適正でしょ

736:デフォルトの名無しさん
19/06/13 12:04:23.81 bhCstcom0.net
Colaboratoryで巨大なデータセット扱うおすすめの方法を教えてください
自宅にwebサーバー建ててColaboratoryからwgetしてみたのですが、40Gあるのでアップだけで2時間、展開で1時間とか効率悪すぎて泣けてきます
Googleドライブ有料版をマウントして使ってみたのですが、何か1日の転送量最大値があるのかファイルが破損してしまいます
何かいいアイデアください!

737:デフォルトの名無しさん
19/06/13 13:11:29.71 3Y+kP9XaM.net
回線が遅いって話?
速くすれば?

738:デフォルトの名無しさん
19/06/13 13:36:35.55 2T1UAjXOa.net
>>736
ファイルを分割して並列であげろ

739:デフォルトの名無しさん
19/06/13 14:39:13.04 bhCstcom0.net
>>737
まあ、回線も遅いですが他の方法でアップしなくてもいい方法とかないかなと
>>738
aria2てので並列ダウンロードしてみます!

740:デフォルトの名無しさん
19/06/13 18:38:00.31 bhCstcom0.net
うーん、Google側が細いのか最大で10MB/s位しかでないですね

741:デフォルトの名無しさん
19/06/14 00:22:53.60 Gaxv7IADM.net
当たり前じゃん?
どんだけの人がアクセスしとると思ってる?

742:デフォルトの名無しさん
19/06/14 00:57:35.96 7+4XKUlI0.net
>>736
webサーバ建てる必要性ある?

743:デフォルトの名無しさん
19/06/14 10:18:19.40 2Fe7zdUeH.net
有料の環境つかえよ…

744:デフォルトの名無しさん
19/06/14 15:52:36.68 rI3r/fFD0.net
URLリンク(hazm.at)
これって
loss 順調に下がって下がり止まって,
acc 順調に上がって上がりきっても
val_loss val_acc 安定していないけど最終的に収束してて驚く
この不安定な val_loss val_acc だけど学習続けたのは,
loss acc が安定していたからなのかな?
いつ収束するかわからないまま学習続けるとか狂気の沙汰な気がする・・・

745:デフォルトの名無しさん
19/06/14 17:23:40.19 Wi4bG/9MM.net
何が言いたいのか
感想?

746:デフォルトの名無しさん
19/06/14 17:32:41.95 rI3r/fFD0.net
いや loss acc が安定していれば val_loss val_acc が不安定でも収束に向かうのか知りたい
発散してるように見えても大丈夫なのかなと

747:デフォルトの名無しさん
19/06/14 19:31:51.91 M8ulC+VI0.net
 大丈夫

748:デフォルトの名無しさん
19/06/15 12:43:28.02 XjE03gEa0.net
gpt-2もマスクがバックにいるから
大袈裟に盛ってるんだろうなと思う


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch