【統計分析】機械学習・データマイニング21at TECH
【統計分析】機械学習・データマイニング21 - 暇つぶし2ch300:デフォルトの名無しさん
18/11/28 11:50:17.77 fukku41A0.net
>>287
富士山麓でマラソンするやつかw

301:デフォルトの名無しさん
18/11/28 18:16:24.09 XzZhYEcL0.net
Amazonが社内用に提供していた機械学習コンテンツ群を無料で公開開始
URLリンク(gigazine.net)

302:デフォルトの名無しさん
18/11/28 20:16:20.61 2i6dC1ZOM.net
アマゾンのレコメンドシステムが
未だにクソの邪魔ものでしかないのに
クソのような教材に決まってる。
まったく興味ない

303:デフォルトの名無しさん
18/11/28 21:41:20.54 DjHHbzX9M.net
グレースケールの画像を転移学習させたいのですが、良いデータセットないですかね?
グレースケールのはMNISTくらいで他はカラーの画像のデータセットしか知らないのですが

304:デフォルトの名無しさん
18/11/29 00:58:15.69 +lcOq0Gba.net
カラーをグレー化すればいいじゃないか

305:デフォルトの名無しさん
18/11/29 01:43:19.09 1etS0CVPM.net
Y信号を作れよ

306:デフォルトの名無しさん
18/11/29 08:02:16.54 Ir4DPNyea.net
今さらコンポジットかよ

307:デフォルトの名無しさん
18/11/29 08:55:20.96 EjV+0ygQd.net
TF probability をやり始めたけどさっぱりわからん… どうすりゃいいのw

308:デフォルトの名無しさん
18/11/29 09:23:56.0


309:1 ID:nN98WmZ90.net



310:デフォルトの名無しさん
18/11/29 18:02:48.55 lRn1yU1jH.net
angularとかのほうがわけわからん

311:デフォルトの名無しさん
18/11/29 18:44:11.79 9H8/nb3Ya.net
angular なんか分からなくないだろw
>>296
pytorch のやつやれ

312:デフォルトの名無しさん
18/11/29 20:38:04.37 tvwaS2uQ0.net
angular momentum とは角運動量のことである

313:デフォルトの名無しさん
18/11/30 02:11:39.26 gAFwEIHo0.net
交差検証についてなんですが、例えばアイリスデータでSVMで3分割の交差検証した時(3分割の平均が)94%~97%ぐらいばらつきがあると思うのですが3分割の平均をさらに100回の平均とかして評価するって感じでいいんですかね?

314:デフォルトの名無しさん
18/11/30 03:53:30.13 ugWmTQyna.net
データが減ると更にバラツキが増すよ

315:デフォルトの名無しさん
18/11/30 06:15:10.87 S+rRRWu3a.net
交差検証はそれが目的じゃないから

316:デフォルトの名無しさん
18/11/30 08:44:44.60 gAFwEIHo0.net
>>303
研究とかで発表するときはどういう値を使ってるのですか?

317:デフォルトの名無しさん
18/11/30 10:54:28.88 Eqzy0E1oa.net
Microsoft Facebookの人工知能ツール「PyTorch」への開発協力
URLリンク(aitimes.media)

318:デフォルトの名無しさん
18/11/30 13:00:06.59 gAFwEIHo0.net
例えばkaggleとかなら初めからトレーニングデータとテストデータが分かれててテストデータとの答え合せで数値としての精度を用いてます。
自分で1つのデータを用いて精度を出したいときに、データが少なくてテストデータの選ばれ方にかなり影響を受けるというようなとときにはどういう風な値を用いればいいのかっていうのが聞きたいです。

319:デフォルトの名無しさん
18/11/30 13:02:03.08 gAFwEIHo0.net
>>306
テストデータの選ばれ方によって予測精度が全然違うみたいな時です。

320:デフォルトの名無しさん
18/11/30 14:10:30.81 PfAczbior.net
バイアス・バリアンスでグクってみな
過学習気味だと思う

321:デフォルトの名無しさん
18/11/30 16:23:37.26 gAFwEIHo0.net
扱ってるデータの性質上データ数が少ないのは仕方ないのです…
今書いてるコードなんですが、
sklearnのcross_val_scoreでcvパラメータに層化分割を渡してます。(StratifiedKFold(n_splits=3, shuffle=True)
これでfor文で例えば100回回すと3つセットのスコアが100個出てきますよね?それで3値の平均のさらに100個の平均って感じで評価基準にしてます。3つセットのスコアの分散がそこそこ大きいのは仕方ないと思ってます。
これで良いのですかね。

322:デフォルトの名無しさん
18/11/30 20:22:51.78 1rBmpsWQM.net
もしかしてデータ数は変数より少ない?

323:デフォルトの名無しさん
18/12/01 01:13:01.62 rR+NA8K00.net
>>310
そんなことないですが

324:デフォルトの名無しさん
18/12/01 07:22:28.11 TVNWQlj6a.net
仮にだが、同じテストデータを入力したとして、都度異なる結果を得るかもしれない。
そうなら気にしない。

325:デフォルトの名無しさん
18/12/01 13:45:07.60 x+2OaCUx0.net
>>305
PyTorchがさらに広がりそうだな

326:デフォルトの名無しさん
18/12/01 16:00:36.28 anj/zlnz0.net
URLリンク(pbs.twimg.com)

327:デフォルトの名無しさん
18/12/01 16:03:42.40 b7Xa0FGW0.net
>>314
まんま俺じゃねーか!
まぁケース買い直して難を逃れたけどな

328:デフォルトの名無しさん
18/12/02 12:37:35.98 DCWKzkdC0.net
>>314
そのアニメおかしくないか?
その方向にガッ!とかいってひっかかるかな?

329:デフォルトの名無しさん
18/12/02 15:13:17.02 0nNccsdOM.net
おかしいのはこれがアニメに見える目の方やで

330:デフォルトの名無しさん
18/12/02 15:26:02.69 DCWKzkdC0.net
確かに。
おれは疲れているんだよ。
おれはおかしくなってる。

331:デフォルトの名無しさん
18/12/02 18:51:57.95 rbOAdF3H0.net
初めて来たけど新しくて注目されてる分野だけあってスレも活気があっていいね

332:デフォルトの名無しさん
18/12/03 07:56:04.08 YQ9o3EMnM.net
新しい理論ではないけど、
計算機の進化で計算できるようになったのと、
データ分析が役に立つことが認識された
ことが大きいと思う。
理論として21世紀に出てきたものは
ほとんどない。
DLなんて50年前の理論たし。

333:デフォルトの名無しさん
18/12/03 11:38:00.85 B/BM1MCl0.net
そのとおりだよ

334:デフォルトの名無しさん
18/12/03 11:39:08.74 spa+z7Nr0.net
基礎理論は昔に提唱されてたけど、実際できるようになってからの進歩は目まぐるしいよ
alphaGoとalphaGpZEROには恐れ入った

335:デフォルトの名無しさん
18/12/03 12:28:26.08 jE4cpzsPa.net
基礎理論とハードのスペックが揃えばそれだけで使い物になるわけじゃないからな

336:デフォルトの名無しさん
18/12/03 12:44:09.72 /cKWkF1j0.net
>>320
ほんそれ

337:デフォルトの名無しさん
18/12/03 12:45:53.17 /cKWkF1j0.net
>>323
今後はエクソソームだな

338:デフォルトの名無しさん
18/12/03 13:03:16.97 gJnDW9G3d.net
ディープラーニングのG検定ってどうよ?
公式テキスト買って読んでるわ。

339:デフォルトの名無しさん
18/12/03 13:58:43.26 +7MxWeRX0.net
検定で心が安らぐ(笑)

340:デフォルトの名無しさん
18/12/03 14:00:36.39 lgEDnwL/r.net
G検定でバーニーおじさんのルールってのが出たらしいけど、ググってもG検定関連の記事しか出ない
バーニーおじさんの出所ってどこなん

341:デフォルトの名無しさん
18/12/03 15:16:45.90 gJnDW9G3d.net
>>328
たしか、テキストに出てたわw

342:デフォルトの名無しさん
18/12/03 20:49:11.45 TieFIiIUp.net
>>233
落ちた人と比べたら受かった人はそれなりに理解していることが判るだろ
2級に合格した人が1級の能力を持っていないとは言えないけど
2級の能力を持っていることは判る
何も受けていない人は何も判らない
ゼロかもしれないし1級を超えているかもしれないし
判断する側からしたら区間推定の範囲を狭めることができる

343:デフォルトの名無しさん
18/12/03 20:51:44.68 B/BM1MCl0.net
人工知能の検定とか効果あるのか?
情報処理関連の国家資格のほうが有益だと思うよ

344:デフォルトの名無しさん
18/12/03 20:56:58.92 sSv+cxc9a.net
試験を受ける・受けないは自由だが機械学習専門で仕事にしてるような人が2級すら受かる能力がないとしたら大問題

345:デフォルトの名無しさん
18/12/03 21:12:21.84 B/BM1MCl0.net
資格は座学だからなぁ
本当にAI実技が出来るのかと
どっちかというと「会社で○年間人工知能の実務してました~」
のほうが面接受け良いぞ
あとコラボラトリーやっと動かせた
思ったより簡単だったが
アップロードが少しめんどいな

346:デフォルトの名無しさん
18/12/03 21:19:12.68 FxNa1H6F0.net
テストでは記憶が試されるが
別に覚えてなくても読んでわかれば全然問題ないはず

347:デフォルトの名無しさん
18/12/04 08:05:16.33 V4nQvbKaa.net
>>334
自分で判ってると勘違いや自己暗示をかけているだけかもしれない

348:デフォルトの名無しさん
18/12/04 08:42:28.96 EiTIheNPa.net
暗記しなくても調べれば分かるんだからいいっていうのは稀にしか使わないような複雑な公式とかならそれでいいんだけど
例えば統計検定2級までのような基礎的な内容に関してはそれではいけないだろう

349:デフォルトの名無しさん
18/12/04 09:38:24.31 6FMxL/qW0.net
>>330
お前の理解はその程度かw

350:デフォルトの名無しさん
18/12/04 20:22:10.65 NC+/7ITGM.net
DLの検定はサンプルみただけでイヤになった、
と理論の先生が言ってた。

351:デフォルトの名無しさん
18/12/05 00:53:53.91 NFwt/MmAM.net
RX480で機械学習したいけど
plaidmlが認識してくれない
openclってRadeonソフトウェアいれてるだけだと動かないとかあります?

352:デフォルトの名無しさん
18/12/05 16:28:35.00 kX9gokKe0.net
>>331
ほんそれ

353:デフォルトの名無しさん
18/12/05 16:29:14.67 kX9gokKe0.net
>>334
むしろ後者の方が大事

354:デフォルトの名無しさん
18/12/06 14:37:25.24 xp+E6Qnx0.net
ニューラルネットワークを利用して音楽を作曲する試み
URLリンク(gigazine.net)
聴くとなんかイライラするw

355:デフォルトの名無しさん
18/12/06 21:05:12.09 bu2uD6C50.net
優れたAI開発者とは何ぞやと問いに対して、
海外では、アルゴリズムを開発できる人、Kaggleで上位を取れるような分析者、に加えて、
課題解決の為にAIを実装できる人というのが入ってくるが、
日本企業は、要件定義と開発は別物だという認識が強いのか最後のが出てこない。
つか、提案できるやつを引き抜いてくれないので、
導入事例が豊富なモデルの二番煎じしか出来ないのはつまらん

356:デフォルトの名無しさん
18/12/06 21:13:32.62 PllMlAM90.net
ユーザー側が技術者に要件定義させないからな
知能指数がだいぶん違うだから先方の業務に関してもある程度的確な判断できるってことがわかってない

357:デフォルトの名無しさん
18/12/06 21:52:05.54 hPiWla9P0.net
モデルをユーザー指定にさせてるの?
それはまずいだろ
俺は要求精度だけだわ

358:デフォルトの名無しさん
18/12/06 22:00:55.11 3W4dDJkVd.net
たぶん誰もそんな話してないと思うが

359:デフォルトの名無しさん
18/12/07 00:41:20.12 rBsEDv/r0.net
>>343
流行りのAIを採り入れたいけど結局は保守的ということかね

360:デフォルトの名無しさん
18/12/07 00:50:03.54 +MDodQaia.net
プログラム書いたことないSIerが作った要件に従って下請けプログラマーがコーティングするだけなんだよな

361:デフォルトの名無しさん
18/12/07 15:08:02.31 lkrG/qbb0.net
>>342
このテのものは現れては消えるな

362:デフォルトの名無しさん
18/12/07 15:09:15.97 lkrG/qbb0.net
>>344
プライドωが許さないんだろうωω

363:デフォルトの名無しさん
18/12/07 23:03:52.71 v0RYsNx+0.net
クロスエントロピー誤差の値がマイナスってありえないよね
本の通りにDCGANくんで学習させたら識別器の誤差がマイナスになるときあるんだけど

364:デフォルトの名無しさん
18/12/08 00:28:15.02 AnxWbhvF0.net
これ誰か質問してなかったっけ?
URLリンク(www.atmarkit.co.jp)

365:デフォルトの名無しさん
18/12/09 05:39:24.92 A2Qb+vpb0.net
知らないうちにクロームの翻訳機能進化してんな 機電系技術記事みたいな簡単な英語ならほとんど問題ないくらいに訳せてる

366:デフォルトの名無しさん
18/12/10 18:27:14.86 AOtkUf/50.net
>>353
これを見て、翻訳機能をオンにしてみたけど、
英語の方が頭に入るレベルだった

367:デフォルトの名無しさん
18/12/10 19:10:43.51 oMa61cdx0.net
gmailの翻訳はよく分からんが妙に悪い
開発周りのページは大分読みやすくなった

368:デフォルトの名無しさん
18/12/11 19:59:03.01 UbM45EfdH.net
ganの生成モデルがよくわからないんだけど
潜在変数から画像を生成するのとかどういうことなの?

369:デフォルトの名無しさん
18/12/11 20:46:39.83 ugRfmXQd0.net
つまりそういうこと

370:デフォルトの名無しさん
18/12/11 21:46:54.89 UlZw5NRy0.net
AI白書発売されましたな

371:デフォルトの名無しさん
18/12/11 23:44:44.51 Nam5p+1w0.net
>>352
あった、あったw
確率で区別するって意見が大体だったっけ
自分もそれでいいじゃんって思ってた
リンク先読んでもよくわからなかったけど
そんな単純な話じゃないみたいだね

372:デフォルトの名無しさん
18/12/12 00:49:41.77 1ENf+5ona.net
ロジスティック回帰とかSVMみたいに境界決めたいけどそもそも正負両データがないと境界を知りようがないから難しいということ

373:デフォルトの名無しさん
18/12/12 01:28:26.70 0ODlcIYd0.net
最近お仕事で機械学習しなきゃいけなくなってkaggleとかで勉強してるんだけどなんかものすごくもやもやする
ブラックボックスをいじって結果だけ出てくるの眺めてまたいじって改良されたらそれで良しみたいな……
プログラミングの問題みたいにきっちり正解があるとか、システムにこういう機能が必要だからそれを満たすコードを考えるとかならすっきりするのさ
なんていうか正解に至る道を自分で見通せない気持ち悪さみたいな

374:デフォルトの名無しさん
18/12/12 01:30:01.87 0ODlcIYd0.net
いやそもそも正解も無いか。そこが気持ち悪いのかな
100%当てるモデルとかできるならいいんだろうけど現実的にないだろうし

375:デフォルトの名無しさん
18/12/12 02:29:18.56 nO92IoUy0.net
データには固有の性質があって、それを長く扱っている技術者だけがそういうことを知ってる。 kaggleで匿名化されてるデータやってても知見として得られるものないよ。 kaggleはそのへんが問題なんだよね

376:デフォルトの名無しさん
18/12/12 09:07:37.01 8RGcEFGi0.net
キュウリの等級付けとかだ

377:デフォルトの名無しさん
18/12/12 09:28:45.56 IoYvjuzw0.net
リンゴの分別だろ

378:デフォルトの名無しさん
18/12/12 10:26:06.15 EtDWiiCfa.net
100%的中させる必要などそもそもない
人間だってミスして例えばメーカーでの検査ミスなら不良品を流通させてしまう
機械学習システムによって人間より十分に精度や実行速度が上がったりするなら明らかにメリットがある
にも関わらず人間より圧倒的に少ないミスを過剰に問題視する方がおかしい
また、ミスの原因がはっきりしないのが問題だと言う意見もあるが人間のミスの方が
どう考えても原因は曖昧であり、現在導入されている機械学習システムは所詮回帰分析を複雑化したものに過ぎず、
その係数を正確に知れる分だけよっぽど論理的に説明ができる

379:デフォルトの名無しさん
18/12/12 10:40:58.39 nO92IoUy0.net
工業製品の検査は不良率○%以内って厳格に決められてるよ。

380:デフォルトの名無しさん
18/12/12 10:51:40.00 AKkFwy3+0.net
規定の不良率に収まるように学習すれば良いだけ

381:デフォルトの名無しさん
18/12/12 12:17:21.65 yNynVXTLF.net
URLリンク(qiita.com)
>環境の違いにより、設定がうまくいく場合があります。
warota

382:デフォルトの名無しさん
18/12/12 12:39:41.80 lwaVaEyWM.net
ヒヨコの雌雄は分からいけど猫と犬の見分けには自信あるぜ

383:デフォルトの名無しさん
18/12/12 12:41:14.51 lwaVaEyWM.net
我々はまずゴミの分別をちゃんと出来るようにはならねば。渋谷区45種類らしいぞ

384:デフォルトの名無しさん
18/12/12 14:50:33.13 B+ye3ltk0.net
>渋谷区45種類
どこの基地外が考えたんだか

385:デフォルトの名無しさん
18/12/12 18:35:23.09 AKkFwy3+0.net
仕事を増やせる優秀な公務員が考えました

386:デフォルトの名無しさん
18/12/12 19:48:32.73 QaHBTah60.net
変態区

387:デフォルトの名無しさん
18/12/13 08:28:05.50 IBjveTF2M.net
>>361
時間があれば
確率論→統計学→機械学習
と進めるべきなんでしょうね。
でも今どきはいきなりPythonですからね。
ま、客も分かってる人いないから。
もやもや解消には仕事を辞めて
6年間ほど死ぬほど勉強する必要あります。

388:デフォルトの名無しさん
18/12/13 13:41:27.22 zUsuMpSGa.net
そこまでかかるかよw 文系かよw

389:デフォルトの名無しさん
18/12/13 14:24:09.33 jNUFYyy9r.net
6年あれば医者になれるな

390:デフォルトの名無しさん
18/12/13 15:21:08.19 1rhavfkO0.net
医学部に受からんと、それに年寄りはマイナス加点だからね

391:デフォルトの名無しさん
18/12/13 19:18:29.34 wJiwgrMs0.net
確率論/関数解析/微分幾何はほしいな

392:デフォルトの名無しさん
18/12/13 19:25:15.84 wJiwgrMs0.net
それらプラス
信号処理、システム同程、現代ロバスト制御、カーネル法、統計学、情報幾何あたりやっときゃよい

393:デフォルトの名無しさん
18/12/13 19:26:35.52 wJiwgrMs0.net
だいたいの人がれべすぐえ積分です挫折するだろうけど

394:デフォルトの名無しさん
18/12/13 20:50:05.49 fxBdOf8f0.net
と人生挫折した奴が主張しております

395:
18/12/13 20:55:33.92 mMIcaeGH0.net
>>381
測度論的アプローチは万人に必要ですか?

396:デフォルトの名無しさん
18/12/13 21:20:30.21 Z8ETZL+a0.net
機械学習に数学は必要なし
したがって測度論など機械学習には全く必要ない

397:デフォルトの名無しさん
18/12/13 21:38:04.29 wJiwgrMs0.net
必要ないね

398:デフォルトの名無しさん
18/12/13 21:40:00.90 wJiwgrMs0.net
関数解析はやれよ

399:デフォルトの名無しさん
18/12/13 23:33:41.33 WB8yGuZL0.net
みんな使ってるPCのスペックってどんなもん?
ボーナス入ったし買い換えようかと
今はi5、SSD128GB、メモリ8Gの学生用みたいなスペック

400:デフォルトの名無しさん
18/12/13 23:41:00.57 wJiwgrMs0.net
ちょっと訂正だな。
確率論は要らない。

401:デフォルトの名無しさん
18/12/13 23:57:53.09 wJiwgrMs0.net
>>387
法人向けはずっと上のものがある
dellのprecision tower7000シリーズとか
corei9がショボく感じる

402:デフォルトの名無しさん
18/12/14 07:17:53.41 qmqujhnB0.net
>>384
だな
野球やるのに、バットを作り方を知る必要はない

403:デフォルトの名無しさん
18/12/14 08:44:54.09 AyKfPDxXp.net
ルベーグ分かってるけど機械学習には要らんなってことなのか、ルベーグ分からんけど機械学習で特に困ってないってことなのか

404:デフォルトの名無しさん
18/12/14 09:01:46.14 ngdg7HQOd.net
完備な距離空間作るために測度論が必要ってとこだけ理解できればもう要らない。同様の理由で確率論も要らない。
あと入りそうなのは確率微分方程式とかるまんふぃるたぐらいか。まあ、後者はリースの表現定理を理解できれば十分。

405:デフォルトの名無しさん
18/12/14 09:39:39.92 XZPx4rIA0.net
カルマンフィルターを知ってる俺って偉い、というところまで読んだ

406:デフォルトの名無しさん
18/12/14 09:41:22.54 ngdg7HQOd.net
リースの表現定理は使いこなせるようになることをお勧めします

407:デフォルトの名無しさん
18/12/14 10:08:11.53 ngdg7HQOd.net
>>393
横から訂正するよん
こんなことを知ってる毎月残業60hのエンジニアサラリーマンの俺ってば凄い

408:デフォルトの名無しさん
18/12/14 10:10:27.43 XZPx4rIA0.net
すべてが中途半端(笑)、お後がよろしいようで

409:デフォルトの名無しさん
18/12/14 12:12:47.64 z+6X6PDpa.net
本当の一流なら例えば料理人だとラーメン作るのに小麦畑の土から拘るからな
単に腹を満たすためならそんなの不要だが本気でトップ狙うならそこまで考える必要がある

410:デフォルトの名無しさん
18/12/14 13:35:21.72 n8Z9luJQ0.net
本当の一流は革新的で広く使われるモデルを提案できる人

411:デフォルトの名無しさん
18/12/14 14:09:36.56 8MJ1DzS2r.net
そりゃイノベーターですな
そこ望むなら最低でも原理ぐらいは理解してないとだめやろね

412:
18/12/14 20:10:48.33 +oZBuxlP0.net
そんな難しい話は私には縁がありません
ひたすらお願いすることといえば、やさしい解析学ともっとやさしい線形代数の教科書を教えてほしい、ということです、ちなみに佐武で撃沈しています…

413:デフォルトの名無しさん
18/12/14 20:12:23.40 jIFiJs/Q0.net
結果がでるかどうかの話だよ

414:デフォルトの名無しさん
18/12/14 20:44:44.10 1YSfQivD0.net
カルマンフィルタとか必須な分野もあるから、統計学・数学必須かどうかは関わってる仕事による

415:デフォルトの名無しさん
18/12/14 20:48:59.46 1URj9FBk0.net
専門は更に違う

416:デフォルトの名無しさん
18/12/14 20:59:12.32 ECSleeaa0.net
日本のゴミのようなITの慣例に従うと、
AIエンジニアでさえ、統計も幾何学もマスターした40代のおっさんより、
専門学校でPython習っただけの20代の方が引き合いが多い。
人売りは必要なスキルなんて把握してないし

417:デフォルトの名無しさん
18/12/14 21:05:07.90 2YtJa6Bca.net
そもそも派遣やSESで安く済ませようというような環境下で機械学習エンジニアを目指すこと自体が誤り

418:デフォルトの名無しさん
18/12/14 21:41:09.89 1URj9FBk0.net
>>404
第一種電気主任には勝てません

419:デフォルトの名無しさん
18/12/15 01:05:19.81 RlxxIme+0.net
>>400
マセマ線形代数

420:デフォルトの名無しさん
18/12/15 09:27:28.68 1gpj6lBJd.net
文系でもいきなりわかる行列・ベクトル入門

421:デフォルトの名無しさん
18/12/15 10:06:27.30 JSs/SULz0.net
前処理で新しい特徴量作ったり、カテゴリ変数を数値に変換したりするじゃないですか
でそれを使ってモデルを構築するわけなんですけどこれなんで成立するんでしょうか
だってそれに対して入ってくるデータはモデル作成に使った特徴量は持ってないですよね
モデル作成って例えばa,b,cって3種類の特徴量があるデータとしたら
f(a,b,c)をコンピュータが内部で作ってくれて、だからそこに対象のa,b,cを持つデータを入れたら答えが返ってくる……みたいなイメージだったんですけど違うんでしょうか

422:デフォルトの名無しさん
18/12/15 10:46:54.10 VeEKAI4iM.net
>>386
職場は自称データサイエンティストが
大勢いて、みなさん統計学に自信満々の
理系ばかりなんですけど、
実は全く分かってない人ばかりです。
あなたは分かってる?
統計学の論文は何本ぐらい書いてますか?
ま、客も分かってないから
いいんですけどね。

423:デフォルトの名無しさん
18/12/15 10:52:28.95 xkVRNWRz0.net
統計検定でいいんでゅわ

424:デフォルトの名無しさん
18/12/15 11:30:35.29 kyezZXERa.net
統計学の研究者になるわけでもないのに統計学の論文書く必要などない
赤青緑本が理解できていれば後は必要に応じて学べばOK

425:デフォルトの名無しさん
18/12/15 12:27:01.90 xkVRNWRz0.net
410は文系ってことだ

426:デフォルトの名無しさん
18/12/15 13:12:41.57 eVBSbVQr0.net
機械学習に数学はいらない

427:デフォルトの名無しさん
18/12/15 14:20:12.17 f2LfaFj60.net
>>410
0本です
本職は機械屋さんです

428:デフォルトの名無しさん
18/12/15 14:25:31.33 f2LfaFj60.net
データさいえんてぃすとってなに?

429:デフォルトの名無しさん
18/12/15 14:25:47.32 f2LfaFj60.net
何ができるひと?

430:デフォルトの名無しさん
18/12/15 15:20:47.62 NVB+bBb/0.net
ggrks

431:デフォルトの名無しさん
18/12/15 15:36:11.12 f2LfaFj60.net
>>409
前提となる条件がよくわからないが
>>なんで成立するか
a,b,cそれぞれの間に相関が無いベクトルに変換したからです。
相関が無いと判断される手法によって結果は異なる。
例えばPCAであればa,b,cの相関係数が最小になるように特徴量が分解される。
>>入ってくるデータは作成に使った特徴量を持ってない。
⇒???
言ってることがよくわかりませんが、前処理にて得られたベクトルに一度変換してください。

432:デフォルトの名無しさん
18/12/15 15:56:42.77 f2LfaFj60.net
>>409の後半
>>f(a,b,c)を内部でコンピュータが作ってくれて~~a,b,cを持つデータを入れたら答えが返ってくる
⇒その認識で合ってます。
任意のA,B,C,D,E,F,‥‥ってデータ(ベクトル)があったとき、a,b,cに変換する関数を作成するのが前処理と考えたらよい

433:デフォルトの名無しさん
18/12/15 16:16:03.44 f2LfaFj60.net
>>418
なるほど‥最近
『データさいえんてぃすと』になるためのビジネス講座が流行ってるのですね。
受講による費用対効果は知らんけど。

434:デフォルトの名無しさん
18/12/15 16:38:18.36 +IDB+5iI0.net
>>421
答えになっていないぞ、検索もできないのか
データさいえんてぃすとってなに?
何ができるひと?

435:デフォルトの名無しさん
18/12/15 16:39:50.66 f2LfaFj60.net
>>421
対したこと出来ない人ってことはわかりました

436:デフォルトの名無しさん
18/12/15 23:22:01.13 f2LfaFj60.net
あと線形代数について、大学の一般教養より進んだところまでの学習をお勧めします。
特異値分解、ぺロンフロベニウス根などですね。
Google行列の話など面白く、なかなか応用性があることに気づくと思います。

437:デフォルトの名無しさん
18/12/16 10:11:11.58 PlxjIYkX0.net
最初から対したことない奴だと思っていました

438:デフォルトの名無しさん
18/12/16 14:00:15.57 WrKErRgG0.net
たいしたことできないってことがわかる機械学習

439:デフォルトの名無しさん
18/12/16 14:20:05.34 WG5rS8yz0.net
対したことない人に負けないようレベルアップしてくださいな

440:デフォルトの名無しさん
18/12/16 15:03:43.09 CelBVMApM.net
もう15年ほどデータ分析してますけど、
統計学や情報工学の知識が必要になった
ことはわずかです。
しかも基礎的な知識のみ。
客が理解できないことはできませんので。
専門家が増えて、分析の発注者側となってから、
専門的な知識が要求されるようになると思います。
それは20年先でしょうね。

441:デフォルトの名無しさん
18/12/16 15:08:38.20 Q57qqdXG0.net
データアナリシスとかいっても
仕事のほとんどはデータ抽出加工ドカタだからな
DA()w

442:デフォルトの名無しさん
18/12/16 15:10:33.11 WG5rS8yz0.net
>>427
私は立場的にお客さん側の人間なのですが‥

443:デフォルトの名無しさん
18/12/16 15:11:30.14 WG5rS8yz0.net
失礼。またずれた。
>>428
私は立場的にお客さん側の人間なのですが‥

444:デフォルトの名無しさん
18/12/16 15:47:39.48 SBaKPnMMa.net
自分が低レベルの仕事しか任されていないだけなのを自ら晒して恥ずかしくないのかな

445:デフォルトの名無しさん
18/12/16 15:59:13.38 Q57qqdXG0.net
市場調査のヤツラとは関わったことがある
そいつらだったら大体どんなヤツラかは分かる
結構狭い業界だからな
そいつらはドカタからみれば客かもしれんが
その先にまた別の客がいる
その別の客をどこがもってるかだからな
当然ココで業界内での力関係の差はっきりみえる
超格差業界

446:デフォルトの名無しさん
18/12/16 20:55:55.59 LisZ4hwI0.net
まだ若い学生プログラマーには
学生のうちに知識と創造力の拡充をお願いしたいですね。
物事は簡単であるべきだが、簡単過ぎてはならない。

447:デフォルトの名無しさん
18/12/16 21:02:53.02 vXltm68N0.net
その代わり給料と地位をお願いします

448:デフォルトの名無しさん
18/12/16 21:20:00.16 34+0Dbi20.net
外資並みによろしく

449:デフォルトの名無しさん
18/12/16 21:54:55.87 GgN1VImqa.net
それなら結果出せなければ最低賃金レベルしか出ないけどな

450:デフォルトの名無しさん
18/12/16 22:09:11.00 hH1Y5jeg0.net
外資の知り合い居るけど最低賃金なやつ聞いたことない。みな並以上

451:デフォルトの名無しさん
18/12/16 22:10:18.61 hH1Y5jeg0.net
と日系の社長が申しております。
って返す方が気が利いてた。スマン

452:デフォルトの名無しさん
18/12/16 23:05:59.57 LisZ4hwI0.net
ずっと平凡であるか、価値のある人間を目指すかの違いと思います。

453:デフォルトの名無しさん
18/12/17 00:34:07.50 ViMAqh+Fa.net
わ�


454:エわざ賃金水準教えてくれる時点で世間相場と比べてある程度自信ある人であるという偏ったデータしか計測できていないんだよな



455:デフォルトの名無しさん
18/12/17 06:31:38.20 AqvOLsEL0.net
>>412
>赤青緑本が理解できていれば後は必要に応じて学べばOK
赤?
URLリンク(www.oreilly.co.jp)
青?
URLリンク(images-na.ssl-images-amazon.com)
緑は?

456:デフォルトの名無しさん
18/12/17 06:47:25.76 K5iKzo1Q0.net
赤青緑本、
こういう言い方きらい

457:デフォルトの名無しさん
18/12/17 07:26:10.21 hmSZUCi50.net
そんな呼び方が出来てたのかw
チャートみたいな存在になってんだな

458:デフォルトの名無しさん
18/12/17 09:37:24.71 qI5W00f5M.net
像本とかラクダ本も読まな

459:デフォルトの名無しさん
18/12/17 09:52:02.87 qI5W00f5M.net
赤は➁もあるでよ

460:デフォルトの名無しさん
18/12/17 10:33:03.86 Jx08wdAG0.net
行政機関はExcel形式での統計情報の配布をやめてほしいなあ。
XML形式かCSV形式で一般公開してほしい。

461:デフォルトの名無しさん
18/12/17 10:41:14.66 5wCelRBnH.net
初心者でkaggle始めたばっかなんだけどさ
機械学習始める前のイメージだと生のデータをとにかく突っ込めば後は機械が判断してくれると思ってた
でも生のデータの欠損埋めたり、関係性を調べて新しい特徴量作ったり、なんか泥臭くない?
人力の部分が多いんだなってちょっと萎えてきてる。もっと何かすごい技術なイメージだったのに

462:デフォルトの名無しさん
18/12/17 10:50:05.23 2PsaUU1ba.net
>>448
no free lunch定理という、どんなデータでもうまくいく万能のアルゴリズムは無いという定理がある
だからそういうデータに特化した処理や、特性に合ったアルゴリズムの選定といった泥臭い事をしないと精度が出せないのは仕方がない

463:デフォルトの名無しさん
18/12/17 10:51:21.54 w+CCuEs80.net
>>442
統計の赤・青本かと思った
URLリンク(tjo.hatenablog.com)
緑は分からん

464:デフォルトの名無しさん
18/12/17 10:56:10.19 qI5W00f5M.net
泥臭いことをやる万能AIを泥臭く一回作るんや

465:デフォルトの名無しさん
18/12/17 11:17:19.60 dHWhre3aH.net
POMDPってなんて読むの?
ポンディーピー?

466:デフォルトの名無しさん
18/12/17 11:55:47.72 85V8tM2Yd.net
ディープラーニングや機械学習の数学って
中学生レベルでは無理?

467:デフォルトの名無しさん
18/12/17 11:59:23.77 DntVs6XQa.net
>>424
長谷川浩司先生の「線形代数」に載っている。

468:デフォルトの名無しさん
18/12/17 11:59:26.03 d/krKCoDM.net
そもそも、最近の中学生は統計学も幾何学もしないんでしょ?

469:デフォルトの名無しさん
18/12/17 12:02:57.12 jkPJsDhgM.net
微積やんなよ

470:デフォルトの名無しさん
18/12/17 12:18:19.23 n3iny2IT0.net
>>453
別に大丈夫
微分積分と言っても結局はモデル構築が主なので、
そこまで深く知らなくてもよい
最小二乗法とかも言葉の意味知ってれば大体理解できる。後は関数に放り込むだけだし

471:デフォルトの名無しさん
18/12/17 12:19:08.02 H6jXePT1a.net
>>450
緑=人文・社会科学の統計学 (基礎統計学)
URLリンク(www.amazon.co.jp)

472:デフォルトの名無しさん
18/12/17 12:26:23.19 DntVs6XQa.net
>>456
線形の方が微積より必要。マセマ でもやれ。

473:デフォルトの名無しさん
18/12/17 12:29:27.44 jkPJsDhgM.net
せやな

474:デフォルトの名無しさん
18/12/17 12:44:39.16 hc1NFolx0.net
機械学習に数学はいらない

475:デフォルトの名無しさん
18/12/17 12:55:59.01 TXQpWudsd.net
>>442
この路線なら久保先生の本じゃね?

476:デフォルトの名無しさん
18/12/17 14:35:16.79 oMwl1qsb0.net
>>458 なる



478:デフォルトの名無しさん
18/12/17 17:43:44.98 +K5AHMUC0.net
要らない派からマセマ派、ルベグまでやれ派と入り乱れてますな

479:デフォルトの名無しさん
18/12/17 19:02:53.31 n7hAu6UxM.net
仕事でデータ分析するには
数学は、ほぼ必要ないね。
理論的なこと聞かれたのって2、3回しかないし。
ただ、その2、3回聞かれたときに
ビシッと答えたからずっと高い報酬貰えてるんだと思います。

480:デフォルトの名無しさん
18/12/17 19:07:51.30 jkPJsDhgM.net
詐欺師めw

481:デフォルトの名無しさん
18/12/17 20:48:03.14 S6eGuv5Sa.net
>>464
たしかに、利用する対象や場面によって、
その重要性は変化するから
一概にどちらといえないでしょうね。

482:デフォルトの名無しさん
18/12/18 12:12:42.85 yMWs9D+/p.net
>>447
excelからCSVやXMLに変換するのなんて簡単にできる事じゃね?
受け取る側は色んな人がいるんだからその中で多くの人が慣れ親しんでいる形式を採用するのは判る

483:デフォルトの名無しさん
18/12/18 12:30:35.86 drKI9kyXM.net
Excelはねえ。見た目優先で作ってセル結合やらされると、行によってカラムがズレたりして自動化出来なくなるのが問題なのよ

484:デフォルトの名無しさん
18/12/18 12:33:21.09 drKI9kyXM.net
Excelを一旦画像にしてAIで処理させた方がいいかもね?

485:デフォルトの名無しさん
18/12/18 13:30:36.51 gd3MIM5DH.net
初歩的な質問で申し訳ないんだけどディープラーニングの活性化関数って何のためにあるの?
階段関数は分かる。0か1の2択にしたいんだなって
でもシグモイドやrelu(の0以降)は連続値じゃないですか。なら入ってくる値をそのまま使っても何も問題ないんじゃないか
わざわざ関数に突っ込む意味あるんだろうかって思うんですよ

486:デフォルトの名無しさん
18/12/18 13:58:19.11 FHpOcoYR0.net
非線形関数に代入しないと線形変換しかできない。
行列の積と和を繰り返しても連立一次方程式にしかならんのだよ

487:デフォルトの名無しさん
18/12/18 16:51:18.50 yMWs9D+/p.net
>>471
階段関数は微分できなくね?

488:デフォルトの名無しさん
18/12/18 18:11:56.54 gd3MIM5DH.net
>>472-473
お二方の言ってることが全く理解できないので自分にはまだ早いことは理解できた
前のノードの値×重みを足し合わせたものを次のノードに送るくらいの認識しかないので線形だの連立方程式だの微分だの何が関係あるのだろうレベル

489:デフォルトの名無しさん
18/12/18 20:35:01.16 O5jE7AS20.net
>>472
>行列の積と和を繰り返しても‥
んなこたーない

490:デフォルトの名無しさん
18/12/18 22:33:21.28 O5jE7AS20.net
あまり本を鵜呑みにしないように‥

491:デフォルトの名無しさん
18/12/19 00:11:12.23 R79UPiko0.net
このへんが簡易な本を嫌うべき理由ですね。
簡便な例でもって納得した気になってしまう。

492:デフォルトの名無しさん
18/12/19 05:06:16.83 wdzWFhPYM.net
>>457 たとえば理論では絶対値たが、計算量を少なくするために二乗に換算すればいいとか、
私が知る範囲の機械学習では見ないけど、たとえば微分方程式を使うなら可能な限り級数展開で近似してから解く、とかじゃない?
機械学習の理論は東大、京大生に任せておくとし、私のようなヴァカは理論に突っ込んで課題をクリアするために、数学よりc++だな。pythonのほうがライブラリあって良さそうだが、産業用途では使えんからなあ。

493:デフォルトの名無しさん
18/12/19 05:13:01.29 wdzWFhPYM.net
高専のとき選択でニューラルネットワークがあってなんに使うんやと寝てたけど、いま普通にデータ突っ込んでるな。
いまいち検出器の選定がわかん


494:ないんだよな。入力データのバラツキとかの性質と、検出器の数学的性質を結びつけれる脳みそがあれば、どういう前処理をすべきかわかるし、捗るんだろな



495:デフォルトの名無しさん
18/12/19 09:33:59.69 jzYXTi8Ia.net
pythonだと産業用途で使えないという理由が分からないけど学習結果の利用という意味なら例えばtensorflowは言語依存のない形式で学習済みモデルを保存できる
というか機械学習フレームワークで検索上位に出るようなものならほとんどは言語依存ないフォーマットで出せるはず

496:デフォルトの名無しさん
18/12/19 15:02:50.58 XaHr9AnuM.net
〉〉480
たぶん研究段階ではpythonでいいけど、製品レベルに実装する場合は、
pythonではなくc等が主流だから、「製品開発者等では」ってことを
言っているんじゃない?

497:デフォルトの名無しさん
18/12/19 15:38:11.72 Ms5INDSEM.net
モデルと実データをライブラリに食わせるCコード書くだけでいいのちゃう

498:デフォルトの名無しさん
18/12/19 17:24:57.84 Q8dTxw3N0.net
pythonのコード隠蔽したいのかな。
pythonを暗号化してテキストでもっておき、C++のプログラム内でメモリ上に復号、python本体に送ってキックするってことはできるよ。
メモリを覗かれてしまったらアウトだけどね。
pythonを完全に隠蔽したいならクラウドじゃないとできないな。

499:デフォルトの名無しさん
18/12/19 17:40:50.77 R/AQ8eSIp.net
>>481
製品って具体的にどんなものかによる
組込的なものだとそうかもしれないけど
サービス的なものだと関係ない

500:デフォルトの名無しさん
18/12/19 17:51:42.99 q2I72u2nM.net
基礎はやりたいフィールドのテッペンを概観でるレベルで十分
そこで大きな壁が何枚もある事を把握してから必要な基礎を潰していく
いつまでも基礎基礎いっててなかなか前に進まないのが日本教育のだめなとこだな
みんな染み付きすぎて疑問にもおもってない

501:デフォルトの名無しさん
18/12/19 17:56:47.59 Ms5INDSEM.net
テッペン見てから必要なだけ降りたらええちゅうことね

502:デフォルトの名無しさん
18/12/19 19:38:11.41 R79UPiko0.net
>>485
やりたいフィールドに限定すると、他分野の視点から見えるものも見えなくなる

503:デフォルトの名無しさん
18/12/20 00:43:50.31 0XNWkq3y0.net
基礎をおっかけるレベルでそれはねえ

504:デフォルトの名無しさん
18/12/20 09:56:46.33 zvkF6ECRM.net
AIを使いたいんじゃない。
茄子の仕分けがしたいのだ。みたいな

505:デフォルトの名無しさん
18/12/20 16:02:48.40 QKOzYWM00.net
夢無い記事
URLリンク(tech.nikkeibp.co.jp)
日本で5人の実力を持ってても、名刺OCRしか活躍の場が無い。
(分析出来るデータが国内企業に無いし)

506:デフォルトの名無しさん
18/12/20 17:28:29.50 t8x/0UH10.net
おもろい

507:デフォルトの名無しさん
18/12/20 17:57:27.11 pvKHw8OKH.net
URLリンク(monoist.atmarkit.co.jp)
なんじゃこりゃw

508:デフォルトの名無しさん
18/12/20 18:09:43.22 BNnLdzd/a.net
URLリンク(paiza.hatenablog.com)【1位はGo言語】機械学習人気でPython・R言語も上位に!

509:デフォルトの名無しさん
18/12/20 19:10:08.34 y/0AbOWxM.net
>>483 そこまでする人は最初からCで書くだろう。

510:デフォルトの名無しさん
18/12/20 20:26:07.75 1ZGu8YZza.net
>>490
名刺の会社にGrandmasterが2人もいるの不思議だよな
GAFAとかヤフーとかメルカリに行けばいいのにと思うけど、開発環境が魅力的なのかな

511:デフォルトの名無しさん
18/12/20 20:37:23.22 m4Vq6pGD0.net
>日本人の名刺なら「98%の精度で�


512:﨑ハを判定できる」 う~~~~ん



513:デフォルトの名無しさん
18/12/20 21:55:38.26 1IWPdvcn0.net
メルカリ・・・

514:デフォルトの名無しさん
18/12/20 22:03:38.17 jyk8KY1l0.net
>>492
> 2020~2021年ごろをめどに実用化を目指す。
はいはい

515:デフォルトの名無しさん
18/12/20 22:19:39.52 zmoosF6L0.net
>>490
この人なんで名刺に拘るんかな
他業種でも引く手あまたやないの

516:デフォルトの名無しさん
18/12/20 22:41:01.49 m4Vq6pGD0.net
>>499
給料良かったか、社風が合ってたんじゃないかな
勤務時間に勉強出来るとかじゃないとすぐに陳腐化してしまう

517:デフォルトの名無しさん
18/12/20 23:08:54.62 1IWPdvcn0.net
転職はIT系の中でさえあんまり遠くに行けないんだよ

518:デフォルトの名無しさん
18/12/20 23:15:30.51 1ZGu8YZza.net
kagglerはGrandmasterになると目標がなくなって弱くなる説ある

519:デフォルトの名無しさん
18/12/21 15:13:58.46 e1hlpNlkd.net
ディープラーニングで、ロト6等の数字選択式宝くじの予想をやる場合
過去の全ての当選数字のデータを
多分、教師なし学習をさせて
AIが自動で特徴を見つけて、次回の当選数字を予測させることをやりたいのですが
どんなアルゴリズムが最適なのでしょうか?
画像認識の場合はCNNですが、次回の当選数字の予測は?
よろしくお願いします。

520:デフォルトの名無しさん
18/12/21 15:29:25.68 l+qby1fs0.net
誰がお前の金儲けの為に唯で教えてやるの?

521:デフォルトの名無しさん
18/12/21 16:11:56.79 rlKfPByqd.net
こんなところで聞かなくてもググればLSTM使って予測してるの出てくるだろ

522:デフォルトの名無しさん
18/12/21 16:37:41.59 25HIctKAd.net
毎年の当たりくじ番号なんて互いに相関が無く、独立な事象過ぎてやるだけ無駄と思われる。それでもやる?

523:デフォルトの名無しさん
18/12/21 18:03:46.75 vBAMI/Fmd.net
マジレスするとrand()が最強
DNNと同等の精度が出る

524:デフォルトの名無しさん
18/12/21 19:24:26.23 y6GICHw5M.net
>>507
それな。
だが、本当に乱数なのかな?
乱数の検定が圧倒的に否定されたので、
誰かが当たり番号を操作してると思う。

525:デフォルトの名無しさん
18/12/21 19:35:05.93 NPvPpeG0M.net
ロトの乱数生成の手法調べたらいいのか
意外と運用適当だったりしそう

526:デフォルトの名無しさん
18/12/21 19:37:05.65 j1TAG+KNa.net
コインを投げろ

527:デフォルトの名無しさん
18/12/21 19:39:49.12 2OY83J+s0.net
サイコロを振れ

528:デフォルトの名無しさん
18/12/21 19:46:49.63 NPvPpeG0M.net
的を射よ

529:デフォルトの名無しさん
18/12/21 20:17:21.65 OZj4m0Cba.net
乱数生成が多少適当だったとしてもあからさまに偏ってるわけじゃないんだから儲け出すにはかなりの大金注ぎ込む必要があるだろうな

530:デフォルトの名無しさん
18/12/21 21:54:08.02 F/bqqAJb0.net
めるせんぬついすた

531:デフォルトの名無しさん
18/12/21 23:43:05.46 GxPHf02D0.net
乱数はパチ台チェックしたりで意外と扱い馴れてる可能性も

532:デフォルトの名無しさん
18/12/22 00:17:02.80 b6CiPLFa0.net
MT使うほどのことない
Xorshiftで十分
LCGsはウンコすぎてダメ

533:デフォルトの名無しさん
18/12/22 00:20:27.91 +oRc8mMV0.net
XBoxというゲーム機で出たカルドセプトというゲームがあってのう
疑似乱数の質が低すぎて専門学校生が作ってるんじゃないかと疑われたんじゃ

534:デフォルトの名無しさん
18/12/22 13:37:04.48 LRefV07O0.net
>>503
番号決めるのがサイコロ振ったりしてアナログな方法だったら
効果がないのでは?
コンピュータでやってるならチャンスあるかも

535:デフォルトの名無しさん
18/12/22 14:07:01.79 uNMjVS+90.net
的がぐるぐるまわっていてそこに矢を射る機械を複数並べて決める

536:デフォルトの名無しさん
18/12/22 14:19:23.79 m2vEGMHm0.net
つまり各桁無相関ですね。

537:デフォルトの名無しさん
18/12/22 14:20:11.61 6IjrjQDGa.net
ロト7はこんな機械で決めてるらしい
URLリンク(youtu.be)

538:デフォルトの名無しさん
18/12/22 15:32:27.47 nkaFCGe40.net
昔ロト3でなんとなならないか試行錯誤したなw
なんともならなかったけど。

539:デフォルトの名無しさん
18/12/22 15:40:11.13 6l606PfA0.net
123
431
137
だと「1」はジグザグに出やすく、
「3」はなだらかなカーブを描いて出現する、みたいな攻略(笑)方法があって
これを勉強する時間でバイトでもした方が良いな、と子供心に思ったものです

540:デフォルトの名無しさん
18/12/22 15:47:20.29 6ewcgBao0.net
抽選機は電動攪拌式遠心力型抽せん機(愛称:夢ロトくん)

541:デフォルトの名無しさん
18/12/22 16:04:24.04 3dnqkl28M.net
ここまでベルヌーイ施行というキーワードすらでない

542:デフォルトの名無しさん
18/12/22 16:08:18.85 2yl5Ts6Jr.net
わざわざ名前出す程複雑な事象じゃないやろ

543:デフォルトの名無しさん
18/12/22 16:20:58.77 6l606PfA0.net
>>525
この流れギャグだと思ってたんだけどまさか真面目に考えてたの

544:デフォルトの名無しさん
18/12/22 16:24:41.65 iZWJkg8TF.net
釣れますか?

545:デフォルトの名無しさん
18/12/22 16:27:19.80 UGqq2IDwa.net
マルクス経済学の学者の世界では
Aという現象が出て戦争が起きた
よってAが出ると戦争がが起こる
だから、Aを出すことを阻害しよう
という単純な考えが通用するみたい
それで博士等取れる確率が高いようなので
チャレンジしてみたらどうでしょう。
確率が念頭にないのに、博士号の確率は念頭にある
面白い世界です。

546:デフォルトの名無しさん
18/12/22 16:34:17.76 6l606PfA0.net
相関関係と因果関係をしっかりとわけないといけないのだ

547:
18/12/22 16:42:59.61 vmp1HvU+0.net
>>507
MTじゃダメなんですか?

548:デフォルトの名無しさん
18/12/22 17:36:26.63 UGqq2IDwa.net
>>530
確率考えてないから因果にもならない
想定するのは、単にそういうことがあったというだけ

549:デフォルトの名無しさん
18/12/22 22:23:41.20 WYzIfn2B0.net
帰納法のプログラムの世界では起こりえないだけど、
因果関係と相関関係の混同は世に溢れている

550:デフォルトの名無しさん
18/12/23 00:02:52.98 9403HeVX0.net
アホな経験則がまかり通っているだけ

551:デフォルトの名無しさん
18/12/23 03:10:51.94 u8o0/RKX0.net
しかし、おまえらアフォだな
因果関係だと?
笑えるw

552:デフォルトの名無しさん
18/12/23 09:38:54.52 yKwr45+Fa.net
因果応報

553:デフォルトの名無しさん
18/12/23 09:40:34.21 E3mTjHLn0.net
親の因果が子に報い

554:
18/12/23 11:39:39.64 6PHCJ2OS0.net
>>530
>相関関係と因果関係をしっかりとわけないといけないのだ
そして次のことも理解しておくことですね
「因果関係の認定は主観的判断であり独断や偏見と何一つ変わらないこと」

555:デフォルトの名無しさん
18/12/23 13:41:04.67 fn6gFrmZ0.net
親の資産を相続したQZが一言

556:デフォルトの名無しさん
18/12/23 14:37:30.80 lx3OhfOu0.net
>>538
>>534でよくね

557:デフォルトの名無しさん
18/12/23 17:14:58.35 q486kEO1a.net
因果関係を証明したければ実験すればいいだけのこと
原因だと推測したものを動かして予想通りに結果が変わればok

558:
18/12/23 17:20:18.77 6PHCJ2OS0.net
>>541
相関関係を持つものについても、片方を動かせばもう片方も予想通りに動くのでは?
>>541 の方法では相関関係と因果関係を見分けられないのでは?

559:デフォルトの名無しさん
18/12/23 17:53:54.43 q486kEO1a.net
コンビニ店舗数と人口密度に�


560:ウの相関があったとする 何もない山奥に強制的に大量の人間を住ませればその人口密度に応じてコンビニが入ってくるだろう しかし逆に誰もいない状態で山奥にコンビニ建てまくったとしてもコンビニ数に応じた人間が引っ越してくると考えるのは不自然だろう つまり上記が正しい場合、人口密度→コンビニの因果関係はあるが、コンビニ→人口密度の因果関係はない Aを変えればそれに応じてBが変わる時に因果関係があると言い、必ずしも逆が成り立つとは限らない



561:デフォルトの名無しさん
18/12/23 18:00:58.58 MBENqEE6M.net
実験できないようなことは
どうするんだ?

562:デフォルトの名無しさん
18/12/23 18:19:32.54 oZ5uabWQ0.net
プログラマの主張する実験(笑)

563:デフォルトの名無しさん
18/12/23 18:41:00.17 q486kEO1a.net
>>544
因果関係知りたいのは原因を操作することで結果変えたいからで、そもそも原因を操作できないものの因果関係を知っても使い道なく自己満足で終わり

564:
18/12/23 19:29:51.55 6PHCJ2OS0.net
>>543
>何もない山奥に強制的に大量の人間を住ませればその人口密度に応じてコンビニが入ってくるだろう
>しかし逆に誰もいない状態で山奥にコンビニ建てまくったとしてもコンビニ数に応じた人間が引っ越してくると考えるのは不自然だろう
それは「人口密度が最初に設定される」→「設定された人口密度に従ってコンビニ密度が決定される」
という因果律を先に読み手に想定させた上で話をしている、という意味で、先入観に囚われた推論でしかないのでは?
二つの数量的関係に相関があるかないかは統計処理を行えば客観的に判断できるのですが、因果関係は、我々の主観的判断=独断と偏見、が含まれているのです
独断と偏見、といういいかたはちょっと極端に偏っているかもしれませんね、因果関係、というものの見方そのものが、人間が進化していく上で獲得した思考の「癖」なのでは?

565:デフォルトの名無しさん
18/12/23 20:45:50.47 F+c0HMsCa.net
>>542
目的の値をコントロールしたい
それを達成できるなら
本当の原因じゃなくても許容範囲じゃね

566:
18/12/23 20:48:42.70 6PHCJ2OS0.net
>>548
なるほど
では因果律なるものは虚構であるのに、人はどうして因果律を設定して、例えば人を説得しようとする、とかするのでしょうか?

567:デフォルトの名無しさん
18/12/23 20:52:26.47 F+c0HMsCa.net
>>547
車のアクセル開度の値と速度の関係は?
時間的にアクセル→速度になっている
アクセル開度が原因で速度が結果じゃね
人間が車を押したら速度は上がるけどアクセル開度は変わらない
速度→アクセル開度の因果関係はない

568:デフォルトの名無しさん
18/12/23 20:53:33.88 F+c0HMsCa.net
>>549
虚構ってどんな定義?
因果律が虚構っていうのは本当?

569:デフォルトの名無しさん
18/12/23 21:23:34.18 4U3a3JXta.net
因果律は今の全ての科学の根底にある仮定なのにな

570:デフォルトの名無しさん
18/12/23 22:26:30.66 qkeRRc5P0.net
なんのスレだよ

571:
18/12/23 22:28:48.65 6PHCJ2OS0.net
>>551
因果律は「人が因果があると決めたもの」という意味で虚構あるいは集団幻想みたいなものかと
>>550
「アクセルを踏むと車の速度が増大する」という因果律を人が決めたのではないですか?
客観的な言い方を追求するのならば「アクセルの踏み込み度合いと車の速度とは r = 1 の相関関係があります」にとどまるべきで、それ以上のいいかたは、主観が混じっているのです、純粋性を追求すれば、そういう結論になるかと

572:
18/12/23 22:29:09.54 6PHCJ2OS0.net
>>552
そう、それはあくまでも仮定なんですよ

573:デフォルトの名無しさん
18/12/23 22:43:37.49 F+c0HMsCa.net
>>554
根底にあるのは自然科学の法則じゃね?
法則が複雑に影響しているけど

574:デフォルトの名無しさん
18/12/23 22:46:29.80 F+c0HMsCa.net
>>554
表現の方法は別でも可能だけど
法則自体は存在する
つまり因果関係と言っている
原因と結果の関係は存在する
あなたが言っているのは表現の方法が人間の決めた方法だ
と言っているだけ
表現の方法を変えても良いけど
他の人�


575:ニ知識を共有したり議論するのに不便



576:デフォルトの名無しさん
18/12/23 22:58:32.74 AV3blzZs0.net
まともにディープラーニングするならこの程度のマシンが必要って認識でいいか?
URLリンク(masagutti.hatenablog.com)

577:
18/12/23 23:12:54.72 6PHCJ2OS0.net
>>556
>>557
「自然法則」とはいいますが、実は確率的な表現しかできないことが現代では判明しているのでは?
ニュートン力学等は一見確定的、未来予言可能的だけれども、それはニュートン力学は近似でしかないためなのでは?
>>557
>法則自体は存在する
観測者によって変化するものを「存在する」といっていいのですか?

578:デフォルトの名無しさん
18/12/23 23:32:04.52 F+c0HMsCa.net
>>559
で結局言いたいことは何?
因果関係が人間の解釈だとして
その結果何か有益なことがあるの?
観測者によって確率的に結果が変わる→存在しない
とは言えない
存在の有無とは無関係じゃね?ら

579:数おたサラリー
18/12/24 02:08:21.64 Vm514pna0.net
>>559
>「自然法則」とはいいますが、実は確率的な表現しかできないことが現代では判明しているのでは?

初耳ですね。
何の記事ですかそれ?

580:数おたサラリー
18/12/24 02:19:05.05 Vm514pna0.net
会社でよく構造解析/磁界解析を行ってますが実物との精度はかなりよいです。
大学時代は多体原子シミュレーションの第一原理バンド計算やってましたが精度が悪いなんて思ったことないですね。
マクスウェル方程式やシュレディンガー方程式が自然界の法則から外れてるとは思えません。
自然界の法則ってこの流れでは何のことを指してますか?

581:デフォルトの名無しさん
18/12/24 05:00:33.06 PXgNVnUu0.net
>>559
それはニュートン力学が適用できるのはマクロな領域だけである(ミクロな領域では量子力学が必要になる)、という問題であって自然法則全般の問題ではないと思われ

582:デフォルトの名無しさん
18/12/24 06:03:38.20 c72moYwPM.net
お前らF検定とか使わんのだろうね
わかりきってる専門用語?
そうだよね!

583:デフォルトの名無しさん
18/12/24 10:34:24.33 mPPy9WoJa.net
量子力学使って確率的に扱わないといけないのは10^-34のオーダーのプランク定数が無視できない量を扱う時であって、
メートル単位やキログラム単位程度のスケールのもの扱って有意水準1%とか5%とかに設定しておきながら量子力学を気にしても誤差と区別できないので全く無意味

584:デフォルトの名無しさん
18/12/24 10:52:40.92 VHPkyyz+p.net
頭が良すぎるバカの典型
計算過程を楽にするために近似するなんてことはザラにある
近似が嫌いならロジスティック使わず全部ガウスでやれ

585:デフォルトの名無しさん
18/12/24 10:58:44.68 20D4sUdW0.net
そういうの頭が良すぎるって言わないしw
単に知識が扱いきれていないだけだな。

586:デフォルトの名無しさん
18/12/24 11:35:38.32 drIlhocoa.net
因果関係の話だったのに量子力学の話になってる

587:デフォルトの名無しさん
18/12/24 11:55:15.57 b32t5G/d0.net
それはクソコテのせい

588:デフォルトの名無しさん
18/12/24 12:12:43.91 XAsVN5+ma.net
元々の>>542での相関関係と因果関係の話に戻せば、>>543の通りに強い相関関係があるからといって
必ずしも一方を変えれば他方が変わるとは限らないことは事実というか自明なので議論の余地はない

589:デフォルトの名無しさん
18/12/24 14:03:28.28 yqP+nq0w0.net
QZ 糞コテ

590:デフォルトの名無しさん
18/12/24 15:48:01.24 ivcUrO890.net
梅毒患者数推移
URLリンク(idsc.tokyo-eiken.go.jp)
梅毒患者数♂ 40代♂急増(全年齢も著しい増加)
URLリンク(idsc.tokyo-eiken.go.jp)
梅毒患者数♀ 20~29代♀急増(その他ババァは微増)
URLリンク(idsc.tokyo-eiken.go.jp)

591:デフォルトの名無しさん
18/12/24 15:49:11.97 ivcUrO890.net
URLリンク(www0.nih.go.jp)
梅毒報告数
URLリンク(i.imgur.com)
梅毒報告数(人口10万人あたり)
URLリンク(i.imgur.com)
島根でセックスするのが一番安全

592:デフォルトの名無しさん
18/12/24 15:50:31.42 ivcUrO890.net
訪日外客数出典:JNTO
梅毒患者数出典:NIID
    訪日外客数 梅毒患者数
2006  7334077     112
2007  8346969     162
2008  8350835     205
2009  6789658     196
2010  8611175     173
2011  6218752     248
2012  8358105     297
2013  10363904     419
2014  13413467     507
2015  19737409    1044
URLリンク(i.imgur.com)
r=0.958533469

で、因果関係()があんのかどうか見分けてみろよ

593:デフォルトの名無しさん
18/12/24 16:18:26.06 VHPkyyz+p.net
>>574
これは良い例題!

594:デフォルトの名無しさん
18/12/24 16:20:04.59 dXeASBUE0.net
2変数しか出さないんじゃ相関以上のことは言えないね

595:デフォルトの名無しさん
18/12/24 16:46:47.84 KapOcmgsa.net
因果関係ってのは時間軸での変化なんだから、梅毒患者を増減させる施策を一切せずに強制的に訪日外客数増やして梅毒患者が増えるかの実験と、
訪日外客数を増減させる施策を一切せずに梅毒患者を強制的に増やしてから訪日外客数が増えるかの実験という時間軸情報を含む両実験をしなければ統計的には誰も何も言えない
ただし偏相関係数の絶対値を大きく低下させるような第三の因子を見つけられない限り、経験的には「訪日外客数増加→梅毒患者増加」の因果関係が自明なので
誰もそんな調査・実験には金を出さないだろうから経験的に得た因果関係が成立すると考えるしかない

596:デフォルトの名無しさん
18/12/24 17:13:40.72 TcWkN6pH0.net
レベル低い質問で申し訳ないんだがPythonで画像認識をしたいんだがネット上での画像収集ってどうやったらいいんだ?例えば、猿の画像が大量に欲しい時に猿ってうったら猿の画像データを大量に保存できるようなものってどうやったら作れるんだ?

597:デフォルトの名無しさん
18/12/24 17:18:20.96 yQsuKbe+0.net
>>572
女性より男性のほうが圧倒的に数が多いということは
女性のほうが男性よりもたくさん複数の異性と性交渉を行っているという結果ですね。

598:デフォルトの名無しさん
18/12/24 17:22:49.56 0lb6ayro0.net
>>578
Googleの画像検索APIを叩くのではダメか?

599:デフォルトの名無しさん
18/12/24 17:33:55.13 3tyLEAXA0.net
>>578>>580
URLリンク(qiita.com)
bingのAPIが良いっぽい
ちなみにスクレイピングすると即Banされる

600:デフォルトの名無しさん
18/12/24 17:34:41.08 dXeASBUE0.net
imagenetのデータセット使えよ

601:数おたサラリー
18/12/24 17:59:28.33 Vm514pna0.net
y=t*sin(t)にて
yとtの相関係数取っても相関係数が小さいのだが‥
これは相関ないと言ってよいかどうか(笑)

602:デフォルトの名無しさん
18/12/24 18:09:03.60 mPPy9WoJa.net
>>583
それはあくまで"ピアソンの"相関係数の話
ピアソンの相関係数は線形な関係を見出すために存在しておりそれは定義を見れば明らか
非線形なものを扱いたければ良さげな物を探すか新たに作るしかない

603:
18/12/24 18:21:28.85 WGmsKYkC0.net
>>577
>「訪日外客数増加→梅毒患者増加」の因果関係が自明
因果関係ではないですよ、あくまで相関関係だけですね、因果関係をいうのであれば、訪日客の増加が梅毒患者増加に直結する理由が必要です

604:
18/12/24 18:23:37.65 WGmsKYkC0.net
>>562
>マクスウェル方程式やシュレディンガー方程式が自然界の法則から外れてるとは思えません。
うらやましいですね、マックスウェル方程式の方は理解できますが、シュレーディンガーはさっぱり理解できないです…
>自然界の法則ってこの流れでは何のことを指してますか?
私はニュートン力学を念頭においていましたが他の方はどうでしょうか?

605:デフォルトの名無しさん
18/12/24 21:08:54.96 b32t5G/d0.net
そんなあなたに自己相関係数

606:デフォルトの名無しさん
18/12/24 21:44:39.21 mY3c/tl8a.net
>>585
訪日した人が梅毒に罹っていて
その人から感染した
という仮説は考えられる

607:デフォルトの名無しさん
18/12/24 21:54:43.53 VHPkyyz+p.net
>>588
因果関係を示すにはRCTとか、せめてRDデザインとか考えよう

608:デフォルトの名無しさん
18/12/24 21:57:29.62 ele7puQna.net
>>585
訪日客の増加が梅毒患者増加に直結する理由が欲しければ「訪日外客数増加→梅毒患者増加」の因果関係があると仮定してそのためのデータが得られる調査をすればいいだけだろ
>>574だけではこれ以上のことは言えないんだから因果関係が示したければ新たな調査をするしかない

609:デフォルトの名無しさん
18/12/24 22:06:44.25 mY3c/tl8a.net
>>589
それはこれから原因となる事象を操作して
効果を確認する事ができる場合には有効だろうけど
過去のデータとか
原因となる事象を操作するのが難しい場合には使えないんじゃね?
訪日客を選別するの?

610:デフォルトの名無しさん
18/12/24 22:38:17.40 VHPkyyz+p.net
>>591
そだねぇ、選別というのもありかな
自分がやるとしたら分解能あげて
県ごとの外国人の増減との比較かな

611:デフォルトの名無しさん
18/12/24 22:45:02.96 mY3c/tl8a.net
>>592
選別は政策上実現が難しいんじゃね
観光客を増やそうとしている
観光客は移動するけどな

612:デフォルトの名無しさん
18/12/25 12:22:32.72 R5cKkWDNd.net
G検定の公式テキストのアマゾンレビューひどいな。
これは詐欺に近いのでは?
このテキストだけでは合格できないよ。

613:デフォルトの名無しさん
18/12/25 12:57:35.57 yeWprDEr0.net
>>583
データの前処理としてarcsinをかますと良い結果になるよ

614:数おたサラリー
18/12/25 14:17:35.16 j18aEJCTd.net
都合のよいものにフィットするかどうかは始めはわからなくね?

615:デフォルトの名無しさん
18/12/25 14:32:26.30 g7xyWtlIa.net
データを確認する前から適切なフィット関数など分かるわけがない
直線フィットすべきなのか曲線なのか、曲線だとして高次多項式で表すとすれば何次が適当なのか、
そんなことは実際にプロットなどして可視化したり次数を変えてフィッティングした結果の汎化性能を比較したりしない限り分からない

616:デフォルトの名無しさん
18/12/25 16:25:57.86 1kCWzotZM.net
おパンツと一緒

617:デフォルトの名無しさん
18/12/25 17:48:28.07 np3XugG30.net
JDLA初の“公式”テキストで、ぜひG検定合格を目指してください!(目指すのは個人の自由)
試験を知り尽くした著者陣がディープラーニングの基本から解説。練習問題付きなので、試験勉強に最適です。(実際の試験に出題されるとは言っていない)
この1冊で試験対策ができる!(合格できるとは言っていない)

618:デフォルトの名無しさん
18/12/25 18:21:21.83 rTGYqtzl0.net
おブラと一緒

619:デフォルトの名無しさん
18/12/25 19:31:29.39 9cJ+8zKla.net
>>599
AIはG検定という試験があるんだ。
F検定の上を行っちゃうな。

620:数おたサラリー
18/12/25 20:18:53.57 F04LiveA0.net
まあ言いたいのは未知のデータから相関を語れないという話ね>>584>>595
サンプリングが等間隔でなかったりするとy=t*sin(t)ですらフィットは難しい
場合によっては無相関と断言するやつすらいる

621:デフォルトの名無しさん
18/12/25 20:21:19.76 NRydG5TYM.net
事前確率ボソ

622:デフォルトの名無しさん
18/12/25 21:34:01.58 C9xreq1F0.net
一番差分が少ないのが定数関数という悲しい事実

623:数おたサラリー
18/12/25 23:47:58.67 F04LiveA0.net
>>603
ん?
何のことを


624:言ってるのやら。 具体的に言うてみ?



625:数おたサラリー
18/12/26 00:22:37.05 vrpNaYHk0.net
>>587
相関関数は結構万能

626:デフォルトの名無しさん
18/12/26 00:45:12.92 OkeUn6N40.net
>>601
E検定「......」

627:デフォルトの名無しさん
18/12/26 11:56:19.18 OoT7NWgvH.net
こういうどうでもいい検定が出てくると
この業界も終わりかなーって思う
理事長 松尾 豊  東京大学大学院工学系研究科 特任准教授
理事 井﨑 武士  エヌビディア合同会社 エンタープライズ事業部長
江間 有沙  東京大学 政策ビジョン研究センター 特任講師
岡田 陽介  株式会社ABEJA 代表取締役CEO
岡谷 貴之  東北大学大学院 情報科学研究科 教授
尾形 哲也  早稲田大学基幹理工学部表現工学科 教授
川上 登福  株式会社IGPIビジネスアナリティクス&インテリジェンス 代表取締役CEO
草野 隆史  株式会社ブレインパッド 代表取締役会長
佐藤 聡   connectome.design株式会社 代表取締役社長
南野 充則  株式会社FiNC Technologies 代表取締役CTO
渡邉陽太郎  株式会社PKSHA Technology
ろくなメンバーいないじゃんw

628:デフォルトの名無しさん
18/12/26 12:41:06.57 SKc2oSlY0.net
因果関係を見つけるために、何かのデータと何かのデータを
用意しなきゃならないが、時間は無限にあるわけじゃないし
データも集められるわけじゃない(例えばすでに破棄した過去のデータは分からない)ので
結局今は人間が関係ありそうなデータ、もしくは集めることが可能なデータを
持ってきて因果関係があるか?を検証する作業になってしまってる
「因果関係を見つける」のではなくて「因果関係があるか?」の検証になってしまっている。
そして因果関係がありそうと人間が判断するものはやっぱり因果関係があるわけで
人間が計算式作ってやってもそこそこ精度は出る。
未知の因果関係を見つけるのには相当時間がかかる。
つまり何が言いたいかというと、機械学習でメリットが有るかどうかは運次第だし
データに因果関係があるとわかっていても、それを集めるのには時間(コスト)がかかるので
機械学習やってビジネス的に儲けがでるかはトレードオフの問題に落ち着く
当たり前だけど銀の弾丸じゃないんだよね。
数年後には、宇宙の中から新しい星を探すように「因果関係があるもの」を探す人たちと
判明した因果関係に関係があるデータを集める人・販売する人たちに分かれるだろう

629:デフォルトの名無しさん
18/12/26 14:13:38.56 0GgU1Jru0.net
G検定の資格とったらslack招待されるっての聞いたから
11月に取ったんだけどslack招待されない…
誰か入った人いる?

630:デフォルトの名無しさん
18/12/26 14:23:26.02 2brlvucld.net
>>608
現役で活躍してる人は忙しいから仕方ない

631:デフォルトの名無しさん
18/12/26 14:39:15.43 PJb7Mv/00.net
E検定って受験資格が教会認定の講座修了者で
ちょっと調べたらその講座が30万円とかなのな
インチキ臭え

632:デフォルトの名無しさん
18/12/26 15:08:06.25 NDOZg+/7a.net
>>609
機械学習の学習結果の妥当性証明に因果関係の証明が常に必要なわけではないぞ
よくある画像による製造品の不良判定なら因果関係なんて気にする必要ないし

633:デフォルトの名無しさん
18/12/26 16:53:49.40 SKc2oSlY0.net
>>613
それも製造品の形や重さが他と違っていたら不良ってこと


634:だろ? でも物によっては形や重さが違っていても不良とは限らない。例えば料理とか。 人間がこの製品は形や重さが違うなら不良と考えるから、 形データ(つまり画像)や重量を入力としてるわけで 結局それは人間が因果関係を判断して入力データとして与えてる 機械学習でどれくらい違っていれば不良とみなすかを機械で判定できると思うが 人間が○%と値を入力してもそれほど大きな違いは出ないだろう それに最初は人間が、これはOK、これはNGって判断する必要があるだろ? まあOK、NGと判断する作業は今も人間がやっているわけで、 機械学習のための追加のデータ取りのコストはかからないと思うが なんていうか、そんだけだよねーって感じなんだよ 新しいものを作るっていうよりか、単に精度を上げるための データ入力者になった感じで、面白みがない。 技術は完成されいて、あとは道具を使うだけ



635:デフォルトの名無しさん
18/12/26 17:36:56.28 ZpLOOFiwM.net
長いのでNG

636:デフォルトの名無しさん
18/12/26 17:43:13.93 1qe+8L32F.net
こういうのはAIには難しそう
URLリンク(twitter.com)
まだ東大の問題ωの方が解ける可能性あるわ
(deleted an unsolicited ad)

637:デフォルトの名無しさん
18/12/26 17:48:11.82 OPlBgdp40.net
>>616
迷路を解くアルゴリズムはとっくの昔にあるよ・・・

638:デフォルトの名無しさん
18/12/26 17:59:01.32 4yVGae5ar.net
最適化の対象としてうまく数式に落とし込むのはまだ人間の役目だよね

639:デフォルトの名無しさん
18/12/26 18:30:37.18 EeoGCGRR0.net
>>608
使えなさそうw
ろくでもないラインナップだなw

640:デフォルトの名無しさん
18/12/26 18:31:46.80 aOoIS3cHH.net
kaggleのタイタニックで勉強していざ他のもやってみようと思ったんだけど
カーネルでほかの人の見ないことには何も手が動かせない
どこに着目してどういう特徴量作ったらいい、どのパラメータでどんなestimatorを使えばいい
そういうのがまったく思い浮かばない
生データ渡されてまずどこから手を付けるみたいな方法論勉強する方法orいい参考書ないですか
こういう処理をするにはこういうコードとかそういう本はいくらでもあるんだけど

641:デフォルトの名無しさん
18/12/26 19:10:34.38 zlBAVDN8M.net
>>608
見事に馬鹿ばかりだな。
資格ビジネス狙いのクズ朝鮮人ばっかw

642:デフォルトの名無しさん
18/12/26 19:21:06.94 8+a035szp.net
>>614
別にあなたが面白いと思わなくても
役に立つならそれを使う人には価値がある
あなたはあなたが面白いと思うものをやれば良い
他のことがあなたにとって面白くなくても
あなたがやる事は変わりない
他にケチつけずに好きにすれば良い

643:デフォルトの名無しさん
18/12/26 19:24:45.31 Wyt7kWB4p.net
>>620
与えられた課題に対して解決方法が知りたいなら、キーワードはモデリングかな
ある程度考え方の基礎がないとモデリングは難しい
勉強方法としてはKaggleとかの方法をそのまま別の課題に適用して、自分の引き出しを増やすことから始める
ある程度こなせるようになって、それでもまだ足りないなら原理を学ぶ必要があるので、統計学や時系列分析、ベイズモデリングのような入門書を読む
高度な数学まで勉強する必要はないけど、自分の言葉で説明できるくらいまでは理解と経験が必要

644:数おたサラリー
18/12/26 19:32:09.33 vrpNaYHk0.net
汎用的なものがほしいですね

645:数おたサラリー
18/12/26 19:34:11.40 vrpNaYHk0.net
経験則なんて頼りたくないものです

646:デフォルトの名無しさん
18/12/26 19:57:53.25 7Jt9vuQx0.net
kaggleで言うなら、機械学習のアルゴリズムより典型的なアルゴリズムの方が面白い

647:デフォルトの名無しさん
18/12/26 20:08:49.00 pnyjyGEy0.net
ババアw

648:デフォルトの名無しさん
18/12/26 20:09:17.18 pnyjyGEy0.net
都中

649:デフォルトの名無しさん
18/12/26 20:13:26.23 7Jt9vuQx0.net
機械学習なんて正確性無いし、機会がやる必要ないよね

650:デフォルトの名無しさん
18/12/26 20:13:39.30 7Jt9vuQx0.net
コンピュータがやる必要ない

651:数おたサラリー
18/12/26 21:35:05.18 vrpNaYHk0.net
他人に説明しやすければ、メリットはデカイんだけどな

652:デフォルトの名無しさん
18/12/26 21:38:58.22 THkVMJ6O0.net
よし、それじゃあパウル君にやらせよう

653:デフォルトの名無しさん
18/12/26 22:20:05.30 npb9YBls0.net
>>622
役に立たないなんて言ってないよ。
ソートライブラリみたいなもんだなってこと
ソートしたいときにライブラリ使っておしまい
ソートそのものについて研究することはないなぁってこと

654:デフォルトの名無しさん
18/12/26 22:50:51.33 cRjPUG9L0.net
えっ

655:デフォルトの名無しさん
18/12/26 22:59:29.99 npb9YBls0.net
だってデータ集めて流せば終わりやし

656:デフォルトの名無しさん
18/12/26 23:24:32.11 0GgU1Jru0.net
資格商法っぽい気はしたがG検定取ったわ
松尾研究室有名だし、転職のときに使えそうだから

657:デフォルトの名無しさん
18/12/26 23:55:32.97 eK314zDk0.net
E資格もそうだけど、未経験者が意欲をアピールするのには使えるよ

658:デフォルトの名無しさん
18/12/27 00:24:45.59 Nnsyug5pM.net
E検定は内容としては演習問題も含めてコーセラのディープラーニングコースに似てるかな
どうしても日本語で勉強したい人くらいしか需要無さそう

659:デフォルトの名無しさん
18/12/27 00:51:11.66 FixG7szi0.net
機械学習とかつまんね
数学当たり前とか言ってるけど、他の情報科学だって必要だし、気取ってんじゃねえよ

660:デフォルトの名無しさん
18/12/27 03:42:08.33 QbB+qhLj0.net
NG検定

661:デフォルトの名無しさん
18/12/27 07:43:58.41 Vfu+cRgY0.net
Neural Ordinary Differential Equationsってどうよ?

662:デフォルトの名無しさん
18/12/27 08:18:08.21 DfJTLRgn0.net
>>623
参考になりました。とりあえず量をこなすところからですか
しかしまいったなー明日プレゼンなのにろくなもん出せそうにないな

663:デフォルトの名無しさん
18/12/27 08:42:27.41 dq01g3G80.net
>>642
参考書を忘れていました
月並みだけどPRMLは良い本ですのでKaggle等の課題と並行して読むのがよいと思います
日本語の訳本が出ていて「パターン認識と機械学習」という本です

664:デフォルトの名無しさん
18/12/27 09:36:37.47 X1PNXoe/M.net
エロ系のデータセットってある?
モザイク消しを深層学習で出来るか試してみたい。

665:デフォルトの名無しさん
18/12/27 14:18:15.80 77scK8dX0.net
>>644
さすがにないだろ……聞いたことない
海外から無修正画像をスクレイピングしてきて自分でモザイク修正してデータセット作るしか

666:デフォルトの名無しさん
18/12/27 15:30:31.87 xSnO512RM.net
まず、自動でモザイクかけるAIを作るのかw

667:デフォルトの名無しさん
18/12/27 15:37:30.88 MGCavWend.net
データセットが洋モノに偏ってあそこだけ洋っぽくなりそう

668:デフォルトの名無しさん
18/12/27 16:19:30.67 X03Q+yv7F.net
たしかにモザイクから復元するのに利用してる先行研究はあったはず

669:デフォルトの名無しさん
18/12/27 16:29:25.56 X1PNXoe/M.net
データセット無いかー。今考えてる方法は
1.洋物無修正動画をVottでマンコチンコトレーニングデータを作る。
2.yoloとかで自動モザイク装�


670:u作ってモザイクを入力としたDCGANでトレーニング 3.モザイク認識ソフトを作ってモザイクを切り抜き、切抜き箇所を2.にかけて出力を元画像と合成 GLCICは学習コストが凄そうなのでできれば回避したい。他に良いアイデアあったら教えて



671:デフォルトの名無しさん
18/12/27 16:41:22.77 1o6+PNFf0.net
>>644
アニメ系ならあるけど
URLリンク(github.com)

672:デフォルトの名無しさん
18/12/27 17:01:13.23 X1PNXoe/M.net
>>650
サンクス、Partial Convolutionsというのがあるのね。
これだと複数のモザイク箇所にも対応できそうだね。

673:デフォルトの名無しさん
18/12/27 17:11:03.99 X1PNXoe/M.net
もしかして、マンコチンコトレーニングしなくても無修正画像をPartial Convolutionsでトレーニングすれば良いだけだったりするか?
光が見えてきた気がする

674:デフォルトの名無しさん
18/12/27 17:21:24.33 2LS3jhIW0.net
マ●コが見えてきた気がする

675:デフォルトの名無しさん
18/12/27 17:24:50.95 RZ3xJ99q0.net
機械に頼るな
心の目で見るんだ

676:デフォルトの名無しさん
18/12/27 17:25:28.71 NCjIgPPe0.net
URLリンク(gigazine.net)
URLリンク(gigazine.net)
8*8ピクセルから復元出来る

677:デフォルトの名無しさん
18/12/27 17:35:48.30 T1w2lFK8a.net
モザイクの復元か

678:デフォルトの名無しさん
18/12/27 17:42:47.76 xSnO512RM.net
jpg時代のDejavu。エロは偉大なモチベだw

679:デフォルトの名無しさん
18/12/27 21:44:15.51 2qDLgn1i0.net
GANだと出来上がるのは機械の想像物にならんか?

680:デフォルトの名無しさん
18/12/27 23:00:37.63 dq01g3G80.net
>>658
人間の想像といい勝負
真実は誰も分からないのだから

681:デフォルトの名無しさん
18/12/27 23:20:01.45 JdZkwcys0.net
>>658
モザイクの向こう側にある真実を探求するつもりはないよ。違和感なくモザイクが消えればそれで良いと思ってる。
極端な話、機械が妄想して全員綺麗なマンコになってもいいと思う。

682:デフォルトの名無しさん
18/12/27 23:57:27.63 XnkO3CS60.net
>>658
モザイクかけた時点で情報は失われているから元通りに復元するのは不可能
想像でそれらしく補うしか無い

683:デフォルトの名無しさん
18/12/28 00:24:40.64 qU8TuhmSa.net
荒くなってはいるが黒塗りとかじゃないんだし完全に情報失われてるわけじゃないでしょ

684:デフォルトの名無しさん
18/12/28 03:00:23.93 OPkwyCCZ0.net
エロAIはよ

685:デフォルトの名無しさん
18/12/28 03:23:06.50 Nt5XO8IQ0.net
本物そっくりのCGでもわいせつ物扱いになったし
そのうちモザイクも違法になるかもしれんね
画像から欠けた部分を補完する技術はあるし
どうせそう遠くない未来に、動画の欠けた部分を
補完する技術も一般的になるでしょ?
「欠けた部分」を「モザイクパターンになってる部分」に置き換えるのも
そう難しいことじゃないだろうし、モザイクの部分を本物そっくりのCGに
リアルタイムに置き換える。その時に色情報を使用すればよりリアルになる
結局の所補完した画像はCGなのだが、CGがわいせつ物扱いになるしなぁ
より本物に近いCGを作れるモザイクから違法になって、
最後には黒塗りもアウトになるかもな。
ん?その流れで行くと、水着や下着もアウトかもしれん
今の技術で裸に見える画像(水玉コラ)を補完したらどうなるんだろうか?
流石に誰かやってるよな?

686:デフォルトの名無しさん
18/12/28 03:30:13.25 Nt5XO8IQ0.net
よりリアルな補完画像画像(よーするにコラだなw)が
誰でも簡単に作れるようになったら、誰でもわいせつ物が作れると同時に
逆にリベンジポルノ流出とかでもあれはコラだって
言い張れるようになるかもしれないな
写真(そのうち動画)がなんの証拠にもならない時代

687:デフォルトの名無しさん
18/12/28 03:43:57.02 Nt5XO8IQ0.net
>>655
モザイクから元の顔に戻せるように見えてるけど
似顔絵捜査員とどちらがすごいんだろうかね
情報量自体は被害者の記憶を言葉にしたほうが少ないと思う
たったあれだけで、それなりの精度をだせるなら
訓練すればモザイクから元の顔を書く
モザイク捜査員が生まれるかもしれない!

688:デフォルトの名無しさん
18/12/28 07:24:47.70 jk6Z9ErNa.net
>>665
暗号化しなくても、モザイクでアップしておいて
あとは利用者が勝手にどうぞ。
なんてのが出来ちゃうわけだ。

689:デフォルトの名無しさん
18/12/28 07:40:23.31 Nt5XO8IQ0.net
機械学習とはもう無関係なくなってきたが、モザイクどころかなにもないところから
コンピュータが人工知能で作り出した本物そっくりなCGはわいせつ物になるんだろうか?

690:デフォルトの名無しさん
18/12/28 07:42:55.28 xbVEt4Kl0.net
猥褻物判別AIが判断しそう

691:デフォルトの名無しさん
18/12/28 07:47:16.82 Nt5XO8IQ0.net
猥褻物判別AIは、生成されたCGに対して反応するわけだから
そのCGを生成するための元データ(=モザイク画像)を配布したら・・・?
未来もまだまだ、法律の抜け道と無理やりな法解釈のイタチごっこが続きそうだな

692:デフォルトの名無しさん
18/12/28 08:24:37.00 jk6Z9ErNa.net
>>668
本物そっくりだから、本物と区別できない
だから、本物かもしれない
よってわいせつ物
かな~

693:デフォルトの名無しさん
18/12/28 09:52:24.03 Wn6dMni60.net
>>658
著作権上は機械学習は人間の道具として扱われる
でも機械学習のコードを丸パクリした場合はほとんど定義されていない
この辺りしっかり決めておかないと非常にマズイ事になる気がする

694:デフォルトの名無しさん
18/12/28 09:55:24.02 zXZ69/3K0.net
漫画だってわいせつ物になりえるんだからCGもものによってはなるでしょう。

695:デフォルトの名無しさん
18/12/28 10:45:47.06 CHUSo/SN0.net
わいせつの3要件
徒に性欲を刺激・興奮させること
普通人の正常な性的羞恥心を害すること
善良な性的道義観念に反すること

696:デフォルトの名無しさん
18/12/28 10:55:29.66 2zbjWBV3M.net
ワイ動画見ただけじゃ興奮しないんだが。猥褻物なぞ無いキリ

697:デフォルトの名無しさん
18/12/28 11:28:32.32 dG0NGNXL0.net
児ポだって大多数の人は興奮しないから猥褻物に該当するかどうかみたいな議論あるしな

698:デフォルトの名無しさん
18/12/28 11:35:03.92 3yiiX6rlM.net
猥褻物を描く機械じゃなくてモザイクを消す機械だから問題無いのでは?
消した画像を公開できる状態にしたら流石にダメだろうけど。

699:デフォルトの名無しさん
18/12/28 11:40:38.32 Xa1MxpzYM.net
Winnyやマイニングスクリプトで検挙される国ですし

700:デフォルトの名無しさん
18/12/28 11:43:58.12 JLORl2/qF.net
お前らエロの話題だと急に盛り上がるなw

701:デフォルトの名無しさん
18/12/28 12:06:41.23 Wn6dMni60.net
winnyは開発者が捕まるのがありえなかったよなー
マイニングスクリプトはモバイルはマジでやめて欲しいぞ。電池無くなる
PCで一部リソース使うぐらいならいいけど

702:デフォルトの名無しさん
18/12/28 12:10:54.40 sicn3fFVF.net
名前忘れたけど反転系モザイク解除ソフトも捕まってたな
あれもソフト作る側には問題無いのに

703:デフォルトの名無しさん
18/12/28 12:13:34.81 srjLee/0a.net
一般的なセキュリティの紹介記事書いただけでウイルス公開したことにされて有罪食らう国だし

704:デフォルトの名無しさん
18/12/28 12:25:06.68 1eV7vVnKM.net
海外の鯖に置けばいい

705:デフォルトの名無しさん
18/12/28 12:40:59.01 3yiiX6rlM.net
Winnyの件を考えると、モザイクを消す学習済みモデルを配布するだけで逮捕されそうだよね。
でもまあ学習前のソース配布は問題ない筈だから
(類似や同じネットワークモデルを


706:利用した他のソフトも違法になるため) 学習用無修正画像を自前で用意できればなんとかなりそうではある。



707:デフォルトの名無しさん
18/12/28 12:50:57.52 dG0NGNXL0.net
何らかのサービスを提供する場合は海外鯖に置いていても運営元が日本にあると判例上アウトだよね

708:デフォルトの名無しさん
18/12/28 12:53:10.36 9fFTYmAmd.net
アルファ碁の深層学習の仕組みについて
わかりやすく教えて下さい。
従来のようにモンテカルロ木探索も使われているのはわかりますが
深層学習をどう利用しているのか、いまいちよくわかりません。
深層学習は、画像認識ならわかりますが
これをどう囲碁に利用しているのかイメージが出来ません。
この点をわかりやすく教えて下さい。
よろしくお願いします。


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch