【統計分析】機械学習・データマイニング24at TECH
【統計分析】機械学習・データマイニング24 - 暇つぶし2ch672:デフォルトの名無しさん
19/06/09 09:26:57.56 /FZVYwra0.net
だって品質あげても苦労が多いだけで給料上がらないじゃん。
下手したら更に安い金で更に工数のかかる精度を要求されるようになるし。
査定精度の低いところがこういうことに手を出すのがそもそも間違いなんだよ。

673:デフォルトの名無しさん
19/06/09 09:33:54.75 NAUdcA9m0.net
要件定義怪しそうw
従来型ITって仕事でも要件定義怪しいの沢山あるもんね

674:デフォルトの名無しさん
19/06/09 10:08:18.40 /FZVYwra0.net
従来のSIer的な要件定義は基本無理。
だから機械学習を本番運用するのは難しいんだよ。
精度策定で結局嫌になってアリバイ作業に徹するようになる人は本当に多い。

675:デフォルトの名無しさん
19/06/09 13:33:10.54 w6PGXrHH0.net
精度が要件になってたらアウトだしな
やってみないとわからないし
一回でも下回ったらアウトなのか
精度でなかったらどうするのか
ビジネスになる訳がない

676:デフォルトの名無しさん
19/06/09 13:55:38.89 xN+bC573a.net
機械学習に限らず特にIT業界においては「作ったものを売って終わり」というタイプのビジネスは確実に減少を続ける
とは言え、継続的に開発を続ける形式の契約を他社と結ぶのは面倒なので大企業でも内製が増えている
これまで大企業で内製があまり行われなかったのは「IT=社内システム開発」で一旦完成すれば開発要員はほぼ不要になるので正規雇用などできなかったから
今はむしろ「IT=本業」なので常に案件が存在するので直接雇用してあれもこれもやらせた方が効率的となる
だから従来式のSIerが今のような規模では存続不可能と散々言われている

677:デフォルトの名無しさん
19/06/09 14:31:52.84 iQc3/8+U0.net
>>651
>>実際問題信頼できる統計計算なんて回帰分析ぐらいのもので
これすんごいそう思う。
なので、この分野で日本はまだきのこれるんじゃないかと妄想してる

678:デフォルトの名無しさん
19/06/09 14:42:15.14 xN+bC573a.net
回帰分析といってもモデルの選択肢を一般化線形モデルにまで広げてみれば山ほどの可能性があり、
その中でどういった実装を行うかは解析の経験値やドメイン知識に有無に大きく依存するわけで
「安定した実装」が何を指すかは不明確だけど、「この手順通りにやればOK」みたいなものを求めているならそんなものはない

679:デフォルトの名無しさん
19/06/09 15:28:50.25 fjoZT5gcM.net
ここで一般化線形モデルまで行くのか?
ちょっと極端すぎね?

680:デフォルトの名無しさん
19/06/09 16:06:14.14 z1WXn/lH0.net
>>676
まとめ
SI市場が無くなった

681:デフォルトの名無しさん
19/06/09 16:06:22.37 vzathb3ta.net
多くの人は単回帰や重回帰のことを指して回帰分析と呼ぶがこれらは一般化線形モデルの中で様々な条件を仮定したものにすぎない
もちろんそれらの仮定が分析対象にとって妥当なものなら何の問題もないが、最低限の数学や統計学が分からないと妥当性など判断できないはずなのに
そんな知識のない人が何となく単回帰・重回帰で直線・曲線を引いてみて何となくフィットしてるのを見せてドヤ顔している例が多い

682:デフォルトの名無しさん
19/06/09 17:11:03.41 /FZVYwra0.net
>回帰分析といってもモデルの選択肢を一般化線形モデルにまで広げてみれば山ほどの可能性があり、
>その中でどういった実装を行うかは解析の経験値やドメイン知識に有無に大きく依存するわけで
>「安定した実装」が何を指すかは不明確だけど、「この手順通りにやればOK」みたいなものを求めているならそんなものはない
こういうめんどくさい人が登場してあれこれ言うことも含めて安定しないので普通の回帰にしとけと。

683:デフォルトの名無しさん
19/06/09 17:52:27.15 yPvpM3IBa.net
統計モデルなら実データとどのくらい分布や分散が一致してるのか調べられる

684:デフォルトの名無しさん
19/06/09 19:19:45.77 vT6Mp8oIa.net
現実問題として回帰モデル以上のモデルを準備しても
過学習するだけだからな

685:デフォルトの名無しさん
19/06/09 19:28:50.93 kmadDgcNa.net
>>682
普通の回帰って何のことか分からないけど内部的に最小二乗近似してるなら誤差分布が正規分布でないのに使ったら明確に間違いだぞ

686:デフォルトの名無しさん
19/06/09 19:59:05.39 /FZVYwra0.net
そこまでノイズが複雑な場合、何やってもダメだろ。

687:デフォルトの名無しさん
19/06/10 01:05:22.06 fcJW0GWO0.net
>>685
誤差分布が正規分布ではない分布に従うモデルのことを一般化線形モデルと言います
ちなみに正規分布に従うものを一般線形モデルと言います
自由の女神ほどのナイス日本語訳まで行かなくてもいいが、もうちょい訳語考えろと言いたい

688:デフォルトの名無しさん
19/06/10 01:35:01.39 fcJW0GWO0.net
>>681
なんとなく単回帰・重回帰でドヤ顔する人と
一般化線形分析で謎のハイパーパラメータ持ち出してドヤ顔する人の区別がつきません

689:デフォルトの名無しさん
19/06/10 01:57:16.14 RiY8Pa+r0.net
回帰なんて今や面倒なこと考えずにニューラルネットにぶち込むだけだと思うんだが

690:デフォルトの名無しさん
19/06/10 02:18:48.96 eq86jRmO0.net
間違いだらけのことをどや顔で臆面なく言っちゃうのがこのスレのレベル

691:デフォルトの名無しさん
19/06/10 05:40:36.59 +XEUhSwt0.net
須山に修正してもらおう

692:デフォルトの名無しさん
19/06/10 06:12:15.29 3mQ7PTgOM.net
>>685
それ間違い
>>686
意味不明

693:デフォルトの名無しさん
19/06/10 06:13:50.37 3mQ7PTgOM.net
>>687
それも間違い

694:デフォルトの名無しさん
19/06/10 06:14:37.92 3mQ7PTgOM.net
>>688
こんなところで
聞いても無駄

695:デフォルトの名無しさん
19/06/10 07:03:46.89 fcJW0GWO0.net
>>689
そういう局面はあるだろうけど、本気でそう考えているなら恐ろしい

696:デフォルトの名無しさん
19/06/10 07:53:37.33 2I4+V8i80.net
ニューラルネットするなら回帰王♪

697:デフォルトの名無しさん
19/06/10 07:57:41.79 +XEUhSwt0.net
>>695
どっちでもよくね?

698:デフォルトの名無しさん
19/06/10 12:20:20.62 g6tidy/FF.net
別に回帰しかやってなくても
精度出てればそれでも良いと思うし
統計がなんでもかんでも悪いとは思わないが
それを「ブラックボックスだ」とか「信用出来ない」とか
「人間より優秀とは思えない」とか「責任誰がとるんだ」とか
言って欲しくないな
人間がやってそれ以上の精度出るのか?とか間違わないか?とかスピードは?とか
考えると「ブラックボックス(実際はそうじゃないが)」で良いと思う

699:デフォルトの名無しさん
19/06/10 12:21:40.70 g6tidy/FF.net
>>687
合衆国が一番の迷訳

700:デフォルトの名無しさん
19/06/10 12:30:18.47 QmI1edQr0.net
>>699
美国は?

701:デフォルトの名無しさん
19/06/10 12:52:27.52 g6tidy/FF.net
美国は文脈的に的外れだからどうでも良い
合州国じゃなくて合衆国を選んだのが迷訳っていう意味だし

702:デフォルトの名無しさん
19/06/10 13:35:48.80 OXwxgYdVH.net
>>698
アカデミックの人かな?
ビジネスの領域ではそんなこと言ってられないのよ

703:デフォルトの名無しさん
19/06/10 19:46:57.52 rY9Mn9x+0.net
機械学習初心者なのですがディープラーニング以外の機械学習って覚える必要ありますか?手法が無限にありすぎて覚えられないです。

704:デフォルトの名無しさん
19/06/10 19:47:28.66 zRTuBs9kM.net
ビジネスだけど?

705:デフォルトの名無しさん
19/06/10 20:15:35.50 laqTwvRyp.net
>>703
何がやりたいかによるかな
覚えるという言葉から察するに応用したいんだと思うけどkeras使ってfit回すのと、scikit-learn使ってfit回すのでは、ソースコードは殆ど同じように思う
そういう意味では、やりたい事と手法のマッピングをすることに意味があって、その手法がDeep Learningだろうがそうでなかろうが、あまり意味がないと思う
統計モデリングは少し腰を落ち着かせて勉強しないと身につかないので、世の中のデータサイエンティストでも活用できている人は少ないのではないかと思う

706:デフォルトの名無しさん
19/06/10 21:09:57.64 RiY8Pa+r0.net
>>703
今のところ必要ないと思う
今一番成果が出てる手法だけを使うべき

707:デフォルトの名無しさん
19/06/10 22:36:21.02 EQVv/EW6a.net
統計モデルについてはこの動画の説明が分かりやすいからこれ見ろ
URLリンク(youtu.be)

708:デフォルトの名無しさん
19/06/10 22:39:30.02 cl88emhA0.net
赤本読めよ

709:デフォルトの名無しさん
19/06/10 23:11:32.89 +ahrTwMVa.net
>>703
実用を考えるとディープラーニングができるほど綺麗なデータが大量に使えることってあまりないからむしろ他の機械学習手法の方を知っていると強い

710:デフォルトの名無しさん
19/06/10 23:29:42.63 A95SX7z40.net
>500

711:デフォルトの名無しさん
19/06/11 02:42:37.45 ZQzbuTIBM.net
>>709
禿同
>>706
馬鹿

712:デフォルトの名無しさん
19/06/11 18:09:22.34 6NZpwaykM.net
機械学習って楽しいですか?

713:デフォルトの名無しさん
19/06/11 18:36:41.34 SdCAq12yd.net
楽しくはない。
機械学習はあくまでもサブ技術。
メインに専攻すべきではない。

714:デフォルトの名無しさん
19/06/11 18:48:27.85 QClOim5zM.net
ひとによるだろ
そんなこと聞いてどーすんの?

715:デフォルトの名無しさん
19/06/11 19:01:09.34 ZQzbuTIBM.net
>>712
大好き!楽しい!
統計学の勉強も楽しい!
現在、統計学の応用の5本目の
論文書いてるところ。
ただ、仕事から帰って書いてるだから
時間足りなさすぎ!

716:デフォルトの名無しさん
19/06/11 19:39:18.49 XL/fn5z60.net
という夢をみたのであった

717:デフォルトの名無しさん
19/06/11 19:40:07.84 XL/fn5z60.net
嫉妬野郎でござった

718:デフォルトの名無しさん
19/06/11 19:44:25.65 ko492/aS0.net
そろそろ論文もAIが書くよ
てか生成系のモデル悪用の将来はいかに

719:デフォルトの名無しさん
19/06/11 19:46:19.65 rt/UvHAD0.net
論文はAIが書き、人間はアノテーション作業に明け暮れるのであった。

720:デフォルトの名無しさん
19/06/11 21:18:16.47 tg9Aa7Nc0.net
アノテーションって転移学習とかで自動化出来そうで出来ないな

721:デフォルトの名無しさん
19/06/12 05:09:56.24 fMVFjy++0.net
文章生成系を生成系というと怒る人がいる

722:デフォルトの名無しさん
19/06/12 08:31:05.93 fMVFjy++0.net
ソフトバンクの社外取締役っていくらもらえるんだろう。。。
1億円くらい?

723:デフォルトの名無しさん
19/06/12 08:34:59.71 +0pwNKukM.net
そん正義が連れてきたインド人役員は
100億円もらってたんだよね
ま、インド人だから高いのよ
中国人も高い
次は韓国人
奴隷は日本人
在日ならソフトバンクに
行けばいいよ
韓国名で応募してね!
仕事は通名(日本名)でOk

724:デフォルトの名無しさん
19/06/12 09:01:52.01 k5XrsZPH0.net
ソフトバンクの社内役員は基本的に1億円。孫正義も同額で全額被災者に寄付を続けている。
他にストックオプションなども有るだろうけど。

725:デフォルトの名無しさん
19/06/12 09:26:41.42 3wcfQWS2M.net
松尾豊はソレで研究し金に

726:デフォルトの名無しさん
19/06/12 09:27:07.85 R4nJHUbN0.net
太陽光発電所を作ります(大法螺)

727:デフォルトの名無しさん
19/06/12 12:38:17.82 Wmv+D3tsM.net
>>724
へー本当に寄付してんだ
口先だけかと思ってたよ
で、どこに寄付してんの?

728:デフォルトの名無しさん
19/06/12 17:00:13.34 cGak2oaxp.net
>>726 たくさん作ってるじゃん。 サウジのやつは没になったけど。 国内では最大手に近いんじゃないのか?

729:デフォルトの名無しさん
19/06/12 19:12:40.23 yRay9q0a0.net
>>728
埼玉県にきまってるだろ

730:デフォルトの名無しさん
19/06/12 19:19:26.93 yRay9q0a0.net
計画はすべて尻つぼみ(笑)

731:デフォルトの名無しさん
19/06/12 19:24:11.00 yRay9q0a0.net
メガソーラーは1都道府県ごとに事業会社を設立して運営する考え。仮に20メガワット規模
の発電所が1年間稼働して売電すると、売上高は8億円規模になるという。国の規制で実現
していない発電した電力の全量買い取りや電力会社が持つ送電網との接続などが事業成立
の条件で課題は山積みだ。また発電事業とは別に埼玉県や神奈川県など地方自治体と
自然エネルギーの普及促進へ政策提言する団体「自然エネルギー協議会」も設立する。

732:デフォルトの名無しさん
19/06/12 22:40:31.71 BSq+d1KN0.net
機械学習って色んな手法あるけどみんなどれも覚えてるもんなの?
参考書やってて種類多すぎてどのケースでどれ使えばいいのかすら分からん

733:デフォルトの名無しさん
19/06/12 22:50:24.33 mQ+7g/y1d.net
手法を覚えるって、手法の何を覚えるんだ

734:デフォルトの名無しさん
19/06/13 09:44:39.89 g8amv0Zv0.net
>>732
手法を使えよ

735:デフォルトの名無しさん
19/06/13 11:41:27.81 qBC/YmXXM.net
名前と特徴、適正でしょ

736:デフォルトの名無しさん
19/06/13 12:04:23.81 bhCstcom0.net
Colaboratoryで巨大なデータセット扱うおすすめの方法を教えてください
自宅にwebサーバー建ててColaboratoryからwgetしてみたのですが、40Gあるのでアップだけで2時間、展開で1時間とか効率悪すぎて泣けてきます
Googleドライブ有料版をマウントして使ってみたのですが、何か1日の転送量最大値があるのかファイルが破損してしまいます
何かいいアイデアください!

737:デフォルトの名無しさん
19/06/13 13:11:29.71 3Y+kP9XaM.net
回線が遅いって話?
速くすれば?

738:デフォルトの名無しさん
19/06/13 13:36:35.55 2T1UAjXOa.net
>>736
ファイルを分割して並列であげろ

739:デフォルトの名無しさん
19/06/13 14:39:13.04 bhCstcom0.net
>>737
まあ、回線も遅いですが他の方法でアップしなくてもいい方法とかないかなと
>>738
aria2てので並列ダウンロードしてみます!

740:デフォルトの名無しさん
19/06/13 18:38:00.31 bhCstcom0.net
うーん、Google側が細いのか最大で10MB/s位しかでないですね

741:デフォルトの名無しさん
19/06/14 00:22:53.60 Gaxv7IADM.net
当たり前じゃん?
どんだけの人がアクセスしとると思ってる?

742:デフォルトの名無しさん
19/06/14 00:57:35.96 7+4XKUlI0.net
>>736
webサーバ建てる必要性ある?

743:デフォルトの名無しさん
19/06/14 10:18:19.40 2Fe7zdUeH.net
有料の環境つかえよ…

744:デフォルトの名無しさん
19/06/14 15:52:36.68 rI3r/fFD0.net
URLリンク(hazm.at)
これって
loss 順調に下がって下がり止まって,
acc 順調に上がって上がりきっても
val_loss val_acc 安定していないけど最終的に収束してて驚く
この不安定な val_loss val_acc だけど学習続けたのは,
loss acc が安定していたからなのかな?
いつ収束するかわからないまま学習続けるとか狂気の沙汰な気がする・・・

745:デフォルトの名無しさん
19/06/14 17:23:40.19 Wi4bG/9MM.net
何が言いたいのか
感想?

746:デフォルトの名無しさん
19/06/14 17:32:41.95 rI3r/fFD0.net
いや loss acc が安定していれば val_loss val_acc が不安定でも収束に向かうのか知りたい
発散してるように見えても大丈夫なのかなと

747:デフォルトの名無しさん
19/06/14 19:31:51.91 M8ulC+VI0.net
 大丈夫

748:デフォルトの名無しさん
19/06/15 12:43:28.02 XjE03gEa0.net
gpt-2もマスクがバックにいるから
大袈裟に盛ってるんだろうなと思う


最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch