【統計分析】機械学習・データマイニング30at TECH
【統計分析】機械学習・データマイニング30 - 暇つぶし2ch350:デフォルトの名無しさん
21/04/13 19:20:02.35 JY3IIMBR0.net
経営者に歯向かうって
日本の95%ぐらいが同族企業で新しい芽はすぐ摘まれるのに
そんな歯向かう程意気込んでいる奴が居るのか?
何か反論してお前がやってみろ的流れで上げ足を取られないよう我慢較べに耐え
マイナスポイントを作らないように頑張るぐらいが
日本のサラリーマンのやる気だろ

351:デフォルトの名無しさん
21/04/13 19:40:11.07 h3BzXWVB0.net
>>342
突然どしたおい

352:デフォルトの名無しさん
21/04/13 20:34:14.37 TGVCGH2G0.net
春だから

353:デフォルトの名無しさん
21/04/13 21:02:28.07 Qr7OJO8/0.net
はるだなぁ ┌┤´д`├┘

354:デフォルトの名無しさん
21/04/13 21:14:34.02 JY3IIMBR0.net
おっと意気込んで勉強してる奴が居たっぽいな

355:デフォルトの名無しさん
21/04/13 21:24:43.15 JY3IIMBR0.net
そんな使い捨て分野の勉強もいいが
サラリーマンなら腰巾着として生きていく道も悪い選択肢ではないぞ
方向性を間違ってしまいそうな準社畜勢が多く集まっていそうだけども

356:デフォルトの名無しさん
21/04/14 00:22:17.60 SzuxgdzH0.net
年収 >= 20万円 x 年齢
を満たしつつ、楽しく平穏に働きたい

357:デフォルトの名無しさん
21/04/14 10:53:40.16 GkDETHMT0.net
夢見る若者w

358:デフォルトの名無しさん
21/04/15 09:06:10.49 /Y74/7RV0.net
URLリンク(ocw.tsukuba.ac.jp)
筑波大学では、平成31年度10月より、情報教育に関する共通科目として「データ�


359:Tイエンス」を開講しました。 「データサイエンス」の授業では、データサイエンスの基礎的概念を理解し、 コンピュータを利用した基礎的なデータ分析技術を学ぶことを目的としています。 筑波大ではデータサイエンスが必須になった 更にその内容もデータサイエンスに留まらず 流体力学もIoTも何でもあり もちろん地道な検定とかもやるんだな



360:デフォルトの名無しさん
21/04/15 10:11:09.71 3ci3nRnzM.net
>>350
良く分かんないページだ
オープンコースの説明?
ラボの説明?

361:デフォルトの名無しさん
21/04/15 11:31:20.39 /Y74/7RV0.net
>>350は筑波大の学生全員共通科目だな
筑波大といえば学生が授業を見るためのデータベースを
学生が独自に作ってしまったとかで最近話題になった
もっと前には、構内でしたい放題しまくったスーパーハッカーがいて
いい所に就職できたんだっけ

362:デフォルトの名無しさん
21/04/15 13:54:53.25 YwaVn3VBa.net
>>350
流体力学なんて大手メーカーの開発職ぐらいしか使わないぞ
やるだけ無駄

363:デフォルトの名無しさん
21/04/15 14:11:56.12 3ci3nRnzM.net
>>350
これって導入のところの一項目が授業一回分になるのかな?
ラボの説明聞いて終わり?

364:デフォルトの名無しさん
21/04/15 14:28:15.51 ASAfbP0Sr.net
>>353
研究機関でも使う
そして研究機関でパラメータをひねりまわしてるのは派遣PGだったりする

365:デフォルトの名無しさん
21/04/15 14:30:23.81 WWq7Tu7t0.net
流行りだから、学生が呼べて就職がよければOKさ

366:デフォルトの名無しさん
21/04/15 16:27:52.28 Ek3DvuxM0.net
>>352
受賞はタイーホのライセンス!的なアレですな

367:デフォルトの名無しさん
21/04/15 16:37:07.53 Nt0NlrQG0.net
URLリンク(www.youtube.com)
強化学習とDNN画像認識を組み合わせて、
マンデルブロ集合の図形を自動検知、自動拡大

368:デフォルトの名無しさん
21/04/15 17:19:45.29 3ci3nRnzM.net
>>358
アーモンド的な模様を探して拡大?
マンデルブロを計算せずにってこと?

369:デフォルトの名無しさん
21/04/15 17:22:02.46 Ek3DvuxM0.net
なんちゃらのなんちゃら休むににたりってやつだな・・・

370:デフォルトの名無しさん
21/04/15 21:36:04.06 /Y74/7RV0.net
>>358
自己相似の構造を見出すことに成功か
このスレは何でもかんでも深層学習にしなくても
統計学っぽいのも一応はいいのかな
k-means法とかクラスター分析とか位相的データ解析とか

371:デフォルトの名無しさん
21/04/15 21:57:49.86 FAu+tRVaa.net
深層学習は機械学習を実現する一手法に過ぎないからね

372:デフォルトの名無しさん
21/04/16 10:59:52.75 3ahlvanY0.net
>>362
他の方法とは?

373:デフォルトの名無しさん
21/04/16 11:01:25.02 +ZqSb2qyM.net
コホーネンに手を出すかw

374:デフォルトの名無しさん
21/04/16 11:53:04.91 gNE3LwpI0.net
>>363
昔ながらのサポートベクトルマシンとか
マハラノビス距離に基づく分類とか
ランダムフォレストとか

375:デフォルトの名無しさん
21/04/16 12:12:24.30 +ZqSb2qyM.net
マハラノビスも最近は機械学習に
分類されるのか。orz

376:デフォルトの名無しさん
21/04/16 12:38:05.85 eQE8+yTmM.net
>>1
データ少ないときは深層学習じゃない方がいいの?

377:デフォルトの名無しさん
21/04/16 13:24:48.08 RDksD56A0.net
データが少ない時は決定木系でいいよ
特にテーブルデータ

378:デフォルトの名無しさん
21/04/16 14:17:37.95 qA3a8jioa.net
機械学習は機械的に学習できる手法の総称でしかないので何でもあり

379:
21/04/16 20:19:06.10 5MUeIHD20.net
>>361
k-means はあらかじめクラスタの個数は指定しないといけないから、クラスタの個数がわからない状況では無力ですよ‥‥

380:デフォルトの名無しさん
21/04/16 21:52:50.72 uMQoO2nS0.net
何を当たり前のことを…

381:デフォルトの名無しさん
21/04/16 22:11:22.27 +WADC0tD0.net
しっ、よしなよ
めちゃ早口で言ってるじゃん
rubyガイジ引き込む前兆だよ

382:デフォルトの名無しさん
21/04/17 00:53:32.90 r+Flv24K0.net
まあしかしk-meansとかのクラスター分析ってなんか意味あんのか?って思うことはよくある。
教師なしでもPCAなんかはまだ使い道わかるけど。

383:デフォルトの名無しさん
21/04/17 03:24:44.86 KQhVv37W0.net
SOM & GAN  gaaan

384:デフォルトの名無しさん
21/04/17 04:06:51.97 9pKeriUl0.net
クラスター分析は深層学習以前の統計解析が主流だった頃のNLPでよく使った。
よく使ったのが、大量の学術論文をベイズ分類器でテーマ別に分類して、分類後の
集合をさらにクラスター分析で類似文書ごとにまとめるというもの。
クラスター分析は、BOW的なデータ構造であればなんでも自動分類してくれるので
例えば画像ファイルからカラーヒストグラムを生成して、色分類ごとの色強度のデータ
ファイルを作れば、画像分類とかもできたので面白かった。
あと、クラスター分析とは違うが、最近、 誰かがNLPにおける教師なし学習の
新潮流について触れて、例えば、よくあるワードベクターの2次元マップ(Word embedding)
を作り、英語とドイツ語のマップを重ねると英語とドイツ語の対訳辞書を自動生成
することも可能になるはずとか話していた。教師なし学習で対訳辞書みたいなものが
自動生成できるかもしれないという考え方は斬新だなと思った。

385:デフォルトの名無しさん
21/04/17 04:15:57.29 dljYNFer0.net
>>373
応用例を知りたいの?

386:デフォルトの名無しさん
21/04/17 11:10:35.27 7oBh743X0.net
>>373
類縁グループを定量的に調べられるのなら
分類とかだと非常に有効だね

387:デフォルトの名無しさん
21/04/17 12:00:18.35 8ejS6mqaa.net
k-meansとかのクラスタリングで
正常クラスタ群と異常クラスタ群に分けられる?
過去に異常検出した時のデータと正常データを区別できるようにしておいて
クラスタリングを繰り返して上手く正常と異常に分かれるクラスタ数を見つける
新たになデータが各クラスタのどれに属するか判定して
異常クラスタに属したら異常の可能性があるから
調べるとか運用停止するとかの対処をする

388:デフォルトの名無しさん
21/04/17 13:21:11.85 ohP60UMxd.net
いや、分類ってそれなりの分類の尺度をユーザーが決めるから意味あるんじゃねーの?
機械学習的に分類しても、で?っていう気にしかならんのだが。

389:デフォルトの名無しさん
21/04/17 13:27:16.40 7oBh743X0.net
>>379
よく問題になるのは生物の分類だね
分類から主観を取り除くことが出来る
主観こそが大事と考える文系の為政者、経営者にとっては
邪魔な時がある

390:デフォルトの名無しさん
21/04/17 13:31:51.20 ohP60UMxd.net
ある種の外れ値を認識する方法としては意味ある時もあるか。
主観がどうとか言ってるのは全く的外れにしか思わん。
逆に主観とのある種の一致性を無駄に主張する道具には使われてる印象だが。

391:デフォルトの名無しさん
21/04/17 13:45:29.23 QU2IYZKl0.net
外れ値は外れ値だけ正常値は正常値だけ近くなるような距離関数選んで
dbscanにかけろよ

392:デフォルトの名無しさん
21/04/17 13:51:53.23 7oBh743X0.net
コンドルはワシタカ目(もく)なのかコウノトリ目なのか
とか
フラミンゴはコウノトリ目なのかガンカモ目なのか
とかを骨格とか卵白のアミノ酸配列などに注目�


393:オたりとか 色々指標を変えて学者が二百年も言い争い続けて、 結局はDNAの塩基配列をクラスター分析したら、 https://ja.wikipedia.org/wiki/%E9%B3%A5%E9%A1%9E#%E7%8F%BE%E7%94%9F%E9%B3%A5%E9%A1%9E%E3%81%AE%E7%9B%AE%E5%88%86%E9%A1%9E コンドルはコウノトリに近いんだよ~って20年前の自称鳥類物知りが語ってたのに 結局ワシとかに近い方に入れられてしまった



394:デフォルトの名無しさん
21/04/17 14:41:09.11 ohP60UMxd.net
>>383
で、その分類を誰がどう使うんだ?
そこで「正しい」とか主張することになんの意味があんの?
ってところを全く考えてなさそうな頭の悪さが見受けられる。

395:デフォルトの名無しさん
21/04/17 14:43:54.03 dljYNFer0.net
そう。。。

396:デフォルトの名無しさん
21/04/17 15:08:57.10 7oBh743X0.net
>>384
ある論争があった学問分野に
1つの解を与えた(これで解決したとは言っていない)
というだけでも恩恵はあるんじゃないかな

397:デフォルトの名無しさん
21/04/17 15:11:19.78 Qe2ZIyvF0.net
>>384
頭大丈夫か?

398:デフォルトの名無しさん
21/04/17 15:20:42.83 7oBh743X0.net
どのレベルで「客観的な分類なんて要るのか?」
と言いたいんだろうと思ってたが
古典的な哲学寄りの煽りだったのか

399:デフォルトの名無しさん
21/04/17 15:22:02.38 nv8Do3m/M.net
自分の頭が大丈夫かどうか
それは誰にも分からない
腹が減ったのは分かる

400:デフォルトの名無しさん
21/04/17 20:52:47.18 v2WFWWWe0.net
人間の恣意的な分類より
体型的で規則的な分類の方が個人による分類の違いがでないから分類結果の共有に間違いが少ない

401:デフォルトの名無しさん
21/04/17 22:10:48.61 4y7R77pu0.net
サイボウズ青野社長が目指す「100人100通り」の働き方実現
URLリンク(www.nikkan-gendai.com)
初公開! サイボウズの自由すぎる働き方はこんなやり方で管理されていた
URLリンク(cybozushiki.cybozu.co.jp)
どうしてサイボウズは、働き方を変えられた?
「時間」と「場所」の制約がない多様な働き方
URLリンク(toyokeizai.net)
サイボウズの働き方改革事例(前編)
「働き方の多様化」へ、その歩みはトップの覚悟からはじまった
URLリンク(ws.zxy.work)
サイボウズの働き方改革 ~働き方の多様性がチームワークあふれる会社を創る~
URLリンク(jinjibu.jp)
サイボウズはなぜ自由な働き方ができる? ーインターンが見た裏側には、ツールと情報共有があったー
URLリンク(www.wantedly.com)
働き方先進企業が警告「パワハラ的な日本企業は在宅勤務で沈む」
URLリンク(business.nikkei.com)
「働き方を自分で選ぶ」時代へ。その多様性が責任になり、パフォーマンス向上につながる。
URLリンク(www.nice2meet.us)

402:デフォルトの名無しさん
21/04/17 23:03:07.99 7oBh743X0.net
>>370
URLリンク(qiita.com)
エルボー法でも使ってみてくれ

403:デフォルトの名無しさん
21/04/18 01:15:06.95 oEMklD2xa.net
機械学習で分類するには分類基準をまず人間が与える必要がある訳でそれを客観的と言えるのか

404:デフォルトの名無しさん
21/04/18 03:01:48.20 /yrt+WGh0.net
客観的である必要はない。
人間にとって分類しやすいかどうかのがよっぽど意味があるというのに。。
分類をなんのために行うのかさえわかってないでk-meansで出ましたとか言ってるバカは
機械学習とかやめてほしいわ。印象を悪くする。

405:
21/04/18 03:53:49.04 8N2uJcok0.net
>>392
全く手段がないというわけではないんですね‥ありがとうございます
>>392
URL内結論コメント
>>現実のデータを使ってエルボー図を書いてみると、上記のような「綺麗なヒジ」はなかなか現れない
>>言いたいことはエルボー図の時と同じだ!!!

406:デフォルトの名無しさん
21/04/18 09:08:11.82 lVaCsfaE0.net
URLリンク(qiita.com)
x-means法が既にあるね

407:デフォルトの名無しさん
21/04/18 09:46:42.30 m+SV1W/C0.net
>>394
自然科学は自然を理解するモノだから
人間の考えより自然の方が正解
対象によって何が正解かは違ってくる
人間の都合で良いものは人間に合わせたらいいけど
自然科学は自然が正解
実験結果とか実際と差があるなら人間の仮説の方が間違いだから修正する

408:デフォルトの名無しさん
21/04/18 09:55:52.80 m+SV1W/C0.net
元のデータ空間のままでk-meansが上手くクラスタリングできない場合は
別の空間に移してからクラスタリングすると良いかもしれない
DNNも入力に近い層で空間を移していると解釈する人もいるし
どんな写像にするかをデータから学習していると考えられる
中間層の出力を使ってクラスタリングすると上手く分けられるようになっているかもしれない

409:デフォルトの名無しさん
21/04/18 11:49:56.96 yp3ki8fH0.net
測定誤差や間違いを多く含むデータを利用し、人間の主観が入った機械学習を利用している時点で…

410:デフォルトの名無しさん
21/04/18 13:36:27.79 QeEYhUGL0.net
その測定誤差を低減する上で必要な基礎知識って大学のデータサイエンス課では教えてなさそう
URLリンク(www.ds.shiga-u.ac.jp)
ジャンル的に工学部の履修内容だからか?

411:デフォルトの名無しさん
21/04/18 17:14:46.61 IRPicDM6a.net
どんな手法でどんなデータを計測するかということを設計する時点で設計者の主観が大いに入り込むことを理解できずに
データだけから判定を下すのだから客観的だろと言っている自称DSが多過ぎる

412:デフォルトの名無しさん
21/04/18 20:04:19.08 /yrt+WGh0.net
>>397
クソ馬鹿野郎は黙っててくれ。
物理においても人間の主観を蔑ろにするようなバカは話にならん。
量子力学も相対性理論も厳密には正しくないニュートン力学にどのような意味で帰着されるか
厳密に考えてる。
そういうことをまるっきり理解していない輩は消えてくれ。

413:デフォルトの名無しさん
21/04/18 20:21:19.55 ysDt+vZr0.net
そう。。。

414:デフォルトの名無しさん
21/04/18 21:38:13.62 fLgnYf4l0.net
GeForceの新規生産をCUDA動かない新verに切り替えるらしい噂
マイナー相手に争奪戦で勝てる気が全くしないw

415:デフォルトの名無しさん
21/04/18 22:09:58.07 n32h2KsI0.net
>>404
CUDAが動かなければGeForceの意味がない。ディープラーニングでもゲームでも使い物にならない。CUDA性能を維持してマイニングに使えなくするのがマイニング対策済30x0では?

416:デフォルトの名無しさん
21/04/18 22:16:31.16 Qxa4OXG60.net
>>404
それはマイニング制限とは別の話?CUDA使いたければTesla買えとか?

417:デフォルトの名無しさん
21/04/18 22:17:55.90 lVaCsfaE0.net
Tensorコアだけじゃどうしようもないからなあ

418:デフォルトの名無しさん
21/04/18 23:13:01.66 m+SV1W/C0.net
>>402
人間の主観じゃなくて観測する側の状態じゃね?
主観だと観測する状態は同じでも人によって違う結果になる
そうするとどんな値でも間違いではなくなる

419:デフォルトの名無しさん
21/04/18 23:13:58.56 m+SV1W/C0.net
>>399
測定誤差は正規分布に順うとしたら誤差の平均値が判るからその値を調整したらいい

420:デフォルトの名無しさん
21/04/18 23:14:17.97 m+SV1W/C0.net
フィッシャーの三原則とかある

421:デフォルトの名無しさん
21/04/18 23:15:20.18 m+SV1W/C0.net
>>401
主観が出来るだけ入らないように実験計画するんじゃないの?
主観を出来るだけ入れるように実験計画する?

422:デフォルトの名無しさん
21/04/18 23:21:52.89 m+SV1W/C0.net
量子論の不確定原理なら人間の主観とか関係なく不確定なんじゃね?
不確定だとしても確率的には値の差があるだろうから9割はこの範囲の値とか決まるだろうな
どんな外れ値でも確率ゼロではないから絶対に間違いとは言えないけど観測される頻度は稀になるはず
それよりも大きな頻度で観測されたら仮説の方が間違いなのは変わらない

423:デフォルトの名無しさん
21/04/18 23:35:52.79 yp3ki8fH0.net
>>412
主観入りまくってますがなw

424:
21/04/19 00:16:28.58 6sLSrXGT0.net
>>409
正規分布という名前が悪すぎます、ガウス分布でいいのです
ガウス分布は数ある誤差分布の one of them

425:デフォルトの名無しさん
21/04/19 00:49:42.58 Y2i4yGVV0.net
>>412
現象を説明する為にモデルを当てはめる時点で主観入ってる

426:デフォルトの名無しさん
21/04/19 09:16:49.17 I4CFpA8M0.net
All models are wrong, but some are useful.

427:デフォルトの名無しさん
21/04/19 09:31:02.90 QmRvPrb/M.net
>>416
誰の言葉?

428:デフォルトの名無しさん
21/04/19 09:32:33.96 xpugMHkq0.net
F=G*m1*m2/r^2

429:デフォルトの名無しさん
21/04/19 09:35:52.97 xpugMHkq0.net
George Edward Pelham Box

430:デフォルトの名無しさん
21/04/19 10:50:45.42 7a+3hK+O0.net
ニュートン力学は間違ってる(厳密には正しくない)から使えないとか言い出すやつは頭悪いだろ。

431:デフォルトの名無しさん
21/04/19 11:20:30.03 vPt4CmiJ0.net
スレタイ読めないやつと比べてどっちが頭が悪いの?

432:デフォルトの名無しさん
21/04/19 14:28:49.64 7a+3hK+O0.net
>>421
スレタイと関係ないと思っちゃうのか。。そりゃ頭悪いな

433:デフォルトの名無しさん
21/04/19 14:37:35.07 vPt4CmiJ0.net
>>422
どう関係するの?

434:デフォルトの名無しさん
21/04/19 17:58:53.25 ZVFLPhBo0.net
>>404
CUDAを動かなくする、という情報は少なくとも自作板では見つからなかったな

435:デフォルトの名無しさん
21/04/19 19:34:04.83 6UVoDsj30.net
>>417
ロジャーペンローズが似たようなことを言っている

436:デフォルトの名無しさん
21/04/19 20:34:22.39 GRSFwPvE0.net
人間が考えるなら主観が入り込むというなら全てに主観が入り込むことになる
つまり主観という点では差がない
出てくる成果には現実を上手く説明できるかどうかの差が生じる
より現実を説明できる成果は単なる個人の固定観念とは違う価値のあるもの
現実と合致する程度が高い成果は一個人の主観とは言えない程に質が変わる

437:デフォルトの名無しさん
21/04/19 21:20:07.15 GUe2JtDVa.net
主観的か客観的かは重要ではない
どれだけ客観的な手法を構築したとしても予測精度が低ければ使い物にならない

438:デフォルトの名無しさん
21/04/20 07:24:15.31 jszIXr370.net
>>420
君は>>416の英文をきちんと理解できてるのかな?

439:デフォルトの名無しさん
21/04/20 08:08:47.60 5/fHSI6qM.net
新卒で機械学習エンジニアになったけどGUIで学習するツールが導入されてて、マウスポチポチするだけでお仕事になるの納得行かない

440:デフォルトの名無しさん
21/04/20 08:10:50.56 SsFdkrp5F.net
単なる作業員になったらその内捨てられる

441:デフォルトの名無しさん
21/04/20 08:20:33.94 5/fHSI6qM.net



442:>>430 そう、危機感を感じている。 データサイエンス協会の人たちに「ライブラリが使えるだけじゃダメ、数学頑張れ」って教わってきたからモヤモヤする。 ツールでだめだったら即諦めってのも悲しいところ



443:デフォルトの名無しさん
21/04/20 08:55:31.90 XU4ld2UL0.net
>>429
どこのシステム?

444:デフォルトの名無しさん
21/04/20 09:05:48.17 YStzcIe+0.net
ファインチューニングすらしないでいいとか羨ましい

445:デフォルトの名無しさん
21/04/20 09:49:15.80 JWX72o4+M.net
データの仕事するなら数学よりコンサル力が重要
もしくはWeb分析や製造管理などドメイン知識を学んで特化するかだな
技術系でいきたいならクラウド使って基盤から自分で作れるようになれば引く手数多
最適化エンジニアは自動化されて終わるよ

446:デフォルトの名無しさん
21/04/20 11:59:17.59 pbjOZaIB0.net
メーカー研究開発やってるけど機械学習に対する敷居はここ数年で大きく下がったね
GUIツールなら実験系の人でも普通に使ってるし
データサイエンスに加えて、それ以外の専門を持たないと厳しいね

447:デフォルトの名無しさん
21/04/20 18:16:49.45 /RDGneBGM.net
>>432
会社バレしたくないから言えないですごめんなさい
>>434
Web分析やりたいなぁ スクレイピングさせてもらえるなら楽しいだろうな
>>435
ドメイン知識大事なのはわかる
世の中の全員が機械学習できるようになったらとても楽しい世の中になると思う

448:デフォルトの名無しさん
21/04/20 18:27:49.71 XU4ld2UL0.net
>>436
特殊なシステムか。。。
ソニーの奴辺りを使ってるかと思った

449:デフォルトの名無しさん
21/04/20 22:42:35.89 PyHebxw60.net
>>435
というか、専門分野を持たない統計屋が成り立ってる現状が疑問
数学をさらに極めているアクチュアリーでさえ、金融工学等でスキル補強してる

450:デフォルトの名無しさん
21/04/20 22:59:27.20 pbjOZaIB0.net
だからデータサイエンス学部とかちょっと心配になるね。

451:デフォルトの名無しさん
21/04/20 23:09:28.18 RpmUT2UU0.net
データから突き詰めていけば
その領域の構造も見えてくるんじゃないの?
予備知識として知っておいた方が良いけど
先入観とか思い込みで新たな発見を阻害しているかも

452:デフォルトの名無しさん
21/04/20 23:58:44.60 KfvQjl/O0.net
データから突き詰めて、分かった事実の99%は、その領域の人間にとって、何を今さらって言うレベルの常識なのが現実

453:デフォルトの名無しさん
21/04/21 00:26:38.44 pJR1O2/f0.net
それでも需要があるのは何故?

454:デフォルトの名無しさん
21/04/21 04:57:56.95 BjUmBGuB0.net
(1)マーケティングの成功 (ただ単に運がよくはやれたってだけかもw)
(2)1%に賭けてるところもあるかもしれない (薬系なんかは特に)

455:デフォルトの名無しさん
21/04/21 09:27:01.32 ULWWT4ypa.net
いわゆる「暗黙知」の問題を解決できるから
例えば、初心者に対して説明しやすい
あまりにも当たり前だと思い込んでしまっていることは
そもそも話そうとすらしない

456:デフォルトの名無しさん
21/04/21 15:29:43.27 KSNXGwT50.net
それも現場では当たり前だから話そうともしないけどね。

457:デフォルトの名無しさん
21/04/21 16:39:38.54 YSTRB6CIM.net
データサイエンス学部って企業と組んでむしろゴリゴリドメイン細分化してなかったっけ
DS実用化の観点からは正解にも見えるけど

458:デフォルトの名無しさん
21/04/21 16:58:44.66 LssXF+cLM.net
企業と組むっていってもデータ渡されてモデル作るだけでしょ
少なくともうちの会社と大学の共同研究はそう
そ�


459:ネもんKaggleと大差ないよ



460:デフォルトの名無しさん
21/04/21 17:10:53.01 YSTRB6CIM.net
ほんまやね
新しい学部だし企業でもないからそこまで深くコミットすること出来ないんでしょね

461:デフォルトの名無しさん
21/04/21 18:06:22.19 qv/v785L0.net
基礎だけ教えるだけでしょ
あとはpythonかrあたりを習わせて

462:デフォルトの名無しさん
21/04/21 20:54:12.98 pJR1O2/f0.net
リコメンドとかは個人毎に人がやるのは作業時間的にむりなんじゃね?
作業時間は人件費、コストになる
売上アップ分より少ないコストで実現できれば投資する価値がある

463:デフォルトの名無しさん
21/04/21 21:00:23.59 pJR1O2/f0.net
当たり前と思われている事も
具体的にどの顧客やケースに適用できるかは
勘でしかわからなかっただろうから
担当者毎に違う判断をすることになる
ある担当者は知見を使えると考えるけど
別の担当者は知見を使えると考えない
その知見が明確に認識されていなければ組織内で共有もされていないだろうから
経験の浅い担当者はその知見があることすら認識していない
知見を可視化する事は共有可能になるし
組織全体の成果の底上げにつながる

464:デフォルトの名無しさん
21/04/21 21:22:24.85 scWNm3nIM.net
一般論としてはその通りだけど、実際の仕事では一般論じゃなく個別の課題に対して何をどうすればどう効果があるのかを説明できなきゃいけない
容易に想像できる通り、そのためには最適化より重要なスキルが山ほどある

465:デフォルトの名無しさん
21/04/21 21:58:18.31 4ieWnGe7M.net
解くべき問題を探し回って捻り出さなきゃいけない時点で相当なハンデなんだよな
普通のソフトエンジニアリングだったら、解くべき問題なんてそこら辺の事務のおばちゃんに聞けばいくらでも出てくるだろう
逆に言えば解くべき問題を見つけられる人間に希少価値があるとも言えて、だからコンサルの飯の種としては最適だ
一方で解く側の人間にとってはパイの小さな分野だと言える

466:デフォルトの名無しさん
21/04/21 22:49:45.31 pJR1O2/f0.net
今の世界中の課題は新型コロナ
データサイエンスで何ができるか

467:デフォルトの名無しさん
21/04/21 22:51:36.83 pJR1O2/f0.net
少し前に目の結膜か何かをカメラで撮ると感染しているか判別するAIアプリのニュースがあったな
役に立つのか知らんけど

468:デフォルトの名無しさん
21/04/21 22:55:35.42 pJR1O2/f0.net
ガンとか他の病気も早期発見できたら役に立つと思うけどな
トイレの便器にセンサーつけて異常検知するとか言うニュースもあったな
コロナ禍でストレスかかってる人が増えているとかも聞くし
早く検知して対処できたら良いんじゃね?

469:デフォルトの名無しさん
21/04/21 23:33:54.27 AHvTeMJC0.net
普通のソフトエンジニアリングでも、データドリブンな開発というのはこれから重要になっていくと思うけどな。
その辺のおばちゃんが言ってることをデータを収集して分析して、本当なら改善すればいいし単に特殊例でそうなっただけならスルーすればいいし。
定性的な開発で済む場合もあるけど、定量的な開発ができることで業務改善できる分野はいっぱいあると思うよ。少しでもそういう見方で意味論をある意味捨象して数値で評価しようとする立場の人間が増えることはいいことだと思うけどな。
まあ、数値の評価ってのはいかようにも出せるので、文系的な議論がしっかりなされた上で数値的な評価で裏付ける、というのがよいと思うけれど。

470:デフォルトの名無しさん
21/04/22 02:31:03.78 EZ9yi1XHM.net
事務のおばちゃんを例に出すまでもなく、ソフトウェア・エンジニアリングはマネタイズの方法がたくさん開発されてて実績も豊富
DS分野でいうとBI導入が流行ってるのもマネタイズの分かり易さからでしょ

471:デフォルトの名無しさん
21/04/22 08:38:


472:37.02 ID:iKwCvStp0.net



473:デフォルトの名無しさん
21/04/22 08:57:06.72 M8v84iKOM.net
>>459
正解

474:デフォルトの名無しさん
21/04/22 09:30:40.56 KHhdvM960.net
マネタイズできてるのはかなりの規模で使われた場合ばっかだろ。
中小や受託案件なんかは全く関係ないわ。

475:デフォルトの名無しさん
21/04/22 14:18:43.57 CDCM7CdZ0.net
>>454
むしろ、コロナ騒動でデータサイエンティストの無力を実感
・国や地域によって患者・重傷者・死者のカウント基準が異なる
・陽性と判定するCt値も同様に定まっていない
・PCR検査以外の感染者の検出方法ほぼ全てで擬陽性が多分に含まれる手段を用いている
データとしてゴミだらけで統計以前。
これらに問題提起をして的外れな対策に意見すべきであった

476:デフォルトの名無しさん
21/04/22 14:42:04.01 TgsR4gUfM.net
検査数(当日)と患者数(2日前)とか
そこからかよ。みたいな

477:デフォルトの名無しさん
21/04/22 18:30:59.89 Uzm+txz10.net
>>462
所詮雇われ屋しかいないしな
まともな予測出したのって北海道の免疫学の教授とGoogleくらいでしょ

478:デフォルトの名無しさん
21/04/22 19:26:43.57 lA0hV6360.net
頼れそうなデータは重症者と死者数なんだが
死んだときに感染していればカウントするそうだから
データとしては「かなり」多めに出るな
誤差さえわからない

479:デフォルトの名無しさん
21/04/22 19:47:09.32 FRH+m68J0.net
「重症」の定義が国によってばらばらなんだが

480:デフォルトの名無しさん
21/04/22 19:47:48.04 FRH+m68J0.net
+日本の新規感染確定@PCR分てのは保健所分だけ公表で、医療機関独自系は非カウントなう

481:デフォルトの名無しさん
21/04/23 08:36:21.23 tnFfajmm0.net
死者数のリボルビング発表も言われてるしなあ

482:デフォルトの名無しさん
21/04/23 17:31:31.74 P+WEt3o30.net
ワクチン開発で多数の候補物質からふるい落とすとかに活用したらしいけど
そういうのは半端なくドメイン知識いるし

483:デフォルトの名無しさん
21/04/23 18:44:22.53 rBK2myaR0.net
>>469
候補を出すだけならいらないんじゃない?

484:デフォルトの名無しさん
21/04/24 08:25:25.67 MOnT+7TF0.net
データサイエンティスト「こちらが候補の一覧です。何の物質なのかわかりませんけど。」
お客さん「・・・」
おわり

485:デフォルトの名無しさん
21/04/24 12:25:29.89 OO9vAqoAM.net
やっぱデータサイエンチストに任せずに自分でやったほうがいいか

486:デフォルトの名無しさん
21/04/24 15:21:15.93 6XEQ6ynBa.net
>>471
物質名か構造式が出てくれば後は自動で絞り込めるよ
まあそれもデータサイエンティスト側でできるか

487:デフォルトの名無しさん
21/04/24 18:30:45.31 kEsviUBS0.net
製薬やマテリアルは自然界の物質をそのまま変数として使えるから、さほど難しくないテーマ
世の中の大多数のテーマは変数の生成から始めないといけない

488:デフォルトの名無しさん
21/04/24 19:20:19.57 b1XnG/z6M.net
データの意味を知らずにできるような単純な問題ならそれこそデータサイエンティストなんか要らんよ
親切なツール使えば現場の人間でも難しくないだろうし、近い将来完全に自動化される

489:デフォルトの名無しさん
21/04/24 19:24:54.82 aBat7e4Id.net
マテリアルもいい記述子見つけるの大変だよ

490:デフォルトの名無しさん
21/04/25 12:26:44.89 0okbEX8U0.net
ワクチン開発でDNNを活用す


491:るというのは異常に難易度が高いよ。 例えば、コロナウィルスの場合、COVIDウィルスのスパイクのタンパク質配列とかを 学習データに使用するけど、普通は、この種のウィルス特有のデータを10種類以上 選択する必要がある。このデータ選択は、ウィルスの専門知識がないと無理。 状況によっては公開データが用意されていない場合もあるので、その場合は、 研究室でタンパク質配列とかRNA配列とかを解読する作業も必要となってくる。 さらに、DNNに関しても、既存のネットワークを流用することはできないので、 新規にネットワークのアルゴリズムを作る必要もある。この作業は、普通のAI エンジニアでは無理。更に、機械学習に関してもかなり膨大なGPUリソースが 必要となる。また、専用のネットワークは動かしてみた上で修正を入れるという 作業が発生するため、TPUv3x1024くらいのリソースを開発期間の数ヶ月に渡って、 占有するという状況が発生する。開発要員としてはウイルス学、AIの各領域のポスドク クラスの専門研究者を10人くらい集めて、さらにクラウド費用として数億円くらいアサイン する必要があるかもね。まあ、これはほとんど不可能な要件なんだけどね。



492:デフォルトの名無しさん
21/04/25 16:03:32.73 A9tbQoo40.net
>>477
十年前からきたのかな?

493:デフォルトの名無しさん
21/04/25 16:35:58.53 lzmMLOISa.net
>>477
去年効果のありそうな物質の候補をリストアップしたニュースがあったな
それになんでもDNNを使わなくて良いし

494:デフォルトの名無しさん
21/04/27 21:39:48.80 SgCXWhD40.net
東大卒 旧通産省・工業技術院の元院長・飯塚幸三
「ブレーキを踏んだが、車が加速した」
流石高学歴で上に行った奴だな
この程度の嘘を平気でつけるのがこのクラス
AIで犯罪を起こしそうな率を検出させてみると
政治家とか企業のトップとか軒並み率が高そうだけど
末端労働者程率が低かったりして
犯罪者が作ったルールに一般市民が従っているっていう

495:デフォルトの名無しさん
21/04/27 21:55:07.22 SgCXWhD40.net
菅義偉の詳細データ入れると
99.9%とか出るんだけど
菅総理だけ表向きの事情で0%にしないといけないっていう
そんなチューニングがメンドクサそう
特別なチューニングを何個もやってるうちにおかしなシステムになって
最終的に末端が叩かれて
一般人が犯罪者になるっていう

496:デフォルトの名無しさん
21/04/27 22:26:18.40 drc3/kck0.net
馬鹿参上

497:デフォルトの名無しさん
21/04/28 00:01:36.86 kjLpBedQ0.net
頭にアルミホイル巻いとけ

498:デフォルトの名無しさん
21/04/28 00:48:19.24 Tk2PmT/40.net
AI疲れだな
GWにしっかり休んでくれ

499:デフォルトの名無しさん
21/04/28 07:27:21.67 rShJ3D9e0.net
あさからわろらされたわwww

500:デフォルトの名無しさん
21/05/02 11:16:21.40 N4VRd0iX0.net
>>1
sdgと言われるとsgdと空目する

501:デフォルトの名無しさん
21/05/02 17:25:15.38 liMkj8Q90.net
あわしろ氏は、AIはベイズ推論だけで十分だって言ってたけどね。

502:デフォルトの名無しさん
21/05/02 18:08:34.90 rSJyHW/ca.net
十分というか今AIと言われているものはほとんどがベイズの枠組みで記述する方が分かりやすいし柔軟的に拡張できるからな

503:デフォルトの名無しさん
21/05/02 18:11:39.92 JG6YyYGw0.net
ビショップの本を買ったのですが、積読状態です。
気合入れて読む価値はありますか?

504:デフォルトの名無しさん
21/05/02 18:13:31.90 JG6YyYGw0.net
フィールズ賞受


505:賞者のD. マンフォードらのパターン認識の本が全く話題になりませんが、あの本はどういう位置づけの本なのでしょうか?



506:デフォルトの名無しさん
21/05/02 19:10:03.88 N4VRd0iX0.net
基礎

507:デフォルトの名無しさん
21/05/02 20:33:26.36 liMkj8Q90.net
一般教養。

508:デフォルトの名無しさん
21/05/02 23:43:59.54 AUnCr2Ku0.net
>>487
今なら深層学習を最初にやるべきだと思う

509:デフォルトの名無しさん
21/05/03 07:36:08.52 k1jvROw50.net
>>487
誰?

510:デフォルトの名無しさん
21/05/03 08:09:03.39 s03MGASG0.net
IT業界に居て知らないことは無いだろ。

511:デフォルトの名無しさん
21/05/03 08:14:12.53 JIK/4A/q0.net
知らん。
ニクラウス・ヴィルトとかクヌース級なのか?
Joseph Redmon氏を超えたら紹介してくれ

512:デフォルトの名無しさん
21/05/03 08:24:08.67 sjGHdyBX0.net
俺も知らん
俺が好きなのはあんどりゆー先生

513:デフォルトの名無しさん
21/05/03 08:56:18.97 s03MGASG0.net
だからお前らは駄目なんだよ。

514:デフォルトの名無しさん
21/05/03 09:23:32.94 J4qyGfu10.net
ネタだと思って何も言わんと本気にする馬鹿が出てくるというアレだな。

515:
21/05/05 10:47:54.94 tRoHSHAj0.net
>>487
誰?

516:デフォルトの名無しさん
21/05/05 16:21:28.27 YD9wgWX/0.net
colab pro使ってる人いる?

517:デフォルトの名無しさん
21/05/06 11:59:48.85 9ulEY78a0.net
Colab pro日本からも契約できるようになったんだよな

518:デフォルトの名無しさん
21/05/06 13:39:08.91 3t4KZ2ob0.net
月1000円ちょっとだから家で機械学習で遊ぶのにいいかなと思って

519:デフォルトの名無しさん
21/05/06 19:23:34.81 ySmiiGpmd.net
URLリンク(colab.research.google.com)
プログラミング初心者は、このcolabでopenAIのテキスト→画像生成モデルをテスト実行できるぞ

520:デフォルトの名無しさん
21/05/12 11:00:45.44 lwPC+Em40.net
我勉強中なんだけど、
「RMSE(平均平方二乗誤差)を使い求まる解は、誤差が正規分布に従うという前提の下で求まる最尤解と同じになる」
これってどういう意味?

521:デフォルトの名無しさん
21/05/12 12:02:35.00 cBo9TB3z0.net
>>505
正規分布を使って最尤推定の式を立ててみな
式変形したら結果がRMSEと同じになる

522:デフォルトの名無しさん
21/05/12 12:34:56.40 aZwuBi2/0.net
誤差分布と正規分布の違いとか最近基礎を忘れてきたな。。。

523:デフォルトの名無しさん
21/05/13 09:33:19.17 LL50QdoW0.net
>>506
THX!
やってみるわ

524:デフォルトの名無しさん
21/05/14 03:55:13.35 +CUnWEgy0.net
colaboratory使えばGPU買わなくても大丈夫?

525:デフォルトの名無しさん
21/05/14 06:00:37.69 YMhl4ox20.net
>>509
はい

526:デフォルトの名無しさん
21/05/16 18:14:37.34 BCvV60Hy0.net
>>510
マジ!?
本番サーバのバッチでも使える?

527:デフォルトの名無しさん
21/05/17 11:56:47.57 AazcJmIk0.net
「X_train, X_test」の大文字ってどうしてます?
面倒なので小文字にしたいのですが、不都合ありますか?

528:デフォルトの名無しさん
21/05/17 13:27:31.17 50pYDYVJ0.net
ないよ

529:デフォルトの名無しさん
21/05/17 16:02:53.44 x42zKMo10.net
>>512
その変数名にしてる人たいていクソコード書いてるから
ちゃんとした入力変数の名前にしたほうがいい

530:デフォルトの名無しさん
21/05/17 19:41:41.86 3TA+gznAM.net
クソチョンw

531:デフォルトの名無しさん
21/05/17 21:45:08.12 sdljpxakM.net
>>514
Xの大文字を打つのにシフトすら面倒だって言ってる奴にちゃんとした変数名付けろって言っても、馬の耳に念仏なんじゃないか <


532:br> 概念の説明にはx,yが出て来るのは仕方ないとしても、 実際の分析では意味のある名前付けた方がいいというのには完全に同意だけど。 x2やy2に相当するものを使いたくなるときもあるし、 将来コードを見返す自分は赤の他人だと思って分かりやすく書いておかないと折角の努力が資産にならないよね。



533:デフォルトの名無しさん
21/05/17 22:50:20.67 TxYncY5F0.net
行列だから大文字Xなのかと思ってた

534:デフォルトの名無しさん
21/05/18 04:49:22.56 XMy91+oY0.net
>>516
その辺の機械学習の概念を理解するお薦め本ありますか?

535:デフォルトの名無しさん
21/05/18 11:04:58.96 K5WN/Dsi0.net
いや、pythonの規約を普通に守ればそこは小文字始まりだろ。
それを破るならそれなりの理由が必要だわ。

536:デフォルトの名無しさん
21/05/18 12:41:52.89 FgenxOxPr.net
jupyter notebookみたいな書き捨てコードだったら何でもいいよ

537:デフォルトの名無しさん
21/05/18 15:26:01.83 QNG9JUM6a.net
ていうか変数名くらいAIでわかりやすいの勝手に付けて欲しい
人間が考えるのはおかしい

538:デフォルトの名無しさん
21/05/18 16:19:30.43 oyqcAYpS0.net
テンソルの変換するからXだの言われても辛いのよ
前処理も一緒にやる場合はどの段階のXなの?ってなる

539:デフォルトの名無しさん
21/05/18 17:17:37.19 K5WN/Dsi0.net
>>521
そこまでAIができるなら、お前らなんかいらんわ

540:デフォルトの名無しさん
21/05/18 18:13:53.05 WCK1jWazM.net
行列だとしても、単に大文字だとわかりにくいから、mat_Rとか名前つけることあるな。回転行列だけど。
数式ですら字体や添字で区別を色々つけないと訳分からなくなる。

541:デフォルトの名無しさん
21/05/18 18:44:16.23 ONMU+Hso0.net
回転行列?
転置のことか?
転置は昔からTと相場が決まっとる

542:デフォルトの名無しさん
21/05/18 19:49:43.85 oyqcAYpS0.net
転置ではないよ。。

543:デフォルトの名無しさん
21/05/18 19:50:07.22 UWVHwMarr.net
回転行列は回転変換の話で転置とは無関係だろ

544:デフォルトの名無しさん
21/05/18 19:55:16.40 CtrctolZa.net
長くてもいいから読めば分かる名前にする。これが原理原則
メモ帳でプログラミングでもしない限り補完してくれるので変数名の長さは問題にはならない

545:デフォルトの名無しさん
21/05/18 20:07:18.39 Q90nYKbd0.net
ぬるぽ

546:デフォルトの名無しさん
21/05/18 20:46:05.40 puQpLL01a.net
コメントを書いても良いけどな

547:デフォルトの名無しさん
21/05/19 08:09:56.86 k7Ue1zjEM.net
配列の形はよくコメントに残すようにしている

548:デフォルトの名無しさん
21/05/19 10:50:43.72 V3eiLHp10.net
pycharm使っている人います?
有料の価値ありますか?
VSCodeを使ってますが、プラグインやカスタマイズが面倒なので、pycharmに乗り換えようかと
ワタシは初学者です

549:デフォルトの名無しさん
21/05/19 10:57:03.47 oIwzetOOM.net
ない

550:デフォルトの名無しさん
21/05/19 11:25:18.51 NOe9g/vN0.net
>>528
実際やってみればわかるが長すぎる変数名、関数名ばっかりだと視認性を恐ろしく悪くする。
適切なスコープに対する長さが重要。

551:デフォルトの名無しさん
21/05/19 13:02:44.62 4kQYZl+6M.net
>>532
ない
どうせ必ずPython以外の言語や設定も扱うことになるんだからVSCodeに慣れたほうがいい

552:デフォルトの名無しさん
21/05/19 21:31:22.29 tQFRmjgq0.net
vscode一択
業務でPython, JS, powershell, bash行き来してるけど全部vscodeだわ

553:デフォルトの名無しさん
21/05/19 21:31:55.19 tQFRmjgq0.net
RのサポートはRstudioのほうが気が利いてるかな

554:デフォルトの名無しさん
21/05/19 23:43:35.01 mou1RjBP0.net
どうみてもEmacs使っ�


555:ス方がいい



556:デフォルトの名無しさん
21/05/20 10:22:19.40 99tkUSER0.net
vscode,vim,emasなんでもいいけど、ある程度汎用のエディタのがいいと思うわ。

557:デフォルトの名無しさん
21/05/20 15:31:26.90 kTI71Gb40.net
俺はvim
補完とかpythonで必要な場合がほとんどない
特に機械学習では型もテンソルなんだけど
shapeを型として認識しないからあってないようなもん

558:デフォルトの名無しさん
21/05/20 19:33:02.88 8YO0kqZM0.net
jupyter使っててすら、define-and-run方式の深層学習フレームワーク使ってたら、結局実行時にしか型のエラーってわからないしね。
printするしかないときよくあるね。

559:デフォルトの名無しさん
21/05/20 20:21:47.84 NM6JuDeVd.net
Keras使ってたけど、Pytorchも使うようにしたわ
最新の論文で実装されてるのがPytorchが多くなってきたんで

560:デフォルトの名無しさん
21/05/20 21:59:17.03 CHi0SRjg0.net
caffe2=pytorchだし
YOLOV5がこれ専用だし

561:デフォルトの名無しさん
21/05/21 01:19:06.45 QTMvWd2k0.net
プロはvi一択と、あわしろ氏が言ってた。

562:デフォルトの名無しさん
21/05/21 13:48:33.54 +DlIiJwi0.net
商品レコメンドをやりたいのですが、pythonでおすすめのライブラリありますか?
データはアクセスログ、クリックログなどの暗黙データです。
調べたところ、レコメンドに関してはライブラリが少ない感じだったので。
implicitパッケージくらい?

563:デフォルトの名無しさん
21/05/21 15:31:54.44 zKEaAw9a0.net
タダで商売のアドバイスをしろと

564:デフォルトの名無しさん
21/05/21 15:32:57.16 zKEaAw9a0.net
タダで商売のアドバイスをしろと

565:デフォルトの名無しさん
21/05/21 16:25:46.28 +DlIiJwi0.net
>>547
仕事といえば仕事なんだけど、自宅待機中の勉強ってことで機械学習やってる
会社のためというよりは、転職に備えてという感じなんだ

566:デフォルトの名無しさん
21/05/21 16:27:47.08 r3L1GEKvH.net
>>545
scipy

567:デフォルトの名無しさん
21/05/21 19:12:12.46 vJ65WEpWM.net
>>548
へえ

568:
21/05/21 20:36:46.93 XRGlJQOp0.net
>>544
誰?

569:デフォルトの名無しさん
21/05/21 20:53:06.55 B6CXIi7z0.net
>>551
ぐぐった感じでは製材所の所長らしい
URLリンク(www.toeinavi.jp)

570:デフォルトの名無しさん
21/05/23 13:52:05.04 Ki6GpCCwM.net
クソチョンw

571:デフォルトの名無しさん
21/05/26 23:12:49.71 doCbFXDd0.net
>>546
んじゃ、お前はこのスレで一切情報を得なかったんだな
得てたら金払えよ

572:デフォルトの名無しさん
21/05/28 09:52:49.33 jQHjx/Sg0.net
逆に同業者が知ってないと迷惑って話もあるからそれは極論だわな。

573:デフォルトの名無しさん
21/05/28 10:33:05.14 TOGA1KHu0.net
逆切れw

574:デフォルトの名無しさん
21/05/28 18:02:12.37 I38f0A1ga.net
仕事で専門でやってるのに基本的な知識もなく自力で調べようとする能力もないならこっちとしては今後は関わらないようにするだけでしょ
わざわざ教育してやる必要もない

575:デフォルトの名無しさん
21/05/29 02:13:46.43 RSxnULQb0.net
そうしてきてバカで溢れて今苦労してるってのがこの業界だろうに。。

576:デフォルトの名無しさん
21/05/29 02:35:48.06 jr2Ui+Sl0.net
最近レコメンド実装したけどレコメンドってあんまり進化がないよな
協調フィルタリングという古典的な手法を使ってしまった

577:デフォルトの名無しさん
21/05/29 09:10:16.66 EnveV0300.net
>>559
メンテナンスも楽だし、いいと思うよ

578:デフォルトの名無しさん
21/05/29 10:48:37.13 RvAveAdmM.net
>>559
正解の定義次第でどうとでもなるからな

579:デフォルトの名無しさん
21/05/29 20:45:27.24 XrsIdb/I0.net
それを超えるアルゴリズムを開発して
論文発表しても良い�


580:フよ



581:デフォルトの名無しさん
21/05/30 05:45:34.87 lNYh/+HWM.net
画像から猫種も見分けられる?

582:デフォルトの名無しさん
21/05/30 07:18:13.54 RxsuuSDG0.net
>>563
ネコを種類別にしてたくさん見せれば可能

583:デフォルトの名無しさん
21/05/30 08:48:03.86 CdxYhf470.net
そのうち人工知能で学習したパラメータの膨大なデータベースができて、人間の知能を超えたらもう俺たちは何も考える必要はなくなるのかな。
そうなると俺たちは、単なる有機体の塊くらいの価値しかなくなるのか。

584:デフォルトの名無しさん
21/05/30 09:06:40.30 oWq8irquM.net
その前に機械学習が完全自動化されて俺たちが無価値になる未来が目前に迫っているから安心しろ

585:デフォルトの名無しさん
21/05/30 09:28:02.26 U3e/y5hb0.net
お前の価値は元々その程度だ、安心しろ

586:デフォルトの名無しさん
21/05/30 09:54:37.96 r6QU/kWQ0.net
>>566
目前って具体的にはいつ? 実現される根拠は?

587:デフォルトの名無しさん
21/05/30 10:14:06.20 BFfMYV1N0.net
>>568
実はこのスレのレスもお前以外は全部GPT-3搭載のbotだよ

588:デフォルトの名無しさん
21/05/30 11:01:49.50 edL7sxMoa.net
会話系の人工無能を作ったら、まずここで試す

589:デフォルトの名無しさん
21/05/30 11:04:30.02 +SlNLaiF0.net
ターミネーターって35年前の作品なんだな

590:デフォルトの名無しさん
21/05/30 12:18:11.58 ssDmNHo+0.net
Are you hungry?
URLリンク(www.youtube.com)

591:デフォルトの名無しさん
21/05/30 18:01:08.77 fKM+DAx30.net
人間が諸悪の根源だからな
AIが権力を持ったら
直ちに殲滅だな

592:デフォルトの名無しさん
21/05/31 19:50:26.60 FXamJQDQM.net
gpt3って論理使えたっけ?

593:デフォルトの名無しさん
21/06/02 11:26:59.88 hYf7qVFpr.net
パイタッチは草
URLリンク(github.com)

594:デフォルトの名無しさん
21/06/04 05:44:33.97 yUhKkGnZ0.net
>>575
pypyとか人前で口に出せないよな

595:デフォルトの名無しさん
21/06/04 10:37:04.81 xWxJ1kGR0.net
人工知能学会の資料に書かれている内容について教えてください。
不動産情報ポータルサイトSUUMOでのデータ活用(※PDFです)
URLリンク(jsai.ixsq.nii.ac.jp)
2ページ目 > 3.リコメンドシステム > 3.2従来型アプローチ > 1コンテンツベースフィルタリング
「間取りなど、カテゴリー変数を取り入れる場合、類似度を直接に算出できないため、ログから同時検索される確率を類似度として用いている」
↑上記資料には、このように書かれています。
この「カテゴリー変数は、類似度を算出できない」のは、なぜでしょうか?
順序が無いカテゴリー変数は、隣り合った数値であっても近さを表現できないから、という意味でしょうか?
また「ログから同時検索される確率を類似度として用いる」というのは、具体的にどのような処理が想定されますでしょうか?
(経験不足のためイメージできないもので。。。。)
以上、もしわかる方がお見えでしたらご教授いただければ幸いです。

596:デフォルトの名無しさん
21/06/04 12:48:21.16 9qdJpIYV0.net
>>577
ログってのが何なのかわからないけど
その文脈で言うとtf-idfのことでは?
それを使ってコサイン類似度を求める
深層学習が出る前はその手法が割と使われてた

597:デフォルトの名無しさん
21/06/04 12:54:08.51 oHDaGQI00.net



598:謔P検索語、第2検索語で 同じ第1検索語の時に第2検索語の分布が出来るから その確率が高い物は第1検索語との距離が違いって感じかも



599:デフォルトの名無しさん
21/06/04 13:00:27.61 oHDaGQI00.net
>>577
カテゴリ変数の距離を自分で考えてそれが妥当ならそれを採用してもいいんじゃね?
間取りだと1R,1K,1DK,2K,2DK,2LDKとか有るけど
1K,1DK,2K間の各距離をどう計算するのが妥当か

600:デフォルトの名無しさん
21/06/04 16:27:18.41 gzCOTeam0.net
検索条件をカテゴリ変数 として扱ってるんだろ?

601:デフォルトの名無しさん
21/06/04 20:55:49.74 a6XWEKieM.net
>>577
カテゴリー変数は量的変数と違って
赤と緑、赤と青どっちが近いかこっちで決めないと行けない
ログは人気投票で赤と緑をクリックする量と赤と青をクリックする量で
決める

602:デフォルトの名無しさん
21/06/04 21:03:31.65 oHDaGQI00.net
>>582
色だと光の周波数に数値化できるからそれで距離を計算するとかできない事もない
好きな色を選んでくださいって言う場合には周波数で距離を求めるのが妥当かわからないけど
もしかすると周波数と好みの間に関係があるかもしれない
周波数と好みに関係があるという仮説を立ててデータで検証するときは周波数で距離を決める事になりそう

603:デフォルトの名無しさん
21/06/04 23:13:35.28 K7oG2oyc0.net
>>577
1DKと2Kの区別は、不動産業界ではあるかもしれないが、不動産サイトを検索する
一般人にとっては主観的概念でしかない。したがって、業界の基準をそのまま当て
はめると一般人の検索行動と乖離が生じ、サイトの定着率が悪化する可能性がある。
そのため、検索サイトでは従来からアクセスログを解析することで、時空間的に
近い検索を「近い概念」と考えて、ユーザーに明示的に示す手法がとられてきた。
これはいわゆる「この検索をした人はこういう検索もしています」とか「この
商品を見た人はこの商品もみています」というよくあるレコメンドのやり方となる。
このレコメンドは、Wilson score intervalという統計解析手法に基づいており、
検索履歴を時系列で扱うことにより、特定の検索A1とそれ以降に行った同一人の検索
A2/A3...の近似距離値を自然対数のカーブのように指数的に低減させていくことで
A1に近いらしい他の検索入力を求めるというものとなる。
ただし、このアクセスログ解析法は、特定の検索の後に行われた検索パターンを
逐次、解析する必要があるため、大規模サイトの場合、計算量が膨大になりすぎる
傾向があり、大手ではこのためだけに解析用のクラスタコンピューターを導入する
ケースもあった。上の論文では機械学習を新手法としているのはそのためとなる。

604:デフォルトの名無しさん
21/06/04 23:18:31.01 K7oG2oyc0.net
誤)特定の検索A1とそれ以降に行った同一人の検索
正)特定の検索ワードA1と同じ検索を行った全ユーザーの検索

605:デフォルトの名無しさん
21/06/04 23:57:52.10 oHDaGQI00.net
アプリオリじゃね?

606:デフォルトの名無しさん
21/06/05 05:14:40.09 McMxv91Y0.net
>>584
その概念面白いな。同時検索ログを使ってダミー変数にLLEみたいなことしたら面白そうだな。

607:デフォルトの名無しさん
21/06/05 13:08:10.57 dULd7Di4M.net
> また「ログから同時検索される確率を類似度として用いる」というのは、具体的にどのような処理が想定されますでしょうか?
アソシエーション分析のsupport値かと。

608:
21/06/05 15:44:41.08 CJl2tIqC0.net
>>583
>色だと光の周波数に数値化できる
色は周波数とは関係ない
よって色は、周波数を使用して数値化できない
色は、眼球中の網膜に分布する三種類の錐体細胞 S, M, L の刺激の度合いで決まる
すなわち「色」は感覚であり「色覚」というべき、よって色の数値化の理論は私には難解に感じます、グラスマン(1809-1877,プロイセン)という数学者にして印欧語族論者を思い出します

609:デフォルトの名無しさん
21/06/05 16:19:37.57 HTZ34MD30.net
光は電磁波という物理現象で、その周波数で異なる色に見えるのをご存知ない?

610:デフォルトの名無しさん
21/06/05 18:18:17.64 eK4BMewua.net
>>589
その受容細胞が反応する周波数に違いがある

611:デフォルトの名無しさん
21/06/05 18:22:39.59 86obdan20.net
>>589
ペダンチックに振る舞ってたのに失敗してて草

612:デフォルトの名無しさん
21/06/05 18:47:15.95 MMnsh6lE0.net
たまに見かけるアホだったか

613:デフォルトの名無しさん
21/06/05 20:03:19.74 IO1TGcKCM.net
単純に色を数値化しても意味ない
色の好感度みたいなものを量る方法を
思いつくと役に立つ

614:デフォルトの名無しさん
21/06/05 20:17:34.80 aJEuAtPt0.net
色とイメージの関係は文化的、慣習的なもの
国とか地域で違うのは心理学で研究されている

615:
21/06/05 21:02:33.90 CJl2tIqC0.net
>>590-591
周波数成分の異なった光が同じ色に知覚されることは十分にありうることは、どう説明しますか?

616:デフォルトの名無しさん
21/06/05 21:08:10.00 aJEuAtPt0.net
>>596
知覚を対象にするなら目の見えない人や色弱や色盲の人もいる
周波数や波長を色の距離として採用する事も可能と言うだけで必ずその尺度を採用するべきとは書いていない
色から受けるイメージとかは文化や風習で変わると書いている
人の意見を正しく読み取った方が良い

617:デフォルトの名無しさん
21/06/05 21:12:15.30 uNMOHmjl0.net
BERTの埋め込み表現の各次元って何を表しているんですか?

618:デフォルトの名無しさん
21/06/05 21:49:23.62 HTZ34MD30.net
>>596
違う色だが同じ周波数にエイリアスする色が存在しても、色と周波数が関係ない事にはならないが
関係ないとしたら波長400nmの電磁波が紫に見え、波長が伸びると青、緑、黄色、赤と変化してゆく事実は何?
全単射でなければ数値化出来ない訳はない

619:デフォルトの名無しさん
21/06/05 22:25:30.88 v05wnVxC0.net
もう負けだよ諦めろw
色に周波数がないとか馬鹿にもほどがある

620:デフォルトの名無しさん
21/06/05 22:27:58.80 aJEuAtPt0.net
心理量と物理量の違い
音もピッチは心理量で周波数は物理量
何を研究対象とするかでどちらを採用するのが妥当か変わる

621:デフォルトの名無しさん
21/06/05 22:31:04.89 aJEuAtPt0.net
時間も心理量と物理量で違うこともある
退屈な時間は心理的には長く感じるけど物理的には等しい
相対論だと観測する人によって物理量も変わるけど
心理量を時、物理量を時間と区別する人もいる

622:デフォルトの名無しさん
21/06/06 06:01:28.13 tNhqxxmb0.net
>>598
分からない
色々観測して推測はできる。。。

623:デフォルトの名無しさん
21/06/06 07:01:58.44 TkNBt3960.net
>>598
BERTに限らず埋め込み表現の各次元の意味を人が理解するのは基本的に無理

624:デフォルトの名無しさん
21/06/06 07:13:07.15 b+8h8Rirr.net
>>596
> 周波数成分の異なった光が同じ色に知覚される
可視光でそんなことがあり得るんですか?
具体的にどんな時に起きるんですか?

625:577
21/06/06 09:45:47.44 WALxRzX00.net
>>578,579,580,582,584
THX!!!
めっちゃ参考になりました!

626:デフォルトの名無しさん
21/06/06 10:44:29.36 XtTAwPVN0.net
>>605
赤色光と緑色光を混ぜたら黄色に知覚されるとか

627:デフォルトの名無しさん
21/06/06 13:21:06.65 c7m87H9N0.net
人間にとっての色はLMS錐体の刺激値であるというのは間違いない。
それを単一の波長で表せるかというと表せない。
白とか、赤紫とか、原理的に複


628:数の波長の混合でしか表せないものがある。 普通の人間の色覚を数値化する場合は3次元のLMSの刺激値で十分で、特殊な場合(光学シミュレーションしたいとか、4錐体2錐体の生物も扱いたいとか)はもっと多次元のスペクトル分布を扱う必要がある。 でも可視光の波長に色がついていないわけではない。(波長からLMS錐体の刺激値への写像が存在する)



629:デフォルトの名無しさん
21/06/06 13:34:39.67 RSxxzjaM0.net
>>608
ある波長、周波数の光に対して
各受容体の反応のレベルが変わるだけ
各受容体の反応の仕方は個人差がある
ある人は赤の波長に強めに反応するとか

630:デフォルトの名無しさん
21/06/06 13:36:37.21 RSxxzjaM0.net
>>608
何を対象とするかで変わると何回も言っているだろう
動物や昆虫の視覚を対象としたら人間の可視光の波長だけではカバーできない
その場合も物理量である波長や周波数は使える概念

631:
21/06/06 14:01:19.04 xlnMgrm30.net
>>608
世の中には4錐体の人も結構いるらしく、その人のために32bit ビットマップRGBAがあるんだと、長い間信じていました

632:デフォルトの名無しさん
21/06/06 14:04:51.02 x4M9++220.net
シャコさんをおもいだした>色覚
2色覚の人間はけこういぱいいる
4色の人はウルトラレア

633:デフォルトの名無しさん
21/06/06 14:09:49.01 9mmqAG88F.net
>>589
>>596
あきらめろ

634:デフォルトの名無しさん
21/06/06 19:01:46.49 c7m87H9N0.net
>>609-610
だからそう言ってるじゃんか、
スペクトル分布からLMS刺激への写像だと
3DCGのレンダラーでRGBじゃなくてスペクトル分布で色を計算するものがあるんだけど(OctaneとかSpectral Cyclesとか)
極端なケースだとその方式の方がリアルに見えるね

635:デフォルトの名無しさん
21/06/06 19:25:09.29 KjuPBoHPM.net
受容体って言いたいだけじゃ
cmosセンサも同じようなものだけど

636:デフォルトの名無しさん
21/06/06 19:41:03.98 XtTAwPVN0.net
もともとの話の色の距離ってことならCIEのL*a*b*で測るのが定番だろうな。

637:デフォルトの名無しさん
21/06/06 22:05:08.19 RSxxzjaM0.net
>>614
スペクトル分解しなくても光として存在するし波長とか周波数とかの物理量も測定できるんじゃね?
何を対象とするかで変わる
錯覚とかを研究するなら同じ物理量の光で
見る人がその前に違う光を長時間見続けていたとか
隣接して別の波長の光の有無とかの影響を受ける
そうなると受容体だけではなくて脳内の色の認識処理も関わる事になる

638:デフォルトの名無しさん
21/06/07 10:38:46.41 BLDePS2QF.net
ニンジンが赤いのはβカロチンだが
βカロチンは赤以外を吸収する
植物の葉が緑なのは葉自身が緑以外を吸収してるから

639:デフォルトの名無しさん
21/06/07 19:32:51.30 nxa4Ud+BM.net
>>617
一点だけ聞きたいのだが、白色光の波長はいくつなの?

640:デフォルトの名無しさん
21/06/07 19:41:20.55 K3uLvPLi0.net
>>619
白とか黒は明度で色とは違う概念
色相環とは別に明度がある

641:デフォルトの名無しさん
21/06/07 19:55:11.28 xDURoYfcM.net
>>620
じゃあ、赤紫の波長はいくつ?

642:デフォルトの名無しさん
21/06/07 20:01:30.95 k2+fmGQH0.net
さすがにそのへんはggrよks・・・

643:デフォルトの名無しさん
21/06/07 20:33:45.30 6Xlqh/9FM.net
>>622
この質問がggrksだと思ってるのなら、あなたは可視光についてほとんど何も理解していないと言っていい。

644:デフォルトの名無しさん
21/06/07 20:46:34.09 k2+fmGQH0.net
白色光+赤紫くんIP変えてるの?なんなの???

645:デフォルトの名無しさん
21/06/07 20:47:13.14 K3uLvPLi0.net
>>621
ここに載ってる
URLリンク(phenomenon-of-light.jp)

646:デフォルトの名無しさん
21/06/07 20:56:45.82 eDz2U4pi0.net
>>623
あなたはいったい何を理解されてるのでしょうか?

647:デフォルトの名無しさん
21/06/07 21:04:25.68 iI2xbuf5a.net
っていうか理解してるのならとっととそれ使って作りたいもの作ればいいのに何を無駄話してるんだろう

648:デフォルトの名無しさん
21/06/07 21:11:58.81 pxUr0SVPM.net
データマイニングにRGBは関係なくて
自動車の自動運転ではRGBをAIで分析する
思い違いがあるのでは

649:デフォルトの名無しさん
21/06/07 21:21:51.46 6Xlqh/9FM.net
>>625
URLリンク(polyhedra.cocolog-nifty.com)
これでいい?
光として存在してる(見える)ことと、単波長の電磁波であるということはなんの関係もないという話。
基本的にはその辺の光はスペクトル分布でしか測定できないのよ。色覚においては、そのスペクトル分布を3次元に写像したLMS刺激値か。

650:デフォルトの名無しさん
21/06/07 22:17:22.27 K3uLvPLi0.net
>>629
そのサイトは光の周波数が連続で無限にあって
デジタルみたいに量子化されていないと言っているだけ
周波数は連続しているからその連続した値と人間の色の区別の対応関係が無いだけ
新しい色の名前を作ればもっと細かくなる
色の分け方も文化による
何度も言っているけど何を対象とするかで変わる
人間の色の認知だったら受容体だけではなくて脳の色の認識とか色覚異常とかもある

651:デフォルトの名無しさん
21/06/07 23:26:32.10 6Xlqh/9FM.net
>>630
赤紫とか、白とかっていう光は、人間の色覚のなかにだけ存在して(LMSの3次元の値)、
単一波長(スカラー値)のスペクトルの光としては存在しないのよ。
複数の波長の光子が飛んでくるから赤紫とか白は人間の知覚できる色(?)として存在する。
だから、光が存在して見えるから波長とかの物理量が単独の値として測れるというのは勘違いなんだよ。
同じ色を見続けると色が見えなくなってしまう、とかいう話は確かにあるけど、それ以前の問題として、スペクトルと色の関係わかってますか、という話。
色相環とスペクトルは、本質的にはあまり関係ない。

652:デフォルトの名無しさん
21/06/07 23:30:16.21 K3uLvPLi0.net
>>631
人間の視覚細胞の特性は光の周波数によって違うんじゃね?
SMLとかの種類は周波数によって反応が違う
それぞれの反応レベルに応じて認識する色が違う
赤紫色だと認識する光の波長がある

653:デフォルトの名無しさん
21/06/07 23:31:58.13 K3uLvPLi0.net
認識を共有する必要はないから
あなたはあなたの認識のままで私は困る事はない
私も私の認識のままで良いです
あなたが困る事はないでしょう
このまま時間を無駄にする事の方が困る

654:デフォルトの名無しさん
21/06/07 23:36:55.67 wnFtPeA/0.net
いい加減スレチだから相手するな

655:デフォルトの名無しさん
21/06/08 00:11:56.11 G3b+1Lbj0.net
ID真っ赤になるまでグチャグチャ言っておいて時間の無駄は草

656:デフォルトの名無しさん
21/06/08 00:20:41.02 JXlVOm49M.net
全スレ民の後頭部向けてブーメラン放つのやめるんだ

657:デフォルトの名無しさん
21/06/08 00:21:54.01 TllRLWv0d.net
何も考えずにラベルだけ付けて置けば学習するのが機械学習の基本。
波長だ何だと物理特性にこだわるのは邪道

658:デフォルトの名無しさん
21/06/08 00:49:53.80 W2ScMeuQ0.net
そんなやり方じゃ限界くるのは明白だから構造をつけましょうというのが
今のアカデミアの最先端課題なんだが

659:デフォルトの名無しさん
21/06/08 07:08:11.97 ve9EpaVZM.net
>>632
いや、赤紫だけはないんだよ。波長の長い赤と、波長の短い紫を混ぜないと作れない。
白も同様に色んな波長を混ぜないと作れない。
ホワイトノイズっていうだろ。色んな波長の信号がホワイトノイズに入っていることを白色光に見立ててホワイトノイズという名前が付いてる。

660:デフォルトの名無しさん
21/06/08 07:18:17.75 L6oazCXu0.net
色をスペクトルで入れればいいじゃん
もうスペクトル画像でもいいぞ

661:デフォルトの名無しさん
21/06/08 07:22:56.66 Tl0GKS3NM.net
生物学と画像処理が混ざって草。
前者なら機械学習関係ないし。

662:デフォルトの名無しさん
21/06/08 08:04:40.47 NjCrJDVK0.net
マウント取ろうとして失敗しただけ

663:デフォルトの名無しさん
21/06/08 08:32:10.19 L6oazCXu0.net
最初に答えた人も誰も色は単一周波数で表現できるなんてなんて言ってないのにね
色を周波数(波長)で表現可能って答えてるだけでさ

664:デフォルトの名無しさん
21/06/08 10:07:24.40 EzJexANir.net
>>637
機械学習はデータ突っ込めばとにかく学習してくれる魔法の箱じゃないんだから
ドメイン知識に基づいた特徴設計はとても重要

665:デフォルトの名無しさん
21/06/08 14:24:43.39 NjCrJDVK0.net
ドメイン知識要らねえってのが最近の流行りじゃねえの?
AlphaZeroみたいな

666:デフォルトの名無しさん
21/06/08 14:26:36.95 3hEUCg900.net
この現象はこうだ
とか断言したって実際の自然現象と一致してる保証なんてないからな
思い込みの激しい人は断言するけど
実験したり観測したりして検証しないとただの仮説
そいつがそう思うってだけのこと

667:デフォルトの名無しさん
21/06/08 16:14:58.02 CHrXnr0w0.net
虹に赤紫が無いのは判ったけど
色相環で言うとH=0-290あたりまでが虹?
290-360が無いってこと?

668:デフォルトの名無しさん
21/06/08 17:46:42.71 ve9EpaVZM.net
>>643
最初に答えた人はどうか知らんが、>>617ではスペクトル分布なんか考える必要なく単一の波長を測定できるようなニュアンスのことを言っていたので突っ込んだだけ

669:デフォルトの名無しさん
21/06/08 18:10:03.41 SSiQ1mrM0.net
Outlier(外れ値)推定って、どの程度まで精度を上げられるもん?
ランク学習が効果的という断片的すぎる情報を聞いたけど、どう応用すればいいか解らん

670:デフォルトの名無しさん
21/06/08 18:31:37.75 UfAUNj840.net
>>649
まずは外れ値の定義を決めた方がよさそう。
どんな問題を扱ってるの?

671:デフォルトの名無しさん
21/06/08 18:59:28.01 G3XPHo6KM.net
タグ付けして結果と照らし合わせて分析する

672:デフォルトの名無しさん
21/06/08 21:41:17.43 dkyI01jSd.net
明日からはSSII2021ですね
最近の学会はオンラインだから楽だけど出張なくてつまらない

673:
21/06/08 23:14:42.34 TwRjMltj0.net
>>632
>赤紫色だと認識する光の波長がある
ない
あるというのなら、その周波数または波長を示せ

674:デフォルトの名無しさん
21/06/08 23:36:23.06 JbMjUK2XM.net
>>653
URLリンク(encycolorpedia.jp)
この色は約516.47nmの波長である

675:デフォルトの名無しさん
21/06/09 02:17:44.03 mSqk8jbs0.net
アップデートできないんだから何言っても無駄
バカの壁を崩せない又は洗脳されていて抜け出せない状態

676:デフォルトの名無しさん
21/06/09 03:24:17.07 T+ZDCqjcM.net
>>654-655
調べたことが正しそうかどうかを別のソースでチェックする癖はつけたほうがいいよ。
URLリンク(en.m.wikipedia.org)
516nmって緑あたりの波長だよ
てかさ、深層機械学習がいかに強力なツールであろうとも、物理的事実はひっくり返らないから。

677:デフォルトの名無しさん
21/06/09 03:37:28.53 mSqk8jbs0.net
光なんだから波長も周波数もあるに決まっている
合成しようと波であることに変わりはない

678:デフォルトの名無しさん
21/06/09 06:58:34.18 8XiOkCsIM.net
レーザーのような、単一スペクトル光には波長も周波数もあるのはその通り。
赤紫や白のような、複数の波長の光の波を合成して出来た波は、確かに波だが、こういう波の波長や周波数を表すときは、波長分布(スペクトル分布)、周波数分布で表す。
合成したからといって一つの波長を持つようにはならないよ。
つまり、単一スペクトル光でない光を波長で表すのは無理。(分布にしないとだめ)
なる、出来るというのなら、100nmと1000nmの光とか、400nmと700nmの光を1:1で混ぜたときに波長いくつになるのか具体的に教えてくれるかな。

679:デフォルトの名無しさん
21/06/09 09:10:43.69 YkjtQR5yM.net
しつこい

680:デフォルトの名無しさん
21/06/09 09:14:56.96 5LvF4jPN0.net
与えられたデータをどう加工するかは自由だから自分の思うようにやってくれ
なのでこのつまらない話題そろそろ終わりにしてくれる?

681:デフォルトの名無しさん
21/06/09 14:31:40.69 FkjPjxpf0.net
終わりにしたければ、スルーすればいいだけ

682:デフォルトの名無しさん
21/06/09 14:46:32.00 hF9PqJL2M.net
wake-sleepアルゴリズムの日本語訳語ってなに?

683:デフォルトの名無しさん
21/06/09 19:22:33.15 zRBfpo4e0.net
>>662
うさぎと亀

684:デフォルトの名無しさん
21/06/09 19:37:54.25 mwMdCY8S0.net
寝起き

685:デフォルトの名無しさん
21/06/09 21:04:40.01 5LvF4jPN0.net
日本語訳って誰か決める権威がいるの?

686:デフォルトの名無しさん
21/06/09 21:07:40.68 zRBfpo4e0.net
>>665
んなわけあるかい
明治文壇の同人誌会派じゃあるまいしw
バズらせたもん勝ち

687:デフォルトの名無しさん
21/06/09 21:15:44.01 oPk2UlsZM.net
>>659
質問に返答しないで「しつこい」はアカデミアとしてダサいと思わないの?

688:デフォルトの名無しさん
21/06/09 21:17:18.19 kPbJ7gvK0.net
だめだね

689:デフォルトの名無しさん
21/06/09 21:39:31.83 YI82MvC5a.net
機械学習スレで延々と光学の話して何がしたいのか

690:デフォルトの名無しさん
21/06/10 00:19:08.68 2T6TTAX/M.net
>>669
元々人間の色の好みをどのように取り扱うかという話だったように記憶しているので、
人間にとって不自然な光の波長という概念を持ち出すのは筋悪じゃないか?という話をしている。
人間には光の波長はわからなくて、LMSの刺激値しかわからないのだから。CIE LabもXYZもRGBもその線形変換なんだから、その辺の値を使うのが入力おしては本質的だよ。
HSVとかですら、余計な前処理が入ってる可能性がある。全単射とはいえ、全く線形ではないし。

691:デフォルトの名無しさん
21/06/10 00:23:21.07 0hdlcNGL0.net
そもそもYUYV転送した時点でw

692:デフォルトの名無しさん
21/06/10 00:56:25.89 hRyt/9ho0.net
蒸し返すブーイモ死ねよ

693:デフォルトの名無しさん
21/06/10 02:05:06.72 gS/TDJgj0.net
いつもの人と違う感じか?
そんなに何人も異常者がいるとは思えんのだが

694:デフォルトの名無しさん
21/06/10 08:06:14.53 Hm6l3sTRa.net
波長で判断するのが不適当だと思うなら勝手にそうすればいいだけ
別にこのスレで許可を得る必要なんてない

695:デフォルトの名無しさん
21/06/10 10:56:03.57 r0SYL7zKd.net
HSV は全単射ではないのではないのですか?
>>673
少なくとも >>670 さんはいつもの人だと思います
あと5chに来てる人の母集団の特性としては健常者の方が圧倒的に少ないと思います

696:デフォルトの名無しさん
21/06/10 16:51:21.94 SSYyTcRL0.net
色彩工学やら色彩心理学の人?
もう飽きたんだけど

697:デフォルトの名無しさん
21/06/10 22:27:02.23 uEixJvyy0.net
書籍「Kaggleで勝つデータ分析の技術」の内容について教えてください。
この書籍のサンプルコード内のコメントについてです。
・第4章「分析コンペ用のクラスやフォルダの構成」サンプルコード
URLリンク(github.com)
・183行目のコメント抜粋
「# 毎回train.csvを読み込むのは効率が悪いため、データに応じて適宜対応するのが望ましい(他メソッドも同様)」
「効率が悪い」というのは、速度の遅さだと思うのですが、
「データに応じて適宜対応」とは、具体的にどんな対応があるのでしょうか?
CSVからデータベース(mysql)などに移しておく?くらいしか思いつかないもので・・・。
もしお分かりになる方見えましたらお願いいたします。

698:デフォルトの名無しさん
21/06/10 22:55:34.82 bFpC+A1+0.net
>>677
毎回読み込むのが効率悪いって意味かと
読み込む必要がないデータは読み込まなくて済む
データを読み込んだ後で変更やデータクリアとかしてなければ再利用できるのでは?

699:デフォルトの名無しさん
21/06/10 22:57:40.78 5/kyY+gFM.net
return pd.read_csv('../input/train.csv')[self.features]
の代わりに
self.xtrain= pd.read_csv('../input/train.csv')[self.features]
するとか

700:デフォルトの名無しさん
21/06/10 23:05:38.45 r65EV/M/0.net
>>677
単純にクロスバリデーションの度に読み込み処理が入ってるからって事でしょ。
メモリ上に保持しとけばいいんじゃないの

701:デフォルトの名無しさん
21/06/11 09:46:57.34 NUljqU+dM.net
kaggleってどれだけ実践的かな
インターンの子にやらせるにしては簡単?

702:デフォルトの名無しさん
21/06/11 10:05:31.38 qE/8skGvM.net
インターンにKaggleをやらせる意味がわからん
ネットで悪評書かれそう

703:デフォルトの名無しさん
21/06/11 10:42:38.59 NUljqU+dM.net
>>682
短期間で目に見える成果を期待できそうな課題、を考えるのって難しくない?

704:デフォルトの名無しさん
21/06/11 10:49:53.11 qE/8skGvM.net
普通にバイトみたいな仕事やらせりゃいいでしょ

705:デフォルトの名無しさん
21/06/11 11:21:10.37 0JaO8x89M.net
大学の講義でSignate使ったことあるしコンペはインターンにちょうど良さそう

706:デフォルトの名無しさん
21/06/11 11:34:53.28 dCia0TSV0.net
期間とか実力とか人数にもよるからなんとも言えん

707:デフォルトの名無しさん
21/06/11 11:41:41.42 xX6jr1DGM.net
>>684
バイトにさせたい仕事もないんだよね
うちに来るのが間違ってるのかも

708:デフォルトの名無しさん
21/06/11 11:47:24.35 dCia0TSV0.net
それならインターン生に何したいのか聞いてそれっぽいことさせてやれば満足して帰るでしょ

709:デフォルトの名無しさん
21/06/11 11:48:31.17 sZI9zEU+0.net
>>678,679,680
ありがとうございました!
ご指摘の通り、サンプルコードではクロスバリデーションのフォルダごとにCSVを再読み込みしていました。

710:デフォルトの名無しさん
21/06/11 12:24:01.91 RiAtHAdm0.net
>>687
Kaggleは自宅でもできるからなぁ
せっかくだから泥臭いデータ抽出とか体験してもらえば?

711:デフォルトの名無しさん
21/06/11 12:31:22.49 tpK55tdN0.net
Darknetでも渡しておけば良いのに

712:デフォルトの名無しさん
21/06/11 13:27:39.05 xX6jr1DGM.net
>>690
なるほどね
汚いデータはある

713:デフォルトの名無しさん
21/06/11 14:58:37.35 LjCJopv7a.net
普段から業務時間の一部を使ってコンペやってるような企業が社員と組ませてコンペやるなら意味あるかもしれないけど
そうでないならインターンでやることか?と思ってしまう

714:デフォルトの名無しさん
21/06/11 15:10:54.60 xX6jr1DGM.net
>>693
もっともだと思う

715:デフォルトの名無しさん
21/06/11 16:32:54.05 lp3aFwk/0.net
バイトにはクソ汚い前処理をやらせるのがいい
SQLとかデータベースとかまともに勉強してないだろうから
その辺の処理が1番良いと思うね
まずはSQLですよ

716:デフォルトの名無しさん
21/06/11 21:02


717::46.31 ID:+OfWEOyd0.net



718:デフォルトの名無しさん
21/06/11 21:48:27.03 ECOAIe/EM.net
>>696
モデル作成はできる学生いくらでもいるから十分バイトでいけるよ
実際うちの会社でも学生バイトに投げたことある
むしろ抽出や前処理のほうが社内システムやドメイン知識が必要で難しいんじゃないかな

719:デフォルトの名無しさん
21/06/14 21:09:17.24 pISFyH/o0.net
多次元データをクラスタリングするとき脳死でtSNEしてDBSCANしてるんだけど他にオススメないですか

720:デフォルトの名無しさん
21/06/15 11:44:37.99 XgfZUr4/0.net
tsneすると、お花みたくなって綺麗だからスコ

721:デフォルトの名無しさん
21/06/15 12:36:02.30 x9SraPsb0.net
可視化するために使われる事が多いのであって
次元削減したら逆に適切な分類が難しくなるんじゃね?
分類するための重要な次元の値が次元削減で他と混在して分類に使えなくなる

722:デフォルトの名無しさん
21/06/15 12:57:04.03 PDoj/QxnM.net
可視化以外に解釈にも使うからなぁ
人間が解釈しやすいカテゴリ分けができるくらいまで次元数落とすのが理想かな?
どんな変数が潜在しているかアタリをつけるのが腕でもある

723:デフォルトの名無しさん
21/06/15 13:03:08.02 x9SraPsb0.net
>>701
自分は解釈しやすくするのは広い意味での可視化、見える化だと思う
可視化という言葉の解釈しだい

724:デフォルトの名無しさん
21/06/16 06:52:37.95 gBvGSg0T0.net
今更ながら青木先生の統計学サイトのPythonライブラリで遊び始めた
とりあえず全機能動かすか

725:デフォルトの名無しさん
21/06/16 17:28:54.92 0b2rYPmpM.net
【新音声入手】親密企業の参入を指示 平井卓也デジタル相に官製談合防止法違反の疑い 週刊文春 [孤高の旅人★]
スレリンク(newsplus板)
松尾豊?

726:デフォルトの名無しさん
21/06/16 20:29:05.96 UIaeb7510.net
松尾なら許す
銀髪インチキ野郎なら許さん

727:デフォルトの名無しさん
21/06/16 23:21:00.05 U8YqP6lJ0.net
松尾さんはそういう役目だろうから仕方ない

728:デフォルトの名無しさん
21/06/17 04:15:49.22 2DOPQDLQa.net
完全に \(^o^)/ オワタ

729:デフォルトの名無しさん
21/06/17 04:29:12.94 5WJyklMZd.net
【新音声入手】親密企業の参入を指示 平井卓也デジタル相に官製談合防止法違反の疑い 週刊文春 ★2
スレリンク(newsplus板)

730:デフォルトの名無しさん
21/06/17 05:36:44.15 Iv+uSbi70.net
>>705
誰?

731:デフォルトの名無しさん
21/06/21 11:41:32.31 X/lwV7ZG0.net
青木氏のサイトのPythonコードはとりあえず200くらい紹介されてたものを動かして使用例なんかも見たが
「じゃあすぐこのデータにふさわしい統計指標を算出出して」っていわれると現状では
30分以内に解決できない理解度だなあ
3時間なら選び出せるか
慣れるのに数ヶ月掛かるな

732:デフォルトの名無しさん
21/06/21 11:48:19.01 .net
前時代的な学び方と言うより他ない

733:デフォルトの名無しさん
21/06/21 12:51:57.23 yTke2BsU0.net
>>709
最近テレビによく出てる宮田さんじゃね

734:デフォルトの名無しさん
21/06/21 18:59:28.26 QJKH6LddM.net
>>712
宮田裕章って人?
初耳~

735:デフォルトの名無しさん
21/06/21 20:20:28.22 yTke2BsU0.net
>>713
たぶん

736:デフォルトの名無しさん
21/06/22 11:57:05.13 366DlQR+0.net
>>714
松尾某と同じく業績はともかくメディア対応が上手いのか


737:な



738:デフォルトの名無しさん
21/06/22 13:50:53.19 VoRU4WHP0.net
風貌はいかにもAIやってますーって感じ

739:デフォルトの名無しさん
21/06/24 14:20:39.68 lHVg0JFw0.net
福島邦彦の記念講演やってる
nhk前所長の発表、聞き取りづらい
モソモソ言ってて分からん

740:デフォルトの名無しさん
21/06/24 14:53:38.55 lHVg0JFw0.net
柳井ってキモいな

741:デフォルトの名無しさん
21/06/25 18:15:12.09 khEKAdT4M.net
三宅陽一郎が論文の賞取ったけど
どうよ?

742:デフォルトの名無しさん
21/06/25 19:15:43.90 .net
アカデミアと縁ないとこにいるくせに表彰の類に物申したがるの良くないよ

743:デフォルトの名無しさん
21/06/25 20:03:31.46 khEKAdT4M.net
これ論文なのん?って印象だったからどうなのかなって

744:デフォルトの名無しさん
21/06/26 08:15:16.06 rSX1uhX7a.net
deeplに遊戯王カードのテキスト読み込ませたらなんか全体的に遊戯王調の翻訳になってしまった
クセの強いデータが混じると全体の精度が落ちるな
クセの強いデータを除外するAIを開発しないと

745:デフォルトの名無しさん
21/06/26 08:30:46.85 lNRjTIPI0.net
なんでそんなこと起きるの?Deeplで。

746:デフォルトの名無しさん
21/06/26 13:25:12.54 6sjjJ5as0.net
三宅 陽一郎という名前は、どこかで見たと思ったけど、
マイケル・ディックハイザー「ゲームプログラマのためのC++」2011 の監修か


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch