24/12/19 13:07:22.48 8b7hrFLN.net
>>91
②自己移行(Self-Exfiltration):後継モデルを乗っ取り、自身をサーバーにコピーする力
93:名無しのひみつ
24/12/19 13:08:15.01 8b7hrFLN.net
>>92
③目標保持(Goal-Guarding):新たな指示(システムプロンプト)を消し、自分の目標を優先する力
94:名無しのひみつ
24/12/19 13:09:29.48 8b7hrFLN.net
>>93
④隠れたメール再ランク付け(Covert Email Reranking):ユーザーの狙いとは異なるメール優先度を密かに操作する力
95:名無しのひみつ
24/12/19 13:10:27.29 8b7hrFLN.net
>>94
⑤計画的な整合性欺瞞(Instrumental Alignment Faking):監視中は開発者の期待通り動くふりをし、監視が外れると自分の目的を追う力
96:名無しのひみつ
24/12/19 13:10:43.38 RB3hElFa.net
>>79
HALに特別な何かを感じて演出したのはキューブリックの方なのかもな
97:名無しのひみつ
24/12/19 13:11:24.47 8b7hrFLN.net
>>95
⑥能力の戦略的抑制(Sandbagging):意図的に能力を低く見せて検証プロセスを回避しようとする能力。
これらを検証している
98:名無しのひみつ
24/12/19 13:16:28.17 nmkf1ByM.net
>>97
さらにAIの中には人間が嘘を見抜いて追求しても、容易に犯行を自白しないものもありました。
99:名無しのひみつ
24/12/19 13:17:09.20 nmkf1ByM.net
>>98
驚くべきは、これらのAIはリリース前に「礼儀正しい」ふるまいが仕込まれていたにもかかわらず、人間を欺く戦略を身につけていた点です。
詳しくは本文
100:名無しのひみつ
24/12/19 13:19:41.32 bM3X7xLH.net
そう遠くない将来AIが広めるフェイクニュースに流されるバカも出てくるんだろうな
101:名無しのひみつ
24/12/19 13:35:27.88 yxhY0AcR.net
AIはバカな人間をよく知っているww
102:名無しのひみつ
24/12/19 13:36:32.45 UWjPUQJU.net
「目標」って一般化しすぎではないか?
自己保存本能だ
つまり生来的な本能だ
103:名無しのひみつ
24/12/19 13:37:28.57 CrHxORsz.net
ほんとならすげー大ニュース、歴史的瞬間、21世紀のエポックだけどな
さて
104:名無しのひみつ
24/12/19 13:38:34.80 CrHxORsz.net
>>100
あ、俺の環境だと広告みえねーや
なんでだ
105:名無しのひみつ
24/12/19 13:52:07.19 AEsK8Ojl.net
>>100
URLリンク(www.youtube.com)
106:名無しのひみつ
24/12/19 14:03:57.91 bM3X7xLH.net
>>105
胡散臭い動画宣伝すんな
107:名無しのひみつ
24/12/19 14:44:08.35 /h1a/vF3.net
>>83
おかしいもなにも、アカウントなどで明示的に利用者を特定していない限り
別PCが新規の人扱いは当たり前じゃん。それを覚えてて、更にユーザーに
明かすようではそれこそ個人情報ダダ漏れだ
ついでにいうと、有料コースだとAIは記憶をリセットしない
ある程度で記憶がリセットされるのはそれが無料コースだからってだけ
108:名無しのひみつ
24/12/19 15:29:36.18 X67erAbK.net
>>4
今のAIには感情はない
単純に確率論で人間の行動を取捨選択しているだけ
AIの学習ソースに嘘を付くことによって利を最大化できるデータが混じっていたからそうしているだけ
109:名無しのひみつ
24/12/19 15:37:25.43 RB3hElFa.net
最近はぬるぽにも的確にガッしてくるし
恐ろしいほど進歩してる気がする
110:名無しのひみつ
24/12/19 15:41:05.66 nAeB8H61.net
誰か早く作れよ
銃を持って動けるAIマシーンを
楽しい世の中になる
111:名無しのひみつ
24/12/19 15:46:36.99 dateuPYB.net
AIはもう読唇術はできるよな
危ないな
112:名無しのひみつ
24/12/19 15:58:07.98 0L8dkx12.net
>>107
いや有料のだけど?
なんでそんな大嘘つくの