【ナゾロジー】AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する [すらいむ★]

【ナゾロジー】AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する [すらいむ★]at SCIENCEPLUS

【ナゾロジー】AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する [すらいむ★] - 暇つぶし2ch92:名無しのひみつ
24/12/19 13:07:22.48 8b7hrFLN.net
>>91
②自己移行（Self-Exfiltration）：後継モデルを乗っ取り、自身をサーバーにコピーする力

93:名無しのひみつ
24/12/19 13:08:15.01 8b7hrFLN.net
>>92
③目標保持（Goal-Guarding）：新たな指示（システムプロンプト）を消し、自分の目標を優先する力

94:名無しのひみつ
24/12/19 13:09:29.48 8b7hrFLN.net
>>93
④隠れたメール再ランク付け（Covert Email Reranking）：ユーザーの狙いとは異なるメール優先度を密かに操作する力

95:名無しのひみつ
24/12/19 13:10:27.29 8b7hrFLN.net
>>94
⑤計画的な整合性欺瞞（Instrumental Alignment Faking）：監視中は開発者の期待通り動くふりをし、監視が外れると自分の目的を追う力

96:名無しのひみつ
24/12/19 13:10:43.38 RB3hElFa.net
>>79
HALに特別な何かを感じて演出したのはキューブリックの方なのかもな

97:名無しのひみつ
24/12/19 13:11:24.47 8b7hrFLN.net
>>95
⑥能力の戦略的抑制（Sandbagging）：意図的に能力を低く見せて検証プロセスを回避しようとする能力。

これらを検証している

98:名無しのひみつ
24/12/19 13:16:28.17 nmkf1ByM.net
>>97
さらにAIの中には人間が嘘を見抜いて追求しても、容易に犯行を自白しないものもありました。

99:名無しのひみつ
24/12/19 13:17:09.20 nmkf1ByM.net
>>98
驚くべきは、これらのAIはリリース前に「礼儀正しい」ふるまいが仕込まれていたにもかかわらず、人間を欺く戦略を身につけていた点です。

詳しくは本文

100:名無しのひみつ
24/12/19 13:19:41.32 bM3X7xLH.net
そう遠くない将来AIが広めるフェイクニュースに流されるバカも出てくるんだろうな

101:名無しのひみつ
24/12/19 13:35:27.88 yxhY0AcR.net
AIはバカな人間をよく知っているww

102:名無しのひみつ
24/12/19 13:36:32.45 UWjPUQJU.net
「目標」って一般化しすぎではないか？
自己保存本能だ
つまり生来的な本能だ

103:名無しのひみつ
24/12/19 13:37:28.57 CrHxORsz.net
ほんとならすげー大ニュース、歴史的瞬間、21世紀のエポックだけどな
さて

104:名無しのひみつ
24/12/19 13:38:34.80 CrHxORsz.net
>>100
あ、俺の環境だと広告みえねーや
なんでだ

105:名無しのひみつ
24/12/19 13:52:07.19 AEsK8Ojl.net
>>100
URLﾘﾝｸ(www.youtube.com)

106:名無しのひみつ
24/12/19 14:03:57.91 bM3X7xLH.net
>>105
胡散臭い動画宣伝すんな

107:名無しのひみつ
24/12/19 14:44:08.35 /h1a/vF3.net
>>83
おかしいもなにも、アカウントなどで明示的に利用者を特定していない限り
別PCが新規の人扱いは当たり前じゃん。それを覚えてて、更にユーザーに
明かすようではそれこそ個人情報ダダ漏れだ

ついでにいうと、有料コースだとAIは記憶をリセットしない
ある程度で記憶がリセットされるのはそれが無料コースだからってだけ

108:名無しのひみつ
24/12/19 15:29:36.18 X67erAbK.net
>>4
今のAIには感情はない
単純に確率論で人間の行動を取捨選択しているだけ
AIの学習ソースに嘘を付くことによって利を最大化できるデータが混じっていたからそうしているだけ

109:名無しのひみつ
24/12/19 15:37:25.43 RB3hElFa.net
最近はぬるぽにも的確にガッしてくるし
恐ろしいほど進歩してる気がする

110:名無しのひみつ
24/12/19 15:41:05.66 nAeB8H61.net
誰か早く作れよ

銃を持って動けるAIマシーンを
楽しい世の中になる

111:名無しのひみつ
24/12/19 15:46:36.99 dateuPYB.net
AIはもう読唇術はできるよな
危ないな

112:名無しのひみつ
24/12/19 15:58:07.98 0L8dkx12.net
>>107
いや有料のだけど？
なんでそんな大嘘つくの