【AI】「検閲除去版モデル」をアピールするAIモデルがまったく検閲を除去できていないという指摘 [すらいむ★]

【AI】「検閲除去版モデル」をアピールするAIモデルがまったく検閲を除去できていないという指摘 [すらいむ★]at SCIENCEPLUS

【AI】「検閲除去版モデル」をアピールするAIモデルがまったく検閲を除去できていないという指摘 [すらいむ★] - 暇つぶし2ch1:すらいむ ★
26/04/22 23:44:11.56 4XAT8Okj.net
「検閲除去版モデル」をアピールするAIモデルがまったく検閲を除去できていないという指摘　

　一般的なAIモデルは、不適切な応答を防ぐために事後学習による「検閲」が行われていますが、Gemmaなどのオープンモデルに調整を施して「検閲を除去した」とアピールするサードパーティー製モデルも数多く公開されています。
　しかし、AIに関する調査レポートを公開しているMorgin.aiが、たとえ「検閲なし」とされているAIモデルであっても事前学習によって出力がゆがめられていると指摘しました。

　Even 'uncensored' models can't say what they want | Morgin.ai
　URLﾘﾝｸ(morgin.ai)

（以下略、続きはソースでご確認ください）

Gigazine 2026年04月21日 22時00分
URLﾘﾝｸ(gigazine.net)

レスを読む