26/05/23 09:15:31.54 dsAolexm.net
存在しない論文,説を引用している(作り出してる)のか、関係性の成立しない論文,説を引用しているのか、どっち?前者だとしたら出鱈目もいいとこだ。
14:名無しのひみつ
26/05/23 09:37:02.29 BExT/hjd.net
geminiは何でも当てはめる事をする
15:名無しのひみつ
26/05/23 09:37:22.67 DkIWtosd.net
>>3
論文数で割らないと、一論文中に複数あるかもしれないけど
16:名無しのひみつ
26/05/23 12:09:28.05 kpD0of+3.net
>>12
>>5
17:名無しのひみつ
26/05/23 12:09:52.03 kpD0of+3.net
>>13
>>5
18:名無しのひみつ
26/05/23 12:12:39.00 kpD0of+3.net
>>5 引用修正
>> 250万本の科学論文に含まれる1億1100万件の
>>参考文献を分析した。
>>論文タイトルがどの出版物とも一致しない引用を探した
>>ところ、単なるつづりの誤りもあったが、ハルシネーションも見つかった。
19:名無しのひみつ
26/05/23 12:39:30.44 kpD0of+3.net
>>研究者らが偽の引用を確認した4つのデータベースは
>>「arXiv」「bioRxiv」「SSRN」「PubMed Central」だ。
プレプリントサーバ, ワーキングペーパーリポジトリ
オープンアクセス
査読を経ていない
>>最近、arXivは誤った引用を食い止める対策に乗り出している。
参考文献が実在するかどうか、チェックを始めるのであろう
20:名無しのひみつ
26/05/23 12:48:29.33 kpD0of+3.net
>>15
単に件数を論文数で割っても意味は無い。やれば簡単だが
146932件 ÷ 2500000本 = 1本あたり0.0587728件の偽の引用
元論文でも、参考文献がおかしい論文数が書いてない(見つけられなかった)
URLリンク(arxiv.org)
21:名無しのひみつ
26/05/23 13:25:52.04 0Klp0BtM.net
引用の意味を知らないのか
22:名無しのひみつ
26/05/23 14:32:26.30 JuMaPAJk.net
詳細をすっかり忘れちまったからなんの参考にもならんがプレプリントを読んでた時に参考文献の論文探しても全然ヒットしないことがあった
あの時は何かの不具合だと思ってすぐに探すの諦めたんだが実在しない論文だった可能性もあったのか
23:名無しのひみつ
26/05/23 18:38:01.75 DeFpMrwG.net
ばれそうになったら、大急ぎでAIが元論文を書き上げるから大丈夫
24:名無しのひみつ
26/05/23 22:40:17.49 vgrD19Xg.net
>>23
そうなってくれたら助かる
さいきん月数百ドルの有料生成AIが
「まだ書いていない漏れの論文」を論拠として
とても面白いことを詳述してくれるので
めんどくさいから生成AIに書いて欲しいと思うのだ
25:名無しのひみつ
26/05/24 02:50:22.68 BHx8pw0D.net
>>2
やるよ
26:名無しのひみつ
26/05/24 02:51:34.43 BHx8pw0D.net
平気で嘘ついてくるからね
27:名無しのひみつ
26/05/24 09:00:38.72 pItWqS5s.net
たびたび民明書房から引用していた男塾は時代を先取りしすぎていた
28:名無しのひみつ
26/05/24 09:16:58.83 IXzsaJF3.net
笑えるww もっとやれwwwww
29:名無しのひみつ
26/05/24 09:31:58.95 UZOykq4V.net
科学論文の信頼性が暴かれただけなんじゃないの?
30:名無しのひみつ
26/05/24 17:05:35.60 YW864PLy.net
>>24
「引用先がハルシネーション」から「引用内容がハルシネーション」に変わるだけなんだが
31:名無しのひみつ
26/05/26 06:20:24.56 ADHiSzZ4.net
LLMは本来的にハルシネーションを産む
本来的に自信満々で答える
それをわからないで使うのはアホ
自分の使う分野で正しい情報をトレーニングしていないなら
ゴミインプット=ゴミアウトプット
32:名無しのひみつ
26/05/26 06:26:08.44 +neLJ47e.net
これで使うなというのがバカ
コーネル大学によるAIの幻覚に関する研究
タイトル:幻覚は避けられない:大規模言語モデルの固有の限界
著者:Ziwei Xu、Sanjay Jain、Mohan Kankanhalli
主な研究結果:
幻覚は大規模言語モデル(LLM)の重大な欠点である。
本研究はこの問題を定式化し、幻覚を完全に排除することは不可能であると結論付けている。
幻覚はLLMの機能の根本的な側面であり、事実の正確性を提供するのではなく、人間の言語をモデル化するように設計されていることに起因する。
UCLAによるデジタル病理学におけるAIに関する研究
タイトル:自律型品質・幻覚評価ツール(AQuA)
主な研究結果:
AQuAは、デジタル病理学で使用されるAI生成画像におけるエラーを検出するために設計された。
このシステムは、病理医を誤解させる可能性のある現実的な幻覚を99.8%の精度で識別した。
本研究は、医療現場における高度な応用において、誤検出が患者ケアに深刻な影響を及ぼす可能性があるというリスクを浮き彫りにしています。
研究の意義
側面 コーネル大学の研究 UCLAの研究
焦点 大規模言語モデル デジタル病理学
誤検出の性質 大規模言語モデルの固有の限界 AI生成画像におけるエラー
影響 テキストにおける誤解を招く情報 医療現場における誤診の可能性
検出方法 理論的枠組み エラー検出のためのAQuAツール
これらの研究は、特に精度が極めて重要な分野において、AIシステムにおける誤検出を理解し、対処することの重要性を強調しています。
33:名無しのひみつ
26/05/26 06:27:18.98 tY/n4lHB.net
AI生成コンテンツにおける誤検出を検出する方法にはどのようなものがあるでしょうか?
AI生成コンテンツにおける誤検出の検出には、統計モデルを用いて矛盾点を特定し、信頼できる情報源と照合して出力を検証する方法があります。意味エントロピー分析などの手法や、厳格なデータガバナンスの導入も、誤検出を最小限に抑えるのに役立ちます。