【AI】DeepSeekが数学的推論に特化したAIモデルをリリース　国際数学オリンピックで金メダルを取れるレベル [すらいむ★]

【AI】DeepSeekが数学的推論に特化したAIモデルをリリース　国際数学オリンピックで金メダルを取れるレベル [すらいむ★]at SCIENCEPLUS

【AI】DeepSeekが数学的推論に特化したAIモデルをリリース　国際数学オリンピックで金メダルを取れるレベル [すらいむ★] - 暇つぶし2ch1:すらいむ ★
25/11/28 22:50:21.15 RKXlL1zb.net
DeepSeekが数学的推論に特化したAIモデル「DeepSeek-Math-V2」をリリース、国際数学オリンピックで金メダルを取れるレベルの正答率を記録

　DeepSeekが、数学的推論に特化したAIモデル「DeepSeek-Math-V2」を2025年11月27日に公開しました。
　このDeepSeek-Math-V2は定理証明と自己検証機能に重点を置いており、従来の数学AIモデルとは異なり、解答の正確性を追求するだけでなく、推論プロセスの厳密性と完全性も重視しています。

　GitHub - deepseek-ai/DeepSeek-Math-V2
　URLﾘﾝｸ(github.com)

（以下略、続きはソースでご確認ください）

Gigazine 2025年11月28日 10時56分
URLﾘﾝｸ(gigazine.net)

2:名無しのひみつ
25/11/28 23:11:38.46 SYG8PjX4.net
AIのベンチマークテストにパスするためにズルしてたのにそれが専門分野に特化させる発想に繋がるとかたまんねえよ

3:名無しのひみつ
25/11/29 01:04:11.15 JBVOOzwu.net
数学者という職業は終わるのか

4:名無しのひみつ
25/11/29 01:52:51.61 8NpFa1em.net
>>3
問題を与えないと、解かないぞ

5:名無しのひみつ
25/11/29 02:11:17.77 aXd+z4E6.net
数学教師おわた

6:名無しのひみつ
25/11/29 07:09:10.53 Bvg4FSOb.net
>>4

一般人が計算したいときに問題を与えるけれど

全ての数式が出そろえば数学はどうなるのか

7:名無しのひみつ
25/11/29 07:44:52.44 Bvg4FSOb.net
>>1
>>従来の大規模言語モデルは主に最終的な答えが合っているかどうかを報酬として与える「強化学習」によってトレーニングされてきました。しかし、この方法では、答えが偶然合っていても途中の考え方が間違っている場合を見抜くことができません。特に、定理の証明のような高度な数学においては、数値の答えが存在せず、厳密な論理の積み重ねそのものが求められるため、従来の手法だけでは限界がありました。
>>この課題を解決するために採用された技術が、証明を作成する「生成器」と、その証明が正しいかを判定する「検証器」という2つのモデルを協力させるアーキテクチャです。
中略
>>DeepSeek-Math-V2は世界的な数学コンテストで非常に高い成績を収めています。たとえば、2025年の国際数学オリンピック(IMO)では金メダルレベルとなる83.3％の得点率を記録しました。また、カナダ数学オリンピック(CMO)2024では73.8％、アメリカの大学レベルの競技であるPutnam 2024においては98.3％という驚異的なスコアを達成しています。

8:名無しのひみつ
25/12/01 02:20:09.23 uWZTVC4o.net
>>6
全ての数式とか
出そろうとか
なにをもって全体としてるんだよ
神が出そろえばとか言ってるのと同じ
一神教なら出そろうとかそもそもないけどな

9:名無しのひみつ
25/12/01 02:23:41.56 YvHKDYEa.net
>>7
違うぞ
強化学習を強力に採用したのはDeepSeek

強化学習を顕著に取り入れた最初の大規模言語モデルは、2024 年 4 月に公開された DeepSeek-math-7b-RL
このモデルは数学的なタスクでのパフォーマンスが評価され、言語モデルで強化学習を使用する先例

10:名無しのひみつ
25/12/01 02:29:32.38 JLHnHzPX.net
ちなみに、大規模言語モデル（LLM）以前のAIにおける強化学習の最初の注目すべき応用は、DeepMindのAlphaGoのようなシステムの学習でした。AlphaGoは強化学習技術を用いてプロの囲碁棋士に勝利。複雑な意思決定タスクめの強化学習RLの有効性を示す上で極めて重要な役割を果たした。

これが2016年でその後日本語訳のRL本もいろいろでてたよ

その歴史は
Summary of Early Reinforcement Learning AI
AI SYSTEM YEAR APPLICATION NOTABLE ACHIEVEMENT
Skinner Box 1950s Behavioral Psychology Foundation of operant conditioning
Atari Games 2013 Video Game AI Learning to play games from raw pixels
AlphaGo 2016 Board Game AI Defeated a world champion Go player

11:名無しのひみつ
25/12/01 02:33:10.73 JLHnHzPX.net
>>9
んで2024年12月末の
DeepSeek-R1は、強化学習を用いて大規模言語モデル（LLM）の推論能力を強化するモデルであり、構造化された推論プロセスを通じて複雑な問題をより適切に解決することを可能にします。このアプローチは、モデルが思考プロセスを明確に表現することを促すことで、より正確で一貫性のある出力を生成することを可能にします。

12:名無しのひみつ
25/12/01 02:33:23.43 JLHnHzPX.net
DeepSeek-R1における強化学習の概要
DeepSeek-R1は、従来の学習方法から大きく転換し、強化学習（RL）を活用してAI機能を強化しています。このアプローチにより、モデルは大規模なラベル付きデータセットのみに頼るのではなく、インタラクションとフィードバックを通じて学習することが可能になります。

DeepSeek-R1の強化学習の主な特徴
学習方法：DeepSeek-R1は2つのモデルによる学習プロセスを採用しています。1つ目のモデルはRLを通して学習し、推論の痕跡を生成して2つ目のモデルに伝え、2つ目のモデルは出力を洗練させます。
創発的推論：このモデルは、自己修正や拡張思考連鎖といった高度な推論機能を、大規模な教師あり学習なしに実現します。
動的適応：RLにより、DeepSeek-R1は環境に適応し学習することで、より自律的で洗練された意思決定を促進します。
強化学習の利点
データ依存度の低減：大規模データセットへの依存を最小限に抑えることで、DeepSeek-R1はデータのプライバシーとバイアスに関する倫理的懸念に対処します。
トレーニング効率：強化学習アプローチは、データの量ではなく質を重視し、よりスマートな計算を重視します。
パフォーマンスの同等性：DeepSeek-R1は、独自モデルに匹敵する性能を示しており、オープンソースAIが革新的なトレーニング手法によって高いパフォーマンスを実現できることを証明しています。
強化学習と高度な計算戦略を組み合わせることで、DeepSeek-R1は進化するAI開発環境におけるリーダーとしての地位を確立しています。

13:名無しのひみつ
25/12/01 02:34:15.10 JLHnHzPX.net
でそれ前のGPTとかGeminiとかは
ラベリングとファインチューニングだったの

14:名無しのひみつ
25/12/01 02:40:36.97 t6+vA+8X.net
さらにDeepSeek R1はMoEも提唱かつ実装

Mixture of Experts（MoE）は、AIモデルを入力データの異なる側面に特化した個別のサブネットワーク（「エキスパート」）に分割する機械学習手法です。このアプローチにより、モデルは特定の入力に対して関連するエキスパートのみをアクティブ化することでタスクを効率的に処理し、パフォーマンスを向上させながら計算コストを削減できます。

中に専門分野ごとに別のLLMを用意しておいて切り替えて使う

中身を論文で明らかにしたからすぐみんながマネできた

日本のように技術をコピーさせないなど言わず論文で明らかにした

15:名無しのひみつ
25/12/01 03:07:40.18 Ysly3aQJ.net
つーても中華AIじゃ怖くて使えんだろ。

16:名無しのひみつ
25/12/01 03:12:39.41 BxlO944w.net
DeepSeek-Math-V2が数学オリンピックの金メダルレベルということは、数学オリンピックの問題というのは、過去の方法の類似で解ける問題ということか。

17:名無しのひみつ
25/12/01 03:14:01.52 BxlO944w.net
それでは、数学者が相手にしている、過去の類似では解けない問題に対しては、DeepSeek-Math-V2は無力ということか。

18:過去ログ ★
[過去ログ]
■ このスレッドは過去ログ倉庫に格納されています