GoogleがGemini 3 Deep Thinkをベースとしたエージェント「Aletheia」で数学の自律的な研究に成功したとアピール [すらいむ★]

GoogleがGemini 3 Deep Thinkをベースとしたエージェント「Aletheia」で数学の自律的な研究に成功したとアピール [すらいむ★]at SCIENCEPLUS

GoogleがGemini 3 Deep Thinkをベースとしたエージェント「Aletheia」で数学の自律的な研究に成功したとアピール [すらいむ★] - 暇つぶし2ch1:すらいむ ★
26/02/12 22:58:59.55 BSbcpwx/.net
GoogleがGemini 3 Deep Thinkをベースとしたエージェント「Aletheia」で数学の自律的な研究に成功したとアピール

　Google DeepMindが、Geminiの高度な推論機能「Deep Think」を活用した数学研究エージェント「Aletheia」を開発し、専門的な数学研究において自律的な成果を上げたと発表しました。
　このエージェントは自然言語を用いて解答の生成、検証、修正をエンドツーエンドで繰り返す能力を持ち、国際数学オリンピック(IMO)レベルの難問から博士課程レベルの演習、さらには実際の学術研究における未解決問題の解決まで、多岐にわたるマイルストーンを達成しています。

　Gemini Deep Think: Redefining the Future of Scientific Research — Google DeepMind
　URLﾘﾝｸ(deepmind.google)

（以下略、続きはソースでご確認ください）

Gigazine 2026年02月12日 15時30分
URLﾘﾝｸ(gigazine.net)

2:名無しのひみつ
26/02/13 00:50:43.22 warxKi31.net
コピペマシーンから新しい発見をする段階に入った

3:名無しのひみつ
26/02/13 06:43:43.53 blhdl1cf.net
>>1の本文

Aletheiaは、非常に困難な推論課題を解決するために開発されたGemini 3 Deep Thinkを基盤としています。このシステムは解答を生成する「Generator」、その正誤を判定する「Verifier」、そして微修正を行う「Reviser」という3つのサブエージェントが相互に作用して動作します。
従来の大型言語モデルは専門的なトピックにおいて幻覚(ハルシネーション)を起こしやすく、不正確な情報を出力する課題がありましたが、AletheiaはGoogle検索などのツールを駆使して文献をナビゲートすることで、根拠のない引用や計算ミスを大幅に削減しています。また、推論時間に割り当てる計算量を増やすことで精度が向上するという「スケーリング則」が、競技数学のみならず博士レベルの数学演習においても有効であることが示されました。
ベンチマーク評価では、AletheiaはIMO-Proof Bench Advancedで95.1％という最高精度を記録し、博士レベルの演習を集めたFutureMath Basicでも優れた性能を示したとGoogle DeepMindはアピールしています。
Aletheiaは、人間による介入なしに算術幾何学の構造定数である「eigenweights」を計算し、その結果をもとにした研究論文を完全に自律して生成するという画期的な成果を上げたとのこと。この過程で、エージェントは代数的組合せ論の手法を用いるなど、独創的な解決策を提示したとGoogle DeepMindは報告しています。
★また、独立集合の境界を証明する研究では、Aletheiaが「大きな絵」となる戦略を提案し、人間がそれを詳細に記述するという逆転した形式の共同研究が行われました。さらに、エルデシュ予想データベースにある700の未解決問題に対する大規模な評価では、4つの未解決問題を自律的に解決し、そのうちの一つはさらなる一般化を経て独立した論文へと繋がったとのこと。
★さらにGoogle DeepMindは、AIが生成した数学的成果を適切に評価するために、自動車の自動運転レベルになぞらえた「数学研究自律レベル」という分類法を提唱しています。この枠組みでは、AIの寄与度を「主に人間(Human with secondary AI input)」「人間とAIの共同(Human-AI Collaboration)」「本質的に自律(Essentially Autonomous)」の3段階に、数学的な重要性をレベル0の「無視できる新規性(Negligible Novelty)」からレベル4の「画期的な突破口(Landmark Breakthrough)」までの5段階に区分しており、透明性の高い情報共有を目指しています。Google DeepMindは先述の研究成果を最高でレベル2の「公表可能な研究(Publishable Research)」に分類しており、すでに査読に提出しています。
★Google DeepMindによれば、Gemini Deep Thinkの応用範囲は数学に留まらず、物理学や計算機科学の難問解決にも及んでいるとのこと。これらの結果はAIが膨大な知識を統合して異なる学問分野の橋渡しをすることで、人間の科学者にとって強力な伴走者になり得ることを示唆しているとGoogle DeepMindは述べました。
なお、Aletheiaで各論文を生成するために入力されたプロンプトと出力はGitHubで公開されています。
superhuman/aletheia at main · google-deepmind/superhuman · GitHub

4:名無しのひみつ
26/02/13 15:05:57.42 blhdl1cf.net
Gemini 3 Deep Thinkのアップグレード版が登場、知性を測定するARC-AGIで驚異的な記録を更新
2026年02月13日 13時00分
URLﾘﾝｸ(gigazine.net)
GoogleがGemini 3の推論能力強化版である「Gemini 3 Deep Think」のアップデートを実施したことを2026年2月12日に発表しました。アップデートは研究者と緊密に連携して困難な研究課題に取り組むことに焦点を当てたもので、各種ベンチマークで驚異的なスコアを記録しています。
Gemini 3 Deep ThinkはAIの知能を測定するベンチマーク「ARC-AGI-2」で高いスコアを記録しました。以下は左が2025年12月の発表時におけるGemini 3 Deep ThinkのARC-AGI-2スコアで、この時点で45％と他の主要モデルと比較してかなり高くなっていました。そして、アップグレード版では以下の画像右のグラフにあるように、ARC-AGI-2スコアが84.6％と驚異的な数値まで上昇しています。
そのほか、AIの知識の限界をテストするために設計されたベンチマーク「Humanity's Last Exam」では48.4％、マルチモーダルLLM向けテスト「MMMU-Pro」では81.5％と、いずれも高い水準を記録しています。さらに、競技プログラムベンチマークの「Codefoces」では、3455と驚異的な数値を達成しました。
Gemini 3 Deep Thinkは、数学や競技コーディングに加え、化学や物理学といった幅広い科学分野で優れた性能を発揮します。Googleによると、アップデートされたDeep Thinkモードは2025年国際物理オリンピックおよび化学オリンピックの筆記試験で金メダルレベルの成績を収めているとのこと。また、高度な理論物理学の指標である「CMTベンチマーク」で50.5％のスコアを達成し、高度な理論物理学における熟達具合も示されています。
GoogleはGemini 3 Deep Thinkが実際の科学研究に役立っていることをアピールしています。以下はデューク大学で新しい半導体材料を研究するラボにおいてGemini 3 Deep Thinkが活用されている様子。半導体の材料の潜在的発見を目指して、複雑な結晶成長のための製造方法を最適化するためにGemini 3 Deep Thinkが利用されており、従来の方法では達成が困難だった正確な目標値を達成することができたとのこと。
また、ラトガース大学の数学者であるリサ・カーボン氏は、既存の学習データがほとんどない分野の研究において、Gemini 3 Deep Thinkを用いて高度に技術的な数学論文の査読を行いました。これにより、人間の査読では見過ごされていた論理的欠陥を的確に特定することができたと報告しています。
アップデートされたGemini 3 Deep Thinkは、記事作成時点ではGoogle AI Ultraの加入者向けに展開されています。また、一部の研究者、エンジニア、企業に対してGemini API経由でGemini 3 Deep Thinkを利用できる早期アクセスプログラムが提供されています。

5:名無しのひみつ
26/02/14 03:02:47.95 QkbRZ8jh.net
どしてバカジン記事とか載せるんだ
英語のバカじんでもなく
大元の大元にしろよ

6:名無しのひみつ
26/02/14 03:05:40.53 QrVMuob2.net
URLﾘﾝｸ(deepmind.google)

February 11, 2026
Research
Accelerating Mathematical and Scientific Discovery with Gemini Deep Think
Thang Luong and Vahab Mirrokni

2026年2月11日
研究
Gemini Deep Thinkによる数学的・科学的発見の加速
Thang Luong、Vahab Mirrokni

Listen to article 10 minutes

Under direction from expert mathematicians and scientists, Gemini Deep Think is solving professional research problems across mathematics, physics, and computer science
In the summer of 2025, an advanced version of Gemini Deep Think achieved Gold-medal standard at the International Mathematics Olympiad (IMO) and later, an updated version, obtained similar results at the International Collegiate Programming Contest. These results demonstrated the model could reason through some of the most challenging math and programming problems designed for students. Since then, Gemini Deep Think mode has moved into science, engineering and enterprise workflows to tackle more complex, open-ended challenges.
In the last week, our teams published two papers (1, 2) detailing a cross-disciplinary effort to solve professional research problems using Gemini Deep Think mode. These results stem from deep collaboration between mathematicians, physicists, and computer scientists.
The Frontier of Pure Mathematics
Unlike IMO problems, research-level mathematics requires advanced techniques from vast literature. While foundation models have large knowledge bases, data scarcity often leads to superficial understanding and hallucinations in advanced subjects.
To solve this, we built a math research agent (internally codenamed Aletheia), powered by Gemini Deep Think mode. It features a natural language verifier to identify flaws in candidate solutions and enable an iterative process of generating and revising solutions. Crucially, this agent can admit failure to solve a problem, a key feature that improved the efficiency for researchers.
Additionally, the research agent uses Google Search and web browsing to navigate complex research, preventing spurious citations and computational inaccuracies when synthesizing published literature.

7:名無しのひみつ
26/02/14 03:07:01.38 QrVMuob2.net
Overview of Aletheia, a math research agent powered by Deep Think that can iteratively generate, verify, and revise for research-level math problems.

Since achieving IMO Gold-medal standard in July 2025, Gemini Deep Think has progressed rapidly, scoring up to 90% on the IMO-ProofBench Advanced test as inference-time compute scales. We demonstrated that the scaling law continues to hold as we progress beyond Olympiad level into PhD-level exercises (per our internal FutureMath Basic benchmark). Notably, Aletheia demonstrated that higher reasoning quality can be achieved at a lower inference-time compute.

8:名無しのひみつ
26/02/14 03:24:13.01 ergAdEvr.net
本人たちのペーパー
URLﾘﾝｸ(arxiv.org)
やってるひとの名前が大事
日本の研究室のような最初に教授の名前は来ない
ノーベル賞のCEOデミスは最後の方にいるだろ？

arXiv:2602.10177 (cs)
[Submitted on 10 Feb 2026 (v1), last revised 12 Feb 2026 (this version, v2)]
Towards Autonomous Mathematics Research
Tony Feng, Trieu H. Trinh, Garrett Bingham,
Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung,
Joonkyung Lee, Carlo Pagano, Sang-hyun Kim,
Federico Pasqualotto, Sergei Gukov,
Jonathan N. Lee, Junsu Kim,
Kaiying Hou, Golnaz Ghiasi, Yi Tay,
YaGuang Li, Chenkai Kuang,
Yuan Liu, Hanzhao Lin,
Evan Zheran Liu, Nigamaa Nayakanti,
Xiaomeng Yang, Heng-Tze Cheng,
Demis Hassabis,
Koray Kavukcuoglu,
Quoc V. Le,
Thang Luong

View PDF
HTML (experimental)
Recent advances in foundational models have yielded reasoning systems capable of achieving a gold-medal standard at the International Mathematical Olympiad. The transition from competition-level problem-solving to professional research, however, requires navigating vast literature and constructing long-horizon proofs. In this work, we introduce Aletheia, a math research agent that iteratively generates, verifies, and revises solutions end-to-end in natural language. Specifically, Aletheia is powered by an advanced version of Gemini Deep Think for challenging reasoning problems, a novel inference-time scaling law that extends beyond Olympiad-level problems, and intensive tool use to navigate the complexities of mathematical research.
We demonstrate the capability of Aletheia from Olympiad problems to PhD-level exercises and most notably, through several distinct milestones in AI-assisted mathematics research: (a) a research paper (Feng26) generated by AI without any human intervention in calculating certain structure constants in arithmetic geometry called eigenweights; (b) a research paper (LeeSeo26) demonstrating human-AI collaboration in proving bounds on systems of interacting particles called independent sets; and (c) an extensive semi-autonomous evaluation (Feng et al., 2026a) of 700 open problems on Bloom's Erdos Conjectures database, including autonomous solutions to four open questions.
In order to help the public better understand the developments pertaining to AI and mathematics, we suggest quantifying standard levels of autonomy and novelty of AI-assisted results, as well as propose a novel concept of human-AI interaction cards for transparency. We conclude with reflections on human-AI collaboration in mathematics and share all prompts as well as model outputs at this https URL.
Comments: 35 pages. Accompanied blog post this https URL
Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Computation and Language (cs.CL); Computers and Society (cs.CY)
Cite as: arXiv:2602.10177 [cs.LG]
(or arXiv:2602.10177v2 [cs.LG] for this version)

URLﾘﾝｸ(doi.org)
Focus to learn more

9:名無しのひみつ
26/02/14 03:26:18.57 ergAdEvr.net
次に本人たちのGitHub
URLﾘﾝｸ(github.com)

10:名無しのひみつ
26/02/14 03:30:53.91 e3Z+afK+.net
>>1
先ずはAIデータセンターの消費電力の問題を早く解決しろよ

11:名無しのひみつ
26/02/14 03:31:03.65 ozCIAkTo.net
ところでみなさん
Googleが100年社債発行するって話で各所で話題
なんて方がIMOより身近な話題じゃないのか？

なんだろ100年社債って？
識者いわく「これはペンションの壁に飾っておくトロフィーのようなものです。2026年発行というのが、ああこの年はAIバブルでわいてたなあ、と懐かしむための、お金持ちの」

12:名無しのひみつ
26/02/14 03:41:28.97 ozCIAkTo.net
デミスは電力問題も1番の取り組みしてる
フュージョンだ
ディープマインドフュージョンは
2022年9月
deepmind.google/blog/accelerating-fusion-science-through-learned-plasma-control/
2025年10月
deepmind.google/blog/bringing-ai-to-the-next-generation-of-fusion-energy/

実は2022年のChatGPTショックのGoogleはコードレッド発令して2023年にそれまで別々だったAI開発を統合
Google自身のGoogle AI（元Google Brain)ここがトランスフォーマーやTensorFlowつまりTPUやってたところでそれとアルファベットが買収したアルファGOのGoogle DeepMindをGoogle DeepMind側に合体
デミスが全部責任負ったからフュージョンは少しの間力抜いてた
AIが火がついてむしろフュージョンが注目されてる
デミス曰くこれが実現したら問題が全て解消するとまで言い切る

13:名無しのひみつ
26/02/14 03:46:47.99 DsNg/FD0.net
DeepMindがやってるフュージョンは

Energy startup Commonwealth Fusion Systems (CFS) said Thursday it’s working with Google’s DeepMind division to fine tune — and even improve — the operation of its forthcoming Sparc reactor using AI.

techcrunch.com/2025/10/16/the-real-reason-google-deepmind-is-working-with-a-fusion-energy-startup/

14:名無しのひみつ
26/02/14 03:48:47.58 DsNg/FD0.net
Commonwealth Fusion Systems partners with Google DeepMind
Wed, Oct 22, 2025, 11:30PMNuclear News
Google DeepMind—Google’s artificial intelligence development subsidiary—recently announced a new partnership with fusion start-up Commonwealth Fusion Systems. The goal of this collaboration is to leverage AI to both advance plasma simulation and discover novel control strategies, ultimately accelerating CFS’s timeline to deliver commercial fusion to the grid.

アメリカニュークリアソサエティ
URLﾘﾝｸ(www.ans.org)

15:名無しのひみつ
26/02/14 06:57:56.70 grSylhix.net
>>1を使用して科学の進歩速度をさらに上げよう！

音波　電波　レーザー　攻撃は存在し無い！
脳の病か霊的存在によるものだと早く決着をつけよう

陰謀論にハマった恋人は「そこにいるのに、もう別人」だった
公開日2026.02.11 18:30:38 WEDNESDAY
URLﾘﾝｸ(nazology.kusuguru.co.jp)
>>コラム：なぜ陰謀論を信じる人には議論が通じないのか？
>>「ちゃんとしたデータを見せれば、さすがにわかってくれるはず」そう信じてニュースや論文をプリントして持っていったのに、返ってくるのは「それは支配側のメディアだ」「その専門家も買収されてる」─陰謀論を信じる人を相手にするとそんな展開が決まって繰り返されます。では、なぜこんなことが起きるのでしょうか。ポイントは、陰謀論が単なる一つの意見ではなく、「世界の見え方ぜんぶを支える土台」になってしまっていることです。
>>ふつう私たちは、何か新しい情報に出会うと、「本当かな？」と問い直しながら、少しずつ考えを調整していきます。ところが陰謀論に深くはまった人は、その逆の動きをしがちです。自分の信じている物語に合う情報だけを集め、合わない情報は「ウソ」「でっち上げ」「買収された専門家」として片づけてしまいます。このように、事実そのものが届かないのではなく、「届いた瞬間に別の意味に翻訳されてしまう」ため、外からの議論がほとんど効果を持ちにくくなります。関連研究ではこれを「ラビットホール症候群」、つまり、
>>陰謀論の“穴”に落ちたあと、信念がどんどん加速し、外からの情報を受けつけにくくなる状態として説明しています。
>>もう一つ大きいのは、陰謀論がその人のアイデンティティ（自分らしさ）とくっついてしまうことです。「自分は真実を知っている側だ」「自分は目覚めた人間だ」というイメージに、強くプライドを感じるようになると、それを手放すことは「ただ意見を変える」のではなく、「今までの自分を否定する」ことになります。
教育は陰謀論から保護するが、ナルシストではその効果が相殺される
2026.01.23 FRI
nazology.kusuguru.co.jp/archives/190848
陰謀論を信じやすくなる「社会条件」が明らかに
2025.12.18 THU
nazology.kusuguru.co.jp/archives/189487
陰謀論を信じる人は脳内の情報処理が異なると判明
2025.09.02 TUE
nazology.kusuguru.co.jp/archives/184417
知性にも精神にも問題のない人が突然”陰謀論に目覚める”理由
2025.08.30 SAT
nazology.kusuguru.co.jp/archives/184075
陰謀論を信じる人々によって家庭崩壊が起きている
2025.06.02 MON
nazology.kusuguru.co.jp/archives/178762
陰謀論者になりやすい人には「ある生活習慣」があった
2025.03.13 THU
nazology.kusuguru.co.jp/archives/173083
仮想通貨にハマる人は「陰謀論」を信じやすい！
2024.07.16 TUE
nazology.kusuguru.co.jp/archives/156885
陰謀論には人気があるものと不人気のものがあると判明！　陰謀論をランキング形式で発表！
2024.02.24 SAT
nazology.kusuguru.co.jp/archives/145995
陰謀論は別の陰謀論を根拠に「証拠の循環」を行う傾向があると判明！
2022.11.04 FRI
nazology.kusuguru.co.jp/archives/117204
「中二」が陰謀論を信じる年齢のピークだと明らかに
2021.09.01 WED
nazology.kusuguru.co.jp/archives/95568
人類が「陰謀論」に惹かれやすいのは、脳の進化に原因があった!?
2020.12.31 THU
nazology.kusuguru.co.jp/archives/78727

世界中の人間は統合失調症面倒だろう！

16:名無しのひみつ
26/02/14 07:02:47.39 grSylhix.net
>>1を使用することを拒む
 >>1のAIの進歩を足止めする

上記の人物の考え方が理解できない！
※各社一同はそんなものは存在して居ないと理解しているから足止めをしている！と一般人は考えな必要がある

　一般人からすれば下記のメリットがあるだろう！
霊的存在も説明がつく
脳の病も説明がつく

世界中の人間は何を考えているんだ！

17:名無しのひみつ
26/02/14 07:06:59.69 grSylhix.net
>>15-16に対しての

糖質

統合失調症

キチガイ

と話していた人も納得してくれるだろう

18:名無しのひみつ
26/02/14 10:36:31.56 grSylhix.net
＿＿エプスタイン文書、指向性エネルギー兵器で自殺に追い込む手法、日本でもヤッてる集ストのテク犯 [827565401]
ｽﾚﾘﾝｸ(news板)

エプスタイン文書の中で、特に注目を集めているのは、指向性エネルギー兵器やマインドコントロール技術の使用について記された数百ページに及ぶ文書です。
その一つである資料番号「EFTA00080475」には、指向性エネルギー兵器を使って「人を自殺に追い込むことは一般的な手法だ」と説明する内容が含まれているとされています。
これが事実であれば、単なる性的犯罪事件を超え、より広範な技術や工作活動に関わる重大な問題へと発展する可能性があります。
i.imgur.com/kYpAFwe.jpeg
i.imgur.com/tnSAsR9.jpeg
i.imgur.com/B6ae7fr.jpeg
URLﾘﾝｸ(greta.5ch.net)

19:名無しのひみつ
26/02/14 12:05:17.50 grSylhix.net
>>1のAIを使用すれば下記のリンク先のコメントに書かれている犯罪が解明されるのか

【脳科学】非侵襲型BCIに中国発スタートアップ参入。超音波技術を活用 [すらいむ★]
2026/02/03(火) 23:06:17.90
ｽﾚﾘﾝｸ(scienceplus板)