論文の概要: Iteris: Agentic Research Loops for Computational Mathematics
- arxiv url: http://arxiv.org/abs/2606.02484v1
- Date: Mon, 01 Jun 2026 16:54:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.51645
- Title: Iteris: Agentic Research Loops for Computational Mathematics
- Title(参考訳): Iteris:計算数学のためのエージェント研究ループ
- Authors: Leheng Chen, Zihao Liu, Wanyi He, Bin Dong,
- Abstract要約: 本稿では,計算数学におけるオープンな問題に対するエージェント研究システムであるイテリスを紹介する。
我々は最近のSimons Workshopコレクションからイテリスを2つのオープンな問題に適用した。
イテリスは数値的な証拠、建設、証明の草案を作成し、専門家のレビューと修正を経て、検証結果に繋がった。
- 参考スコア(独自算出の注目度): 7.052820770689716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in large language models and agentic AI systems have enabled significant progress in mathematical discovery, from solving competition problems to tackling research-level conjectures. However, open problems in computational mathematics have received comparatively less attention: research in this area often requires not only proofs but also numerical experimentation, adversarial constructions, and algorithm design. In this paper, we introduce an agentic research system, Iteris, designed for open problems in computational mathematics. We apply Iteris to two open problems from a recent Simons Workshop collection (arXiv:2602.05394). In these case studies, Iteris generated numerical evidence, constructions, and proof drafts that led, after expert review and correction, to verified results. The first result is a phase diagram for the asymptotic comparison between conjugate gradient and randomized coordinate descent on power-law spectra; the second is a counterexample showing that QR factorization with column pivoting can fail to select well-conditioned submatrices even under low coherence. These case studies suggest that agentic AI systems can participate meaningfully in research workflows for open problems in computational mathematics, while human validation remains essential.
- Abstract(参考訳): 大規模言語モデルとエージェントAIシステムの最近の進歩は、競合問題の解決から研究レベルの予想への対処に至るまで、数学的な発見の大幅な進歩を可能にしている。
この分野の研究は証明だけでなく、数値実験、対数構成、アルゴリズム設計などを必要とすることが多い。
本稿では,計算数学におけるオープンな問題に対するエージェント研究システムであるイテリスを紹介する。
我々は最近のSimons Workshopコレクション(arXiv:2602.05394)からイテリスを2つのオープンな問題に適用する。
これらのケーススタディでは、イテリスは数値的な証拠、構造、証明のドラフトを生成し、専門家のレビューと修正を経て、検証結果に導いた。
第1の結果は、共役勾配と無作為座標降下のパワーロースペクトルにおける漸近的な比較のための位相図であり、第2の例は、カラムピボットによるQR分解が、コヒーレンスの下でも良条件のサブマトリクスを選択できないことを示す反例である。
これらのケーススタディは、エージェントAIシステムは、人間の検証が不可欠であるのに対して、計算数学のオープンな問題に対する研究ワークフローに有意義に参加できることを示唆している。
関連論文リスト
- Formal Conjectures: An Open and Evolving Benchmark for Verified Discovery in Mathematics [9.38309744591661]
フォーマル・コンジェクチャ(Formal Conjectures)は、Lean 4.0で形式化された2615の数学的問題文の進化ベンチマークである。
このデータセットは、数学的な証明発見のためのゼロ汚染ベンチマークを提供する1029のオープンリサーチ予想を特徴としている。
我々は,これらの形式化の正しさを保証するためのアプローチを,アクティブなコミュニティからのコントリビューションを生かしたオープンソースプロジェクトとして紹介する。
論文 参考訳(メタデータ) (2026-05-13T08:33:15Z) - Agentic Neurosymbolic Collaboration for Mathematical Discovery: A Case Study in Combinatorial Design [39.02605479431633]
我々は,大言語モデル(LLM)を用いたAIエージェントを用いた,ニューロシンボリック推論のレンズによる数学的発見を研究する。
この人間とAIのコラボレーションの主な結果は、n equiv 1 pmod3$という非常に難しいケースに対するラテン正方形の不均衡の厳格な下限である。
論文 参考訳(メタデータ) (2026-03-09T12:42:56Z) - Towards Autonomous Mathematics Research [48.29504087871558]
Aletheiaは、自然言語のエンドツーエンドの解を反復的に生成し、検証し、修正する数学研究エージェントである。
具体的には、AletheiaはGemini Deep Thinkの高度なバージョンで、推論の問題に挑戦している。
我々は、オリンピアード問題から博士レベルのエクササイズまで、AI支援数学研究におけるいくつかのマイルストーンを通じて、アレクシアを実証する。
論文 参考訳(メタデータ) (2026-02-10T18:50:15Z) - Advancing Mathematical Research via Human-AI Interactive Theorem Proving [16.40852561664514]
LLMを用いた対話型定理証明と発見のためのヒューマン・イン・ザ・ループ・ワークフローを提案する。
人間の専門家は問題定式化と許容可能な仮定の制御を維持し、モデルは証明や矛盾を探索する。
このワークフローを、多様体最適化とグロバーの量子探索アルゴリズムの接続に関するケーススタディでインスタンス化する。
論文 参考訳(メタデータ) (2025-12-10T09:16:27Z) - Computational Complexity of Statistics: New Insights from Low-Degree Polynomials [57.377943721487966]
これは、様々な平均的な計算問題における明らかな統計的・計算上のトレードオフを予測し、説明するために、低次の使用に関する調査である。
論文 参考訳(メタデータ) (2025-06-12T14:35:26Z) - RealMath: A Continuous Benchmark for Evaluating Language Models on Research-Level Mathematics [30.778394290919582]
大規模言語モデル(LLM)における数学的推論を評価するための既存のベンチマークは、主に競合問題、公式な証明、人工的な問題に依存している。
論文や数理フォーラムから直接派生した新しいベンチマークであるRealMathを導入し,実数理タスクにおけるLLMの能力を評価する。
論文 参考訳(メタデータ) (2025-05-18T23:32:46Z) - RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library [58.404895570822184]
RV-Synは、新しい数学的合成手法である。
このライブラリからPython形式の関数を組み合わせることで、グラフをソリューションとして生成する。
構築したグラフに基づいて,解誘導論理認識問題生成を実現する。
論文 参考訳(メタデータ) (2025-04-29T04:42:02Z) - Large Language Models for Mathematical Analysis [3.7325315394927023]
この研究は、数学的推論における重要なギャップに対処し、信頼できるAIの進歩に寄与する。
DEMI-MathAnalysisデータセットを開発した。
また,LLMの問題解決能力を高めるためのガイドフレームワークも設計した。
論文 参考訳(メタデータ) (2024-12-28T20:37:55Z) - MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs [80.96119560172224]
MathGAPは、それらの算術的証明構造に関する仕様に従って、問題文と連鎖推論トレースを生成する。
MathGAP を用いて, LLM はより深く, より広くなるにつれて, 性能が著しく低下することがわかった。
論文 参考訳(メタデータ) (2024-10-17T12:48:14Z) - UniGeo: Unifying Geometry Logical Reasoning via Reformulating
Mathematical Expression [127.68780714438103]
計算と証明の2つの主要な幾何学問題は、通常2つの特定のタスクとして扱われる。
我々は4,998の計算問題と9,543の証明問題を含むUniGeoという大規模統一幾何問題ベンチマークを構築した。
また,複数タスクの幾何変換フレームワークであるGeoformerを提案し,計算と証明を同時に行う。
論文 参考訳(メタデータ) (2022-12-06T04:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。