論文の概要: Agentic Neurosymbolic Collaboration for Mathematical Discovery: A Case Study in Combinatorial Design
- arxiv url: http://arxiv.org/abs/2603.08322v1
- Date: Mon, 09 Mar 2026 12:42:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.993344
- Title: Agentic Neurosymbolic Collaboration for Mathematical Discovery: A Case Study in Combinatorial Design
- Title(参考訳): 数学的発見のためのエージェント型ニューロシンボリックコラボレーション : コンビニアルデザインを事例として
- Authors: Hai Xia, Carla P. Gomes, Bart Selman, Stefan Szeider,
- Abstract要約: 我々は,大言語モデル(LLM)を用いたAIエージェントを用いた,ニューロシンボリック推論のレンズによる数学的発見を研究する。
この人間とAIのコラボレーションの主な結果は、n equiv 1 pmod3$という非常に難しいケースに対するラテン正方形の不均衡の厳格な下限である。
- 参考スコア(独自算出の注目度): 39.02605479431633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study mathematical discovery through the lens of neurosymbolic reasoning, where an AI agent powered by a large language model (LLM), coupled with symbolic computation tools, and human strategic direction, jointly produced a new result in combinatorial design theory. The main result of this human-AI collaboration is a tight lower bound on the imbalance of Latin squares for the notoriously difficult case $n \equiv 1 \pmod{3}$. We reconstruct the discovery process from detailed interaction logs spanning multiple sessions over several days and identify the distinct cognitive contributions of each component. The AI agent proved effective at uncovering hidden structure and generating hypotheses. The symbolic component consists of computer algebra, constraint solvers, and simulated annealing, which provides rigorous verification and exhaustive enumeration. Human steering supplied the critical research pivot that transformed a dead end into a productive inquiry. Our analysis reveals that multi-model deliberation among frontier LLMs proved reliable for criticism and error detection but unreliable for constructive claims. The resulting human-AI mathematical contribution, a tight lower bound of $4n(n{-}1)/9$, is achieved via a novel class of near-perfect permutations. The bound was formally verified in Lean 4. Our experiments show that neurosymbolic systems can indeed produce genuine discoveries in pure mathematics.
- Abstract(参考訳): そこでは,大言語モデル(LLM)を用いたAIエージェントと,記号計算ツールと人間の戦略方向を組み合わせることで,組合せ設計理論の新たな結果が得られた。
この人間とAIのコラボレーションの主な結果は、ラテン正方形の不均衡の厳密な下限であり、非常に難しい場合は$n \equiv 1 \pmod{3}$である。
複数のセッションにまたがる詳細な対話ログから発見プロセスを再構築し、各コンポーネントの認知的貢献を識別する。
このAIエージェントは隠れた構造を発見し、仮説を生成するのに効果的であった。
記号成分は、コンピュータ代数、制約解法、シミュレートされたアニールで構成され、厳密な検証と徹底的な列挙を提供する。
人間の操舵は、致命的な結末を生産的な調査に転換する重要な研究の要点となった。
分析の結果,フロンティアLSM間の多モデル検討は,批判や誤り検出には信頼性があるが,建設的クレームには信頼性が低いことがわかった。
4n(n{-}1)/9$の厳密な下限である人間-AIの数学的寄与は、ほぼ完全な置換の新たなクラスによって達成される。
境界はLean 4で正式に認証された。
実験の結果,ニューロシンボリック系は純粋数学において真に発見できることがわかった。
関連論文リスト
- Solving an Open Problem in Theoretical Physics using AI-Assisted Discovery [16.678133599755068]
本稿では,理論物理学の解法を自律的に解くことにより,人工知能が数学的発見を加速できることを実証する。
本稿では,ジェミニ・ディープシンク大言語モデルと系統木探索(TS)フレームワークと自動数値フィードバックを組み合わせたニューロシンボリックシステムを提案する。
論文 参考訳(メタデータ) (2026-03-05T02:15:04Z) - The AI Research Assistant: Promise, Peril, and a Proof of Concept [0.0]
詳細な事例研究を通じて実証的な証拠を提供する。
コラボレーションによって、注目すべき機能と限界の両方が明らかになった。
我々の経験から、適切な懐疑論や検証プロトコルを使用すると、AIツールは数学的発見を有意義に加速させることができることが示唆されている。
論文 参考訳(メタデータ) (2026-02-26T10:29:05Z) - Towards Autonomous Mathematics Research [48.29504087871558]
Aletheiaは、自然言語のエンドツーエンドの解を反復的に生成し、検証し、修正する数学研究エージェントである。
具体的には、AletheiaはGemini Deep Thinkの高度なバージョンで、推論の問題に挑戦している。
我々は、オリンピアード問題から博士レベルのエクササイズまで、AI支援数学研究におけるいくつかのマイルストーンを通じて、アレクシアを実証する。
論文 参考訳(メタデータ) (2026-02-10T18:50:15Z) - Accelerating Scientific Research with Gemini: Case Studies and Common Techniques [105.15622072347811]
大規模言語モデル(LLM)は、科学研究を加速するための新たな道を開いた。
先進的なAIモデルとどのように協力したかを示すケーススタディのコレクションを提示する。
論文 参考訳(メタデータ) (2026-02-03T18:56:17Z) - ATHENA: Agentic Team for Hierarchical Evolutionary Numerical Algorithms [4.235429894371577]
AtheNAは、エンドツーエンドの計算研究ライフサイクルを管理するためにAutonomous Labとして設計されたエージェントフレームワークである。
その中核は知識駆動型診断プロセスであるHENAループである。
このフレームワークは超人的パフォーマンスを実現し、検証エラーは10~14ドルに達する。
論文 参考訳(メタデータ) (2025-12-03T06:05:27Z) - Mathematical exploration and discovery at scale [1.2341209649260667]
AlphaEvolveは、科学的および実践的な問題に対するアルゴリズム的解決策を提案し、テストし、洗練する一般的な進化的コーディングエージェントである。
その幅を示すために、数学的解析、組合せ論、幾何学、数論にまたがる67の問題を列挙した。
一部の例では、AlphaEvolveは有限個の入力値の結果を全ての入力値に有効な式に一般化することができる。
論文 参考訳(メタデータ) (2025-11-03T16:04:07Z) - AI Mathematician as a Partner in Advancing Mathematical Discovery - A Case Study in Homogenization Theory [6.856242640393325]
本稿では,AIMシステムを単なる問題解決者ではなく研究パートナーとして機能させる方法について検討する。
人間の直感と機械計算が相互に補完し合うかを明らかにする。
このアプローチは完全かつ検証可能な証明をもたらし、より広範に、体系的な人間とAIの共推論が数学的発見のフロンティアをいかに前進させるかを示す。
論文 参考訳(メタデータ) (2025-10-30T11:22:15Z) - Discovering physical laws with parallel symbolic enumeration [67.36739393470869]
並列記号列挙法(PSE)を導入し,限られたデータから汎用数学的表現を効率的に抽出する。
実験の結果,PSEは最先端のベースラインアルゴリズムと比較して精度が高く,計算速度も速いことがわかった。
PSEは、記号的、解釈可能なモデルの正確で効率的なデータ駆動による発見の進歩を表している。
論文 参考訳(メタデータ) (2024-07-05T10:41:15Z) - On Function Approximation in Reinforcement Learning: Optimism in the
Face of Large State Spaces [208.67848059021915]
強化学習のコアにおける探索・探索トレードオフについて検討する。
特に、関数クラス $mathcalF$ の複雑さが関数の複雑さを特徴づけていることを証明する。
私たちの後悔の限界はエピソードの数とは無関係です。
論文 参考訳(メタデータ) (2020-11-09T18:32:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。