論文の概要: SIGMA: Search-Augmented On-Demand Knowledge Integration for Agentic Mathematical Reasoning
- arxiv url: http://arxiv.org/abs/2510.27568v1
- Date: Fri, 31 Oct 2025 15:51:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.158474
- Title: SIGMA: Search-Augmented On-Demand Knowledge Integration for Agentic Mathematical Reasoning
- Title(参考訳): SIGMA: エージェント数学的推論のための検索強化オン・デマンド知識統合
- Authors: Ali Asgarov, Umid Suleymanov, Aadyant Khatri,
- Abstract要約: SIGMA(Search-Augmented On-Demand Knowledge Integration for AGentic Mathematical reAsoning)は、特殊エージェントを編成する統合フレームワークである。
各エージェントは仮説パスを生成し、分析的な視点で検索を最適化し、知識統合が文脈に敏感で計算効率が良いことを保証する。
その結果,多エージェントのオンデマンド知識統合は推論精度と効率性の両方を著しく向上させ,複雑で知識集約的な問題解決にスケーラブルなアプローチを提供することを示した。
- 参考スコア(独自算出の注目度): 0.054619385369457214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Solving mathematical reasoning problems requires not only accurate access to relevant knowledge but also careful, multi-step thinking. However, current retrieval-augmented models often rely on a single perspective, follow inflexible search strategies, and struggle to effectively combine information from multiple sources. We introduce SIGMA (Search-Augmented On-Demand Knowledge Integration for AGentic Mathematical reAsoning), a unified framework that orchestrates specialized agents to independently reason, perform targeted searches, and synthesize findings through a moderator mechanism. Each agent generates hypothetical passages to optimize retrieval for its analytic perspective, ensuring knowledge integration is both context-sensitive and computation-efficient. When evaluated on challenging benchmarks such as MATH500, AIME, and PhD-level science QA GPQA, SIGMA consistently outperforms both open- and closed-source systems, achieving an absolute performance improvement of 7.4%. Our results demonstrate that multi-agent, on-demand knowledge integration significantly enhances both reasoning accuracy and efficiency, offering a scalable approach for complex, knowledge-intensive problem-solving. We will release the code upon publication.
- Abstract(参考訳): 数学的推論問題の解決には、関連する知識への正確なアクセスだけでなく、慎重で多段階的な思考も必要である。
しかし、現在の検索強化モデルは、しばしば単一の視点に依存し、柔軟性のない探索戦略に従い、複数の情報源からの情報を効果的に組み合わせることに苦労する。
SIGMA(Search-Augmented On-Demand Knowledge Integration for AGentic Mathematical reAsoning)は、特定のエージェントを独立に推論し、ターゲット探索を行い、モデレーター機構を介して発見を合成する統合フレームワークである。
各エージェントは仮説パスを生成し、分析的な視点で検索を最適化し、知識統合が文脈に敏感で計算効率が良いことを保証する。
MATH500、AIME、PhDレベルの科学QA GPQAなどの挑戦的なベンチマークで評価すると、SIGMAはオープンソースシステムとクローズドソースシステムの両方を一貫して上回り、絶対的なパフォーマンス改善を7.4%達成している。
その結果,多エージェントのオンデマンド知識統合は推論精度と効率性の両方を著しく向上させ,複雑で知識集約的な問題解決にスケーラブルなアプローチを提供することを示した。
私たちはそのコードを出版時に公開します。
関連論文リスト
- Executable Knowledge Graphs for Replicating AI Research [65.41207324831583]
Executable Knowledge Graphs (xKG) は、科学文献から抽出された技術的洞察、コードスニペット、ドメイン固有の知識を自動的に統合するモジュラーでプラグイン可能な知識基盤である。
コードはhttps://github.com/zjunlp/xKGでリリースされる。
論文 参考訳(メタデータ) (2025-10-20T17:53:23Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - MARS: Optimizing Dual-System Deep Research via Multi-Agent Reinforcement Learning [82.14973479594367]
複雑な推論タスクのための大規模言語モデル(LLM)は、直感的で意図的な認知プロセスを橋渡しする革新的なアプローチを必要とする。
本稿では,Multi-Agent System for Deep ReSearch (MARS)を提案する。
論文 参考訳(メタデータ) (2025-10-06T15:42:55Z) - DynaSearcher: Dynamic Knowledge Graph Augmented Search Agent via Multi-Reward Reinforcement Learning [5.280613615397194]
DynaSearcherは動的知識グラフとマルチリワード強化学習(RL)によって強化された革新的な検索エージェントである
検索精度, 効率, 応答品質などの学習目標を詳細に制御するために, マルチリワード RL フレームワークを用いる。
実験により,提案手法は6つのマルチホップ質問応答データセットに対して,最先端の回答精度を実現することを示す。
論文 参考訳(メタデータ) (2025-07-23T09:58:31Z) - Agentic Reasoning: A Streamlined Framework for Enhancing LLM Reasoning with Agentic Tools [19.70178343422698]
本稿では,外部ツール利用エージェントを統合することで,大規模言語モデル(LLM)推論を強化するフレームワークであるAgentic Reasoningを紹介する。
私たちのフレームワークにおける重要な革新はMind-Mapエージェントです。
DeepSeek-R1にデプロイすると、パブリックモデル間で新しいSOTA(State-of-the-art)を実現する。
論文 参考訳(メタデータ) (2025-02-07T04:08:46Z) - GIVE: Structured Reasoning of Large Language Models with Knowledge Graph Inspired Veracity Extrapolation [108.2008975785364]
Graph Inspired Veracity Extrapolation (GIVE)は、パラメトリックメモリと非パラメトリックメモリを融合して、最小の外部入力で正確な推論を改善する新しい推論手法である。
GIVE は LLM エージェントをガイドして,最も関連する専門家データ (observe) を選択し,クエリ固有の発散思考 (reflect) に従事し,その情報を合成して最終的な出力 (speak) を生成する。
論文 参考訳(メタデータ) (2024-10-11T03:05:06Z) - WeKnow-RAG: An Adaptive Approach for Retrieval-Augmented Generation Integrating Web Search and Knowledge Graphs [10.380692079063467]
本稿では,Web検索と知識グラフを統合したWeKnow-RAGを提案する。
まず,知識グラフの構造化表現と高次ベクトル検索の柔軟性を組み合わせることで,LLM応答の精度と信頼性を向上させる。
提案手法は,情報検索の効率と精度を効果的にバランスさせ,全体の検索プロセスを改善する。
論文 参考訳(メタデータ) (2024-08-14T15:19:16Z) - WESE: Weak Exploration to Strong Exploitation for LLM Agents [95.6720931773781]
本稿では,オープンワールド対話型タスクの解法において,LLMエージェントの強化を目的としたWeak Exploration to Strong Exploitation (WESE)を提案する。
WESEは、探究と搾取のプロセスを分離し、費用対効果の弱いエージェントを用いて世界的知識の探索を行う。
次に、獲得した知識を格納し、タスク関連知識を抽出する知識グラフベースの戦略を導入する。
論文 参考訳(メタデータ) (2024-04-11T03:31:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。