論文の概要: RoadMapper: A Multi-Agent System for Roadmap Generation of Solving Complex Research Problems
- arxiv url: http://arxiv.org/abs/2604.27616v1
- Date: Thu, 30 Apr 2026 09:08:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.012478
- Title: RoadMapper: A Multi-Agent System for Roadmap Generation of Solving Complex Research Problems
- Title(参考訳): RoadMapper: 複雑な研究課題のロードマップ生成のためのマルチエージェントシステム
- Authors: Jiacheng Liu, Zichen Tang, Zhongjun Yang, Xinyi Hu, Xueyuan Lin, Linwei Jia, Ruofei Bai, Rongjin Li, Shiyao Peng, Haocheng Gao, Haihong E,
- Abstract要約: 複雑な研究問題を解決するための高品質なロードマップを構築するための,大規模言語モデルの能力を評価するために設計された,新しいベンチマークであるRoadMapを紹介した。
RoadMapperは、研究ロードマップ生成タスクを3つの重要なステージに分割するマルチエージェントシステムである。
大規模な実験では、RoadMapperがロードマップ生成のLLMの能力を向上させると同時に、平均的なパフォーマンスを8%以上向上し、人間の専門家が必要とする84%の時間を節約できることが示されている。
- 参考スコア(独自算出の注目度): 12.7693998003263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: People commonly leverage structured content to accelerate knowledge acquisition and research problem solving. Among these, roadmaps guide researchers through hierarchical subtasks to solve complex research problems step by step. Despite progress in structured content generation, the roadmap generation task has remained unexplored. To bridge this gap, we introduce RoadMap, a novel benchmark designed to evaluate the ability of large language models (LLMs) to construct high-quality roadmaps for solving complex research problems. Based on this, we identify three limitations of LLMs: (1) lack of professional knowledge, (2) unreasonable task decomposition, and (3) disordered logical relationships. To address these challenges, we propose RoadMapper, an LLM-based multi-agent system that decomposes the research roadmap generation task into three key stages (i.e., initial generation, knowledge augmentation, and iterative "critique-revise-evaluate"). Extensive experiments demonstrate that RoadMapper can improve LLMs' ability for roadmap generation, while enhancing average performance by more than 8% and saving 84% of the time required by human experts, highlighting its effectiveness and application potential.
- Abstract(参考訳): 人々は一般的に構造化コンテンツを利用して知識獲得と研究問題解決を加速します。
これらのうち、ロードマップは研究者を階層的なサブタスクを通じてガイドし、複雑な研究問題を段階的に解決する。
構造化コンテンツ生成の進展にもかかわらず、ロードマップ生成タスクは未検討のままである。
このギャップを埋めるために,我々は,大規模言語モデル(LLM)が複雑な研究問題を解決するための高品質なロードマップを構築する能力を評価するために設計された,新しいベンチマークであるRoadMapを紹介した。
そこで本研究では,(1)専門知識の欠如,(2)不合理なタスク分解,(3)不合理な論理的関係の3つの限界を同定した。
これらの課題に対処するため、LLMベースのマルチエージェントシステムであるRoadMapperを提案し、研究ロードマップ生成タスクを3つの重要な段階(初期生成、知識向上、反復的「批評・修正・評価」)に分解する。
大規模な実験では、RoadMapperがロードマップ生成の能力を向上させると同時に、平均的なパフォーマンスを8%以上向上し、人間の専門家が必要とする時間の84%を節約し、その有効性とアプリケーションの可能性を強調している。
関連論文リスト
- SPIRAL: Symbolic LLM Planning via Grounded and Reflective Search [11.651841902428673]
SPIRALは3つの専門的な大規模言語モデルの認知アーキテクチャをモンテカルロ木探索ループに組み込む新しいフレームワークである。
DailyLifeAPIsとHuggingFaceデータセットでは、SPIRALがデフォルトのChain-of-the-artプランニングメソッドを一貫して上回っている。
我々の研究は、LLM推論をガイド付き、反射型、接地型検索プロセスとして構築することで、より堅牢で効率的な自律型プランナーが得られることを示した。
論文 参考訳(メタデータ) (2025-12-29T03:19:42Z) - Deep Research: A Systematic Survey [118.82795024422722]
Deep Research (DR)は、大規模言語モデルの推論能力と検索エンジンなどの外部ツールを組み合わせることを目的としている。
本調査は,深層研究システムの包括的かつ体系的な概要を提示する。
論文 参考訳(メタデータ) (2025-11-24T15:28:28Z) - Executable Knowledge Graphs for Replicating AI Research [65.41207324831583]
Executable Knowledge Graphs (xKG) は、科学文献から抽出された技術的洞察、コードスニペット、ドメイン固有の知識を自動的に統合するモジュラーでプラグイン可能な知識基盤である。
コードはhttps://github.com/zjunlp/xKGでリリースされる。
論文 参考訳(メタデータ) (2025-10-20T17:53:23Z) - Why Do Multi-Agent LLM Systems Fail? [87.90075668488434]
MAST-Dataは7つの人気のあるMASフレームワークで収集された1600以上の注釈付きトレースの包括的なデータセットである。
我々はMAST(Multi-Agent System Failure Taxonomy)を初めて構築する。
MASTとMAST-Dataを利用して、モデル(GPT4、Claude 3、Qwen2.5、CodeLlama)とタスク(コーディング、数学、汎用エージェント)の障害パターンを分析します。
論文 参考訳(メタデータ) (2025-03-17T19:04:38Z) - KBM: Delineating Knowledge Boundary for Adaptive Retrieval in Large Language Models [69.99274367773997]
大規模言語モデル(LLM)は知識を動的に変化させ、未知の静的情報を扱うのにしばしば苦労する。
Retrieval-Augmented Generation (RAG) はこれらの課題に対処するために使われ、LLMの性能向上に大きな影響を与えている。
本稿では,ある質問の既知/未知を表現し,RAGを起動する必要があるかどうかを判断するための知識境界モデル(KBM)を提案する。
論文 参考訳(メタデータ) (2024-11-09T15:12:28Z) - What's Wrong with Your Code Generated by Large Language Models? An Extensive Study [92.62952504133926]
本研究は,3つの一般的なベンチマーク上で,3つの主要なクローズドソースLLMと6つの人気のあるオープンソースLLMの性能評価を行った。
間違ったコードに対するバグの分類を開発し、一般的なバグタイプに対する根本原因を分析した。
本稿では,自己批判を導入し,LLMが生成したコードに対する批判と修正を可能にする,新たな学習自由反復手法を提案する。
論文 参考訳(メタデータ) (2024-07-08T17:27:17Z) - Scaling Lifelong Multi-Agent Path Finding to More Realistic Settings: Research Challenges and Opportunities [44.292720085661585]
我々は2023年のLMAPFコンペティションに勝利のアプローチを提示する。
最初の課題は、限られた計画時間内で高品質なLMAPFソリューションを探すことである。
第2の課題は、LMAPFアルゴリズムにおける筋萎縮と行動の影響を緩和することである。
第3の課題は、文学と現実世界の応用で使用されるLMAPFモデルのギャップを埋めることである。
論文 参考訳(メタデータ) (2024-04-24T19:37:18Z) - Scalable Many-Objective Pathfinding Benchmark Suite [0.0]
実世界のデータに基づいてアプリケーションをルーティングする上で重要な機能の大部分を網羅する,スケーラブルな多目的ベンチマーク問題を提案する。
本研究では, 距離, 走行時間, 事故による遅延, 曲率, 標高などの2つの経路特性を客観的に定義する。
このテストベンチマークは実世界のルーティング問題に容易に移行できるので、OpenStreetMapデータからルーティング問題を構築する。
論文 参考訳(メタデータ) (2020-10-09T11:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。