論文の概要: AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research
- arxiv url: http://arxiv.org/abs/2602.06540v1
- Date: Fri, 06 Feb 2026 09:45:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.322693
- Title: AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research
- Title(参考訳): AgentCPM-Report:Open-Ended Deep Researchのためのインターリービングドラフトとディープニング
- Authors: Yishan Li, Wentong Chen, Yukun Yan, Mingwei Li, Sen Mei, Xiaorong Wang, Kunpeng Liu, Xin Cong, Shuo Wang, Zhong Zhang, Yaxi Lu, Zhenghao Liu, Yankai Lin, Zhiyuan Liu, Maosong Sun,
- Abstract要約: AgentCPM-Reportは軽量だが高性能なローカルソリューションで、人間の記述プロセスを反映したフレームワークで構成されている。
我々のフレームワークは、モデルがアウトラインを動的に修正できるWARP(Writeing As Reasoning Policy)を使用している。
DeepResearch Bench、DeepConsult、DeepResearch Gymの実験は、AgentCPM-Reportが主要なクローズドソースシステムより優れていることを示した。
- 参考スコア(独自算出の注目度): 85.51475655916026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating deep research reports requires large-scale information acquisition and the synthesis of insight-driven analysis, posing a significant challenge for current language models. Most existing approaches follow a plan-then-write paradigm, whose performance heavily depends on the quality of the initial outline. However, constructing a comprehensive outline itself demands strong reasoning ability, causing current deep research systems to rely almost exclusively on closed-source or online large models. This reliance raises practical barriers to deployment and introduces safety and privacy concerns for user-authored data. In this work, we present AgentCPM-Report, a lightweight yet high-performing local solution composed of a framework that mirrors the human writing process and an 8B-parameter deep research agent. Our framework uses a Writing As Reasoning Policy (WARP), which enables models to dynamically revise outlines during report generation. Under this policy, the agent alternates between Evidence-Based Drafting and Reasoning-Driven Deepening, jointly supporting information acquisition, knowledge refinement, and iterative outline evolution. To effectively equip small models with this capability, we introduce a Multi-Stage Agentic Training strategy, consisting of cold-start, atomic skill RL, and holistic pipeline RL. Experiments on DeepResearch Bench, DeepConsult, and DeepResearch Gym demonstrate that AgentCPM-Report outperforms leading closed-source systems, with substantial gains in Insight.
- Abstract(参考訳): ディープリサーチレポートを生成するには、大規模な情報取得と洞察駆動分析の合成が必要であり、現在の言語モデルにとって大きな課題となっている。
既存のアプローチのほとんどは、最初のアウトラインの品質に大きく依存するプラン-then-writeパラダイムに従っている。
しかし、包括的アウトラインの構築自体が強力な推論能力を必要とするため、現在のディープリサーチシステムは、ほとんどクローズドソースやオンラインの大規模モデルに依存している。
この依存は、デプロイに対する現実的な障壁を高め、ユーザによるデータに対する安全性とプライバシの懸念をもたらす。
本研究では,ヒトの筆記過程を反映するフレームワークと,8Bパラメーター深度研究エージェントからなる軽量で高性能なローカルソリューションであるAgentCPM-Reportを提案する。
我々のフレームワークは、レポート生成時にモデルがアウトラインを動的に修正できるようにするWARP(Writeing As Reasoning Policy)を使用している。
このポリシーでは、エージェントはエビデンスベースのドラフトと推論駆動のディープニングを交互に行い、情報取得、知識の洗練、反復的なアウトライン進化を共同で支援する。
そこで本研究では, 低温開始, 原子スキルRL, 全体的パイプラインRLからなるマルチステージエージェント訓練戦略を提案する。
DeepResearch Bench、DeepConsult、DeepResearch Gymの実験では、AgentCPM-Reportが主要なクローズドソースシステムより優れており、Insightは大幅に向上している。
関連論文リスト
- Step-DeepResearch Technical Report [90.50586290399683]
コスト効率のよいエンドツーエンドエージェントである Step-DeepResearch を紹介する。
我々は、計画とレポート作成を強化するために、アトミック能力に基づくデータ合成戦略を提案する。
中国における評価ギャップを埋めるため,現実的な深層研究シナリオのためのADR-Benchを構築した。
論文 参考訳(メタデータ) (2025-12-23T16:32:27Z) - A Hierarchical Tree-based approach for creating Configurable and Static Deep Research Agent (Static-DRA) [0.0]
本稿では,階層木に基づく静的ワークフローに基づく新しいソリューションである静的ディープリサーチエージェント(Static-DRA)を紹介する。
コアコントリビューションは、DepthとBreadthという2つのユーザチューニング可能なパラメータの統合である。
エージェントのアーキテクチャは、スーパーバイザ、インディペンデント、およびWorkerエージェントで構成され、効果的なマルチホップ情報検索を促進する。
論文 参考訳(メタデータ) (2025-12-03T15:37:13Z) - WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.58638285105971]
本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。
人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。
私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文 参考訳(メタデータ) (2025-09-16T17:57:21Z) - WebThinker: Empowering Large Reasoning Models with Deep Research Capability [109.8504165631888]
WebThinkerは、LEMがウェブを自律的に検索し、ウェブページをナビゲートし、推論プロセス中にレポートをドラフトすることを可能にするディープリサーチエージェントである。
また、Autonomous Think-Search-and-Draft戦略を採用しており、モデルが推論、情報収集、レポート作成をリアルタイムでシームレスにインターリーブすることができる。
我々のアプローチは複雑なシナリオにおけるLEMの信頼性と適用性を高め、より有能で多目的な深層研究システムへの道を開く。
論文 参考訳(メタデータ) (2025-04-30T16:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。