論文の概要: ARM: Discovering Agentic Reasoning Modules for Generalizable Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2510.05746v1
- Date: Tue, 07 Oct 2025 10:04:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.193233
- Title: ARM: Discovering Agentic Reasoning Modules for Generalizable Multi-Agent Systems
- Title(参考訳): ARM:汎用マルチエージェントシステムのためのエージェント推論モジュールの発見
- Authors: Bohan Yao, Shiva Krishna Reddy Malay, Vikas Yadav,
- Abstract要約: 大規模言語モデル (LLM) を利用したマルチエージェントシステム (MAS) は, 様々な複雑な推論タスクにおいて最先端の結果を得た。
近年,MASeの設計を自動化する技術が提案されている。
我々は、思考の連鎖(CoT)推論の最適化に焦点をあてる、自動MAS設計のための新しいパラダイムを提案する。
- 参考スコア(独自算出の注目度): 8.609732664707497
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Model (LLM)-powered Multi-agent systems (MAS) have achieved state-of-the-art results on various complex reasoning tasks. Recent works have proposed techniques to automate the design of MASes, eliminating the need for manual engineering. However, these techniques perform poorly, often achieving similar or inferior performance to simple baselines. Furthermore, they require computationally expensive re-discovery of architectures for each new task domain and expensive data annotation on domains without existing labeled validation sets. A critical insight is that simple Chain of Thought (CoT) reasoning often performs competitively with these complex systems, suggesting that the fundamental reasoning unit of MASes, CoT, warrants further investigation. To this end, we present a new paradigm for automatic MAS design that pivots the focus to optimizing CoT reasoning. We introduce the Agentic Reasoning Module (ARM), an agentic generalization of CoT where each granular reasoning step is executed by a specialized reasoning module. This module is discovered through a tree search over the code space, starting from a simple CoT module and evolved using mutations informed by reflection on execution traces. The resulting ARM acts as a versatile reasoning building block which can be utilized as a direct recursive loop or as a subroutine in a learned meta-orchestrator. Our approach significantly outperforms both manually designed MASes and state-of-the-art automatic MAS design methods. Crucially, MASes built with ARM exhibit superb generalization, maintaining high performance across different foundation models and task domains without further optimization.
- Abstract(参考訳): 大規模言語モデル (LLM) を利用したマルチエージェントシステム (MAS) は, 様々な複雑な推論タスクにおいて最先端の結果を得た。
近年,MASeの設計を自動化する技術が提案されている。
しかし、これらのテクニックは、単純なベースラインとよく似た、または劣ったパフォーマンスを達成するために、性能が良くない。
さらに、新しいタスクドメインごとに計算に費用がかかるアーキテクチャの再発見と、既存のラベル付き検証セットなしでドメイン上での高価なデータアノテーションが必要である。
批判的な洞察として、単純な思考の連鎖(CoT)推論はこれらの複雑なシステムと競合することが多く、MASeの基本的な推論ユニットであるCoTはさらなる調査を保証している。
そこで本研究では,CoT推論の最適化に重点を置き,自動MAS設計のための新しいパラダイムを提案する。
本稿では,CoTのエージェント一般化であるエージェント推論モジュール(ARM)について紹介する。
このモジュールは、単純なCoTモジュールから始まり、実行トレースのリフレクションによって通知された突然変異を使って進化したコード空間のツリーサーチによって検出される。
結果として得られるARMは、直接再帰ループとして、あるいは学習されたメタオーケストレータのサブルーチンとして使用できる多目的推論ビルディングブロックとして機能する。
提案手法は手作業で設計したMASeと最先端自動MAS設計手法の両方に優れる。
重要な点として、ARMで構築されたMASeは、さらなる最適化なしに、さまざまな基礎モデルやタスクドメイン間で高いパフォーマンスを維持しながら、超汎用性を示す。
関連論文リスト
- Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation [72.44384066166147]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は、多様な領域にわたる複雑な問題を扱うための強力なソリューションとして登場した。
既存のアプローチは、事前に定義されたエージェントセットとハードコードされた相互作用構造を持つテンプレートグラフ修正パラダイムに依存しているため、基本的に制限されている。
協調グラフをスクラッチから構築することで、このパラダイムを運用する新しい自己回帰モデルであるARG-Designerを提案する。
論文 参考訳(メタデータ) (2025-07-24T09:17:41Z) - Hierarchical Reasoning Model [16.223136644998203]
HRMは、中間プロセスの明示的な監督なしに、1つのフォワードパスでシーケンシャルな推論タスクを実行する。
2700万のパラメータしか持たず、HRMは1000のトレーニングサンプルのみを使用して複雑な推論タスクで例外的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-06-26T19:39:54Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - Leveraging LLM Agents for Automated Optimization Modeling for SASP Problems: A Graph-RAG based Approach [7.790822602801334]
本稿では,検索拡張生成(RAG)技術に基づく自動モデリング手法を提案する。
提案手法(MAG-RAG)はいくつかのAOMベンチマークより優れている。
論文 参考訳(メタデータ) (2025-01-30T13:00:15Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - Text Modular Networks: Learning to Decompose Tasks in the Language of
Existing Models [61.480085460269514]
本稿では,既存のモデルで解けるより単純なモデルに分解することで,複雑なタスクを解くための解釈可能なシステムを構築するためのフレームワークを提案する。
我々はこのフレームワークを用いて、ニューラルネットワークのファクトイド単一スパンQAモデルとシンボリック電卓で答えられるサブクエストに分解することで、マルチホップ推論問題に答えられるシステムであるModularQAを構築する。
論文 参考訳(メタデータ) (2020-09-01T23:45:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。