論文の概要: MMoA: An AI-Agent framework with recurrence for Memoried Mixure-of-Agent
- arxiv url: http://arxiv.org/abs/2605.19194v1
- Date: Mon, 18 May 2026 23:47:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 01:01:02.793931
- Title: MMoA: An AI-Agent framework with recurrence for Memoried Mixure-of-Agent
- Title(参考訳): MMoA:Memoried Mixure-of-AgentのためのAI-Agentフレームワーク
- Authors: Rui Chu,
- Abstract要約: LSTMに基づくゲーティングをエージェント選択プロセスに統合した,繰り返しMoAアーキテクチャであるMMoAを提案する。
MMoAは、より少ないエージェントを動的に活性化することで計算オーバーヘッドを減らしながら、従来のMoAと同等の精度を達成する。
- 参考スコア(独自算出の注目度): 1.4262320227703154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Mixture-of-Agents (MoA) framework has shown promise in improving large language model (LLM) performance by aggregating outputs from multiple agents. However, existing MoA systems often rely on static routers that do not fully capture temporal and contextual dependencies across aggregation layers. To address this limitation, we propose MMoA, a recurrent MoA architecture that integrates LSTM-based gating into the agent selection process. The recurrence router adaptively modulates agent contributions based on both current inputs and historical routing decisions, enabling more context-aware aggregation. We evaluate MMoA on standard instruction-following benchmarks, including AlpacaEval 2.0, MT-Bench, and Arena-Hard. The results show that MMoA achieves comparable accuracy to traditional MoA while reducing computational overhead by dynamically activating fewer agents. For example, on AlpacaEval 2.0, MMoA achieves a win rate of 58.0%, compared with 59.8% for MoA, while improving runtime efficiency by up to 4.6%. These results suggest that MMoA provides a scalable and efficient approach for adaptive multi-agent LLM systems.
- Abstract(参考訳): Mixture-of-Agents (MoA)フレームワークは、複数のエージェントから出力を集約することで、大きな言語モデル(LLM)のパフォーマンスを改善することを約束している。
しかし、既存のMoAシステムは、集約層全体にわたる時間的およびコンテキスト的依存関係を完全にキャプチャしない静的ルータに依存していることが多い。
この制限に対処するため,LSTMに基づくゲーティングをエージェント選択プロセスに統合した再帰型MoAアーキテクチャであるMMoAを提案する。
繰り返しルータは、現在の入力と過去のルーティング決定の両方に基づいてエージェントのコントリビューションを適応的に調整し、よりコンテキスト対応のアグリゲーションを可能にする。
本稿では,AlpacaEval 2.0,MT-Bench,Arena-Hardなどの標準命令追従ベンチマークでMMoAを評価する。
その結果、MMoAは従来のMoAと同等の精度を達成しつつ、エージェントを動的に活性化することで計算オーバーヘッドを低減できることがわかった。
例えば、AlpacaEval 2.0では、MMoAは58.0%、MoAは59.8%、実行効率は4.6%向上した。
これらの結果から,MMoA は適応型マルチエージェント LLM システムに対して,スケーラブルで効率的なアプローチを提供する可能性が示唆された。
関連論文リスト
- Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs [62.17306142810532]
ヘテロジニアスLSMクラスタ上で動作するマルチエージェントワークフローの予測スケジューリングシステムであるChimeraを提案する。
Chimeは最高のレイテンシをトレースし、エンドツーエンドのレイテンシを1.2-2.4$times$で削減し、タスクパフォーマンスを平均8.0-9.5ポイント改善する。
論文 参考訳(メタデータ) (2026-03-23T17:01:42Z) - RouteMoA: Dynamic Routing without Pre-Inference Boosts Efficient Mixture-of-Agents [91.0187958746262]
RouteMoAは動的ルーティングを備えた効率的な混合エージェントフレームワークである。
軽量スコアラを使用して、クエリから粗い粒度のパフォーマンスを予測することで、初期スクリーニングを行う。
既存のモデル出力に基づいて、軽量な自己評価とクロスアセスメントによってこれらのスコアを洗練し、追加の推論なしで後部修正を提供する。
論文 参考訳(メタデータ) (2026-01-26T04:22:22Z) - Attention-MoA: Enhancing Mixture-of-Agents via Inter-Agent Semantic Attention and Deep Residual Synthesis [9.98861207044308]
我々は、Inter-agent Semantic Attentionを通じてコラボレーションを再定義する、新しいMoAベースのフレームワークであるAttention-MoAを紹介する。
我々のアーキテクチャは、計算効率を向上しながら、深層における情報劣化を軽減します。
論文 参考訳(メタデータ) (2026-01-23T09:56:51Z) - CTTS: Collective Test-Time Scaling [58.564620942591866]
テスト時スケーリング(TTS)は,大規模言語モデル(LLM)のパフォーマンス向上のための,有望かつトレーニング不要なアプローチとして登場した。
単体テストタイムスケーリング(STTS)パラダイムを克服するために、CTTS(Collective Test-Time Scaling)を導入します。
CTTS-MMは、マルチエージェントとマルチリワードのコラボレーションを運用する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-08-05T11:19:08Z) - MoA: Heterogeneous Mixture of Adapters for Parameter-Efficient Fine-Tuning of Large Language Models [61.89384981175277]
ローランド適応 (LoRA) とミックスオブエキスパート (MoE) を統合するための固有テキストbfMixture-of-Adapters (MoA) アプローチを提案する。
実験結果から, 不均一なMoAは均一なMoE-LoRA法よりも性能およびパラメータ効率が優れていることがわかった。
論文 参考訳(メタデータ) (2025-06-06T09:54:19Z) - Reinforced Model Merging [53.84354455400038]
本稿では,タスク統合に適した環境とエージェントを含むRMM(Reinforced Model Merging)という,革新的なフレームワークを提案する。
評価プロセス中にデータサブセットを利用することで、報酬フィードバックフェーズのボトルネックに対処し、RMMを最大100倍高速化する。
論文 参考訳(メタデータ) (2025-03-27T08:52:41Z) - Layerwise Recurrent Router for Mixture-of-Experts [42.36093735411238]
Mixture-of-Experts (MoE)アーキテクチャは、トレーニングコストを大幅に増加させることなく、モデルサイズをスケールできる能力で際立っている。
現在のMoEモデルはパラメータ非効率をしばしば表示する。
我々はMixture-of-Experts(RMoE)のためのLayerwise Recurrent Routerを紹介する。
論文 参考訳(メタデータ) (2024-08-13T10:25:13Z) - Multi-Agent Automated Machine Learning [54.14038920246645]
自動機械学習(AutoML)におけるモジュールの共同最適化のためのマルチエージェント自動機械学習(MA2ML)を提案する。
MA2MLはモジュール間の協力を強化するために各エージェントにクレジットを明示的に割り当て、検索効率を向上させるために政治外の学習を取り入れている。
実験により、MA2MLは計算コストの制約の下でImageNet上で最先端のトップ1の精度が得られることが示された。
論文 参考訳(メタデータ) (2022-10-17T13:32:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。