論文の概要: AgentGate: A Lightweight Structured Routing Engine for the Internet of Agents
- arxiv url: http://arxiv.org/abs/2604.06696v1
- Date: Wed, 08 Apr 2026 05:22:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.352132
- Title: AgentGate: A Lightweight Structured Routing Engine for the Internet of Agents
- Title(参考訳): AgentGate: エージェントのインターネットのための軽量構造化ルーティングエンジン
- Authors: Yujun Cheng, Enfang Cui, Hao Qin, Zhiyuan Liang, Qi Xu,
- Abstract要約: 本稿では、候補対応エージェントディスパッチのための軽量な構造化ルーティングエンジンであるAgentGateを提案する。
ルーティングを制限なしのテキスト生成として扱う代わりに、AgentGateはそれを2つのステージに分解する。
実験により、コンパクトモデルは制約された設定で競合的なルーティング性能を提供できることが示された。
- 参考スコア(独自算出の注目度): 25.130481441368207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid development of AI agent systems is leading to an emerging Internet of Agents, where specialized agents operate across local devices, edge nodes, private services, and cloud platforms. Although recent efforts have improved agent naming, discovery, and interaction, efficient request dispatch remains an open systems problem under latency, privacy, and cost constraints. In this paper, we present AgentGate, a lightweight structured routing engine for candidate-aware agent dispatch. Instead of treating routing as unrestricted text generation, AgentGate formulates it as a constrained decision problem and decomposes it into two stages: action decision and structural grounding. The first stage determines whether a query should trigger single-agent invocation, multi-agent planning, direct response, or safe escalation, while the second stage instantiates the selected action into executable outputs such as target agents, structured arguments, or multi-step plans. To adapt compact models to this setting, we further develop a routing-oriented fine-tuning scheme with candidate-aware supervision and hard negative examples. Experiments on a curated routing benchmark with several 3B--7B open-weight models show that compact models can provide competitive routing performance in constrained settings, and that model differences are mainly reflected in action prediction, candidate selection, and structured grounding quality. These results indicate that structured routing is a feasible design point for efficient and privacy-aware agent systems, especially when routing decisions must be made under resource-constrained deployment conditions.
- Abstract(参考訳): AIエージェントシステムの急速な開発は、ローカルデバイス、エッジノード、プライベートサービス、クラウドプラットフォーム間で特別なエージェントが動作する、新たなエージェントのインターネットへと繋がる。
最近の取り組みでは、エージェントの命名、発見、インタラクションが改善されているが、効率的なリクエストディスパッチは、レイテンシ、プライバシ、コスト制約の下でも、オープンシステムの問題のままである。
本稿では,候補対応エージェントディスパッチのための軽量な構造化ルーティングエンジンであるAgentGateを提案する。
ルーティングを制約のないテキスト生成として扱う代わりに、AgentGateはそれを制約された決定問題として定式化し、アクション決定と構造的基盤という2つのステージに分解する。
第1段階では、クエリが単一エージェントの呼び出し、マルチエージェントの計画、直接応答、安全なエスカレーションを起動するか、第2段階では、選択されたアクションをターゲットエージェント、構造化された引数、マルチステッププランなどの実行可能な出力にインスタンス化する。
この設定にコンパクトなモデルを適用するため、我々はさらにルーティング指向の微調整スキームを開発し、候補対応の監視とハード・ネガティブな例を示す。
複数の3B--7Bオープンウェイトモデルによるキュレートされたルーティングベンチマークの実験は、コンパクトモデルが制約された設定で競合的なルーティング性能を提供できることを示し、モデルの違いは、主にアクション予測、候補選択、構造化基底品質に反映されることを示している。
これらの結果から、構造化ルーティングは、特にリソース制約されたデプロイメント条件下でルーティング決定をしなければならない場合、効率的でプライバシに配慮したエージェントシステムの実現可能な設計ポイントであることが示唆された。
関連論文リスト
- EvolveRouter: Co-Evolving Routing and Prompt for Multi-Agent Question Answering [39.31752433999864]
エージェントの品質と協調構造を協調的に改善し,制約に対処する訓練可能なフレームワークを提案する。
Evolveは、F1と正確な一致の両方において、SOTAルーティングベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-04-06T20:24:54Z) - OrgAgent: Organize Your Multi-Agent System like a Company [75.47076168155817]
企業スタイルの階層型マルチエージェントフレームワークであるOrgAgentを紹介します。
企業スタイルの階層で組織されたマルチエージェントシステムは、一般的に他の組織構造よりも優れています。
論文 参考訳(メタデータ) (2026-04-01T15:21:14Z) - The Workload-Router-Pool Architecture for LLM Inference Optimization: A Vision Paper from the vLLM Semantic Router Project [30.96691028676722]
vLLM Semantic Routerプロジェクトは、信号駆動ルーティング、コンテキスト長プールルーティング、ルータパフォーマンスエンジニアリング、ポリシー競合検出、低レイテンシ組み込みモデル、カテゴリ認識セマンティックキャッシング、ユーザフィードバック駆動ルーティング適応、幻覚検出、プライバシーとジェイルブレイク保護のための階層的コンテンツ安全分類を対象とする一連の作業をリリースした。
本稿では,LLM推論最適化のための3次元フレームワークであるWorkload-Pool-Poolアーキテクチャについて述べる。
論文 参考訳(メタデータ) (2026-03-22T18:30:11Z) - ALARA for Agents: Least-Privilege Context Engineering Through Portable Composable Multi-Agent Teams [0.0]
宣言型コンテキストエージェント・ツール(CAT)データ層を関連ファイルを通じて表現し,各エージェントのツールアクセスとコンテキストを,その役割に必要な最小限に制限する。
システムがこれらのファイルを構造的に解析し強制するため、エージェントのツールリストを変更することで、モデルが従うかもしれない、あるいは従わないかもしれないという提案よりも、保証された振る舞いの変更が生成される。
我々は,ファイル操作,Web検索,マルチステップスクリプティング,ツールチェーン,マルチエージェントデリゲートにまたがる115の実用的なタスクに対して,0.6Bから35Bパラメータのローカルホストモデル22を評価した。
論文 参考訳(メタデータ) (2026-03-20T18:00:09Z) - Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.59491516762626]
マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-13T12:26:05Z) - DLLM Agent: See Farther, Run Faster [94.74432470237817]
拡散大言語モデル(DLLM)は、自己回帰(AR)デコーディングの代替として、魅力的な効率とモデリング特性を持つ。
我々は、DLLMとARのバックボーンを同一のエージェントワークフロー内でインスタンス化することで、制御された環境でこれを研究する。
DLLMエージェントはARエージェントよりも平均30%以上速く、場合によっては8倍のスピードアップを達成している。
論文 参考訳(メタデータ) (2026-02-07T09:01:18Z) - The Why Behind the Action: Unveiling Internal Drivers via Agentic Attribution [63.61358761489141]
LLM(Large Language Model)ベースのエージェントは、カスタマーサービス、Webナビゲーション、ソフトウェアエンジニアリングといった現実世界のアプリケーションで広く使われている。
本稿では,タスク結果に関係なく,エージェントの動作を駆動する内部要因を識別する,テキスト汎用エージェント属性のための新しいフレームワークを提案する。
標準ツールの使用やメモリ誘起バイアスのような微妙な信頼性リスクなど、さまざまなエージェントシナリオでフレームワークを検証する。
論文 参考訳(メタデータ) (2026-01-21T15:22:21Z) - TCAndon-Router: Adaptive Reasoning Router for Multi-Agent Collaboration [0.9564467981235256]
マルチエージェントシステム(MAS)は、高性能なインテリジェントアプリケーションを構築するための強力なパラダイムとなっている。
これらのシステム内では、特定のクエリを処理する専門家エージェントを決定するルータが、全体的なパフォーマンスにおいて重要な役割を果たす。
これらの課題に対処するため,マルチエージェント協調のための適応推論ルータTCAndon-TCARを提案する。
公開データセットと実際のエンタープライズデータの実験は、TARがルーティングの正確性を大幅に改善し、ルーティングの競合を低減し、あいまいなシナリオで堅牢であることを示している。
論文 参考訳(メタデータ) (2026-01-08T03:17:33Z) - Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.01709143437043]
階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。
具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。
我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2025-11-21T12:25:47Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。