論文の概要: ALARA for Agents: Least-Privilege Context Engineering Through Portable Composable Multi-Agent Teams
- arxiv url: http://arxiv.org/abs/2603.20380v1
- Date: Fri, 20 Mar 2026 18:00:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.872582
- Title: ALARA for Agents: Least-Privilege Context Engineering Through Portable Composable Multi-Agent Teams
- Title(参考訳): ALARA for Agents: Portable Composable Multi-Agent TeamsによるLast-Privilegeコンテキストエンジニアリング
- Authors: Christopher J. Agostino, Nayan D'Souza,
- Abstract要約: 宣言型コンテキストエージェント・ツール(CAT)データ層を関連ファイルを通じて表現し,各エージェントのツールアクセスとコンテキストを,その役割に必要な最小限に制限する。
システムがこれらのファイルを構造的に解析し強制するため、エージェントのツールリストを変更することで、モデルが従うかもしれない、あるいは従わないかもしれないという提案よりも、保証された振る舞いの変更が生成される。
我々は,ファイル操作,Web検索,マルチステップスクリプティング,ツールチェーン,マルチエージェントデリゲートにまたがる115の実用的なタスクに対して,0.6Bから35Bパラメータのローカルホストモデル22を評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industry practitioners and academic researchers regularly use multi-agent systems to accelerate their work, yet the frameworks through which these systems operate do not provide a simple, unified mechanism for scalably managing the critical aspects of the agent harness, impacting both the quality of individual human-agent interactions and the capacity for practitioners to coordinate toward common goals through shared agent infrastructure. Agent frameworks have enabled increasingly sophisticated multi-agent systems, but the behavioral specifications that define what these agents can do remain fragmented across prose instruction files, framework-internal configuration, and mechanisms like MCP servers that operate separately from individual agent definitions, making these specifications difficult to share, version, or collaboratively maintain across teams and projects. Applying the ALARA principle from radiation safety (exposures kept as low as reasonably achievable) to agent context, we introduce a declarative context-agent-tool (CAT) data layer expressed through interrelated files that scope each agent's tool access and context to the minimum its role requires, and \texttt{npcsh}, a command-line shell for executing it. Because the system parses and enforces these files structurally, modifying an agent's tool list produces a guaranteed behavioral change rather than a suggestion the model may or may not follow. We evaluate 22 locally-hosted models from 0.6B to 35B parameters across 115 practical tasks spanning file operations, web search, multi-step scripting, tool chaining, and multi-agent delegation, characterizing which model families succeed at which task categories and where they break down across $\sim$2500 total executions.
- Abstract(参考訳): 産業の実践者や学術研究者は、定期的にマルチエージェントシステムを使用して作業を加速するが、これらのシステムが動作するフレームワークは、エージェントハーネスの重要な側面を十分に管理するためのシンプルで統一されたメカニズムを提供しておらず、個々のエージェントの相互作用の品質と、共有エージェントインフラストラクチャを通じて共通の目標に向かって調整する能力の両方に影響を与える。
エージェントフレームワークはますます高度なマルチエージェントシステムを実現しているが、これらのエージェントを定義する動作仕様は、散文の命令ファイル、フレームワーク内部設定、個々のエージェント定義とは独立して動作するMPPサーバのようなメカニズムで断片化され、これらの仕様をチームやプロジェクト間で共有、バージョン管理、共同保守が困難になっている。
ALARAの原則を放射線安全性からエージェントコンテキストへ適用し、エージェントが必要とするツールアクセスとコンテキストを最小限に制限する宣言型コンテキストエージェントツール(CAT)データ層と、それを実行するコマンドラインシェルである \texttt{npcsh} を導入する。
システムがこれらのファイルを構造的に解析し強制するため、エージェントのツールリストを変更することで、モデルが従うかもしれない、あるいは従わないかもしれないという提案よりも、保証された振る舞いの変更が生成される。
我々は、ファイル操作、Web検索、マルチステップスクリプティング、ツールチェーン、マルチエージェントデリゲートにまたがる115の実用的なタスクにまたがる0.6Bから35Bのパラメータから22のローカルホストモデルを評価し、どのモデルファミリーがどのタスクカテゴリで成功するか、そしてどのように$\sim$2500の総実行を分解するかを特徴付ける。
関連論文リスト
- Multi-Agent Tool-Integrated Policy Optimization [67.12841355267678]
大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクに対して、多ターンツール統合計画にますます依存している。
既存の実装は通常、単一のエージェントに依存するが、コンテキスト長とノイズの多いツールレスポンスに悩まされる。
ツール統合マルチエージェントフレームワークの効果的な強化学習をサポートする方法はない。
論文 参考訳(メタデータ) (2025-10-06T10:44:04Z) - Open Agent Specification (Agent Spec): A Unified Representation for AI Agents [10.685555728094338]
我々はAIエージェントとエージェントを定義する宣言型言語Open Agent Specification(Agent Spec)を紹介する。
Agent Specは、コンポーネント、コントロールとデータフローのセマンティクス、スキーマの共通セットを定義し、エージェントを一度定義し、異なるランタイム間で実行できるようにする。
論文 参考訳(メタデータ) (2025-10-05T12:26:42Z) - Kaleidoscopic Teaming in Multi Agent Simulations [75.47388708240042]
我々は,エージェントが行う複雑な行動,思考プロセス,行動の安全性リスクを評価する上で,既存のレッドチームや安全評価フレームワークは不十分であると主張している。
我々は,新しいコンテキスト内最適化手法を導入し,安全解析のためのより良いシナリオを生成する。
エージェントの安全性を測定するためのフレームワークとともに使用できる適切なメトリクスを提案する。
論文 参考訳(メタデータ) (2025-06-20T23:37:17Z) - AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.406849007798858]
本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。
本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文 参考訳(メタデータ) (2025-06-14T13:45:37Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z) - AutoAgents: A Framework for Automatic Agent Generation [27.74332323317923]
AutoAgentsは、さまざまなタスクに応じてAIチームを構築するために、複数の専門エージェントを適応的に生成し、コーディネートする革新的なフレームワークである。
各種ベンチマーク実験により,AutoAgentsは既存のマルチエージェント手法よりも一貫性と正確な解を生成することが示された。
論文 参考訳(メタデータ) (2023-09-29T14:46:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。