論文の概要: SGTO-MAS: Secure Gorilla Troops Optimization for Multi-Agent LLM Systems
- arxiv url: http://arxiv.org/abs/2606.07940v1
- Date: Sat, 06 Jun 2026 02:00:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.55205
- Title: SGTO-MAS: Secure Gorilla Troops Optimization for Multi-Agent LLM Systems
- Title(参考訳): SGTO-MAS:マルチエージェントLLMシステムのためのセキュアゴリラループ最適化
- Authors: Saeid Jamshidi,
- Abstract要約: マルチエージェント大規模言語モデル(LLM)システムは、複雑な推論と意思決定に強力な機能を提供する。
既存の手法はしばしば静的戦略に依存しており、性能、セキュリティ、計算コストのバランスをとるための原則的なメカニズムが欠如している。
本稿では,制約付き最適化問題としてマルチエージェントLLMコーディネーションを定式化し,適応エージェント選択のためのセキュリティ対応手法を提案する。
- 参考スコア(独自算出の注目度): 0.5076419064097734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent large language model (LLM) systems offer strong capabilities for complex reasoning and decision-making, yet coordination across agents introduces error propagation, security risks, and inefficient use of resources. Existing methods often rely on heuristic, static strategies and lack a principled mechanism for balancing performance, security, and computational cost. This paper formulates multi-agent LLM coordination as a constrained optimization problem and proposes a security-aware method for adaptive agent selection. The method integrates trust modeling, risk-aware evaluation, and collective intelligence within a unified optimization objective. To solve the problem efficiently, we use a swarm-intelligence strategy inspired by Gorilla Troops Optimization (GTO), enabling adaptive coordination under varying threat conditions. Controlled experiments across 500 independent runs demonstrate the effectiveness of the proposed method. The system achieves a stable average performance score of 0.5281, with high consensus (0.8764), controlled risk (0.3000), and compact agent subsets averaging 4.04 selected agents. The optimization process converges efficiently, with an average runtime of 24.09 seconds per run and low score variability (standard deviation = 0.0173). Robustness analysis indicates graceful degradation under perturbations, with performance drops limited to 2.5% under agent removal and 5.3% under consensus disruption. These results show that effective multi-agent coordination can be achieved through structured optimization that jointly manages performance, security, and efficiency. The proposed method provides a practical security-aware solution for coordinating multi-agent LLM systems in complex adversarial settings.
- Abstract(参考訳): マルチエージェントの大規模言語モデル(LLM)システムは複雑な推論と意思決定に強力な能力を提供するが、エージェント間の協調はエラーの伝播、セキュリティリスク、リソースの非効率な利用を導入している。
既存の手法は、しばしばヒューリスティックで静的な戦略に依存し、性能、セキュリティ、計算コストのバランスをとるための原則的なメカニズムが欠如している。
本稿では,制約付き最適化問題としてマルチエージェントLLMコーディネーションを定式化し,適応エージェント選択のためのセキュリティ対応手法を提案する。
この手法は、信頼モデリング、リスク認識評価、集団知能を統一最適化目標に組み込む。
この問題を効率的に解決するために,Gorilla Troops Optimization (GTO) にインスパイアされたSwarm-intelligence戦略を用い,様々な脅威条件下で適応的な調整を可能にする。
500個の独立ランに対する制御実験により,提案手法の有効性が示された。
高コンセンサス(0.8764)、制御リスク(0.3000)、コンパクトエージェントサブセット(4.04)で0.5281の安定な平均性能スコアを達成する。
最適化プロセスは効率よく収束し、平均実行時間は1ラン当たり24.09秒であり、スコアの変動は低い(標準偏差=0.0173)。
ロバストネス分析は、摂動下での優雅な劣化を示し、性能低下はエージェント除去時の2.5%、コンセンサス破壊時の5.3%に制限される。
これらの結果から, 性能, セキュリティ, 効率を協調的に管理する構造最適化により, 効果的なマルチエージェント協調が達成できることが示唆された。
提案手法は,複雑な対角的環境下でのマルチエージェントLLMシステムのコーディネートのための,実用的なセキュリティ対応ソリューションを提供する。
関連論文リスト
- Decision-Theoretic Safety Assessment of Persona-Driven Multi-Agent Systems in O-RAN [0.2873445316250935]
自律型ネットワーク管理のためのペルソナ駆動型マルチエージェントフレームワークを提案する。
我々は2つのORAN最適化課題に対して486のペルソナ構成を評価した。
その結果、ペルソナエージェントのアライメントは、個々のパフォーマンスと創発的マルチエージェントのコーディネーションに大きな影響を及ぼすことが示された。
論文 参考訳(メタデータ) (2026-04-03T15:20:16Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Multi-Agent Reinforcement Learning and Real-Time Decision-Making in Robotic Soccer for Virtual Environments [0.0]
本稿では,これらの課題に対処するMARL(Multi-Agent Reinforcement Learning)フレームワークを提案する。
スケーラビリティを確保するため、平均場理論をHRLフレームワークに統合する。
我々の平均場アクター批判法は性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-12-02T19:11:44Z) - TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making [75.29820290660065]
本稿では,効果的な具体的意思決定のための思考中心推論最適化(TCPO)を提案する。
モデルの中間的推論プロセスの整合性を強調し、モデル劣化の問題を緩和する。
ALFWorld環境での実験では、平均成功率は26.67%であり、RL4VLMよりも6%向上している。
論文 参考訳(メタデータ) (2025-09-10T11:16:21Z) - SafeSieve: From Heuristics to Experience in Progressive Pruning for LLM-based Multi-Agent Communication [19.633176635669397]
プログレッシブで適応的なマルチエージェント・プルーニングアルゴリズムであるSafeSieveを提案する。
SafeSieveの平均精度は94.01%であり、トークン使用率を12.4%から27.8%削減している。
これらの結果はSafeSieveを実用マルチエージェントシステムのための堅牢で効率的でスケーラブルなフレームワークとして確立している。
論文 参考訳(メタデータ) (2025-08-15T13:44:50Z) - Heterogeneous Group-Based Reinforcement Learning for LLM-based Multi-Agent Systems [25.882461853973897]
本稿では、相対報酬の利点を推定して政策更新を導くマルチエージェント不均一グループ政策最適化(MHGPO)を提案する。
MHGPOは、批判的ネットワークの必要性を排除し、安定性を向上し、計算オーバーヘッドを減らす。
また,効率性と有効性を両立させる3つのグループロールアウトサンプリング戦略も導入する。
論文 参考訳(メタデータ) (2025-06-03T10:17:19Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。