Fugu-MT 論文翻訳(概要): Improving Role Consistency in Multi-Agent Collaboration via Quantitative Role Clarity

論文の概要: Improving Role Consistency in Multi-Agent Collaboration via Quantitative Role Clarity

arxiv url: http://arxiv.org/abs/2604.02770v1
Date: Fri, 03 Apr 2026 06:28:59 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-06 17:20:24.347995
Title: Improving Role Consistency in Multi-Agent Collaboration via Quantitative Role Clarity
Title（参考訳）: 定量的役割明確化によるマルチエージェントコラボレーションにおける役割整合性の向上
Authors: Guoling Zhou, Wenpei Han, Fengqin Yang, Li Wang, Yingcong Zhou, Zhiguo Fu,
Abstract要約: 役割整合性を改善するために,定量的な役割の明確化を提案する。我々は、役割整合性を改善するために、軽量微調整において正則化器として役割明度行列を用いる。マルチエージェントシステムChatDevの実験により,本手法は役割整合性とタスク性能を大幅に向上することが示された。
参考スコア（独自算出の注目度）: 2.7151269437804415
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In large language model (LLM)-driven multi-agent systems, disobey role specification (failure to adhere to the defined responsibilities and constraints of an assigned role, potentially leading to an agent behaving like another) is a major failure mode \cite{DBLP:journals/corr/abs-2503-13657}. To address this issue, in the present paper, we propose a quantitative role clarity to improve role consistency. Firstly, we construct a role assignment matrix $S(φ)=[s_{ij}(φ)]$, where $s_{ij}(φ)$ is the semantic similarity between the $i$-th agent's behavior trajectory and the $j$-th agent's role description. Then we define role clarity matrix $M(φ)$ as $\text{softmax}(S(φ))-I$, where $\text{softmax}(S(φ))$ is a row-wise softmax of $S(φ)$ and $I$ is the identity matrix. The Frobenius norm of $M(φ)$ quantifies the alignment between agents' role descriptions and their behaviors trajectory. Moreover, we employ the role clarity matrix as a regularizer during lightweight fine-tuning to improve role consistency, thereby improving end-to-end task performance. Experiments on the ChatDev multi-agent system show that our method substantially improves role consistency and task performance: with Qwen and Llama, the role overstepping rate decreases from $46.4\%$ to $8.4\%$ and from $43.4\%$ to $0.2\%$, respectively, and the role clarity score increases from $0.5328$ to $0.9097$ and from $0.5007$ to $0.8530$, respectively, the task success rate increases from $0.6769$ to $0.6909$ and from $0.6174$ to $0.6763$, respectively.
Abstract（参考訳）: 大規模言語モデル(LLM)によるマルチエージェントシステムでは、ロール仕様に反する(割り当てられたロールの責任や制約に従わなかったり、エージェントが他のロールのように振る舞う可能性がある)ことは、主要な障害モード \cite{DBLP:journals/corr/abs-2503-13657} である。この問題に対処するため,本稿では,役割整合性を改善するための定量的な役割の明確化を提案する。まず、ロール割り当て行列$S(φ)=[s_{ij}(φ)]$を構築し、$s_{ij}(φ)$は、$i$-thエージェントの振る舞い軌跡と$j$-thエージェントの役割記述とのセマンティックな類似性である。このとき、ロール明度行列 $M(φ)$ を $\text{softmax}(S(φ))-I$ と定義し、$\text{softmax}(S(φ))$ を$S(φ)$ の行次ソフトマックスとし、$I$ を恒等行列とする。 M(φ)$のフロベニウスノルムは、エージェントの役割記述とそれらの行動軌跡の間の整合を定量化する。さらに, 軽量微調整において, 役割明瞭度行列を正則化器として用いて, 役割整合性を向上し, エンドツーエンドのタスク性能を向上する。 QwenとLlamaでは、ロールオーバーステッピングレートが46.4\%$から8.4\%$に、43.4\%$から0.2\%$に減少し、ロールクリアリティスコアが0.5328$から0.9097$に、0.5007$から0.8530$に上昇し、タスク成功率は0.6769$から0.6909$に、そして0.6174$から0.676763$に増加した。

関連論文リスト

MASA: Rethinking the Representational Bottleneck in LoRA with Multi-A Shared Adaptation [28.079735905482096]
Low-Rank Adaptation (LoRA) が主流となっている。 Low-Rank Adaptation (LoRA) が主流となっている。 Low-Rank Adaptation (LoRA) が主流となっている。 Low-Rank Adaptation (LoRA) が主流となっている。 Low-Rank Adaptation (LoRA) が主流となっている。 Low-Rank Adaptation (LoRA) が主流となっている。 Low-Rank Adaptation (LoRA) が主流となっている。
論文参考訳（メタデータ） (2025-10-07T15:06:46Z)
Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [54.67512489842682]
大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。 LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文参考訳（メタデータ） (2025-05-23T08:23:36Z)
FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA [68.44043212834204]
Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。 Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。
論文参考訳（メタデータ） (2025-05-19T07:32:56Z)
Mean-Field Sampling for Cooperative Multi-Agent Reinforcement Learning [8.400105595501158]
我々は、新しい$textttSUBPLE-MFQ$(textbfSubsample$-$textbfMean-$textbfF$ield-$textbfQ$-learning)と、$n$エージェントを持つシステムの分散ランダム化ポリシーを提案する。我々は、この学習されたポリシーが$tilde$O (1/sqrtk)$の順序の最適ポリシーに収束することを証明する。
論文参考訳（メタデータ） (2024-12-01T03:45:17Z)
On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文参考訳（メタデータ） (2024-08-02T03:25:20Z)
Bi-objective Optimization in Role Mining [6.121341817409735]
ロールマイニング(Role mining)は、既存のポリシーからロールベースの認証ポリシーを導出する技術である。まず、一般化ノイズロールマイニング問題(GNRM)を紹介する。 GNRM はパラメータ $r + k$ で固定パラメータ tractable であることを示し、$r$ はソリューション内のロールの数である。次に、整数計画解法であるGurobiを用いてBO-GNRMの問題を解く実験結果について報告する。
論文参考訳（メタデータ） (2024-03-25T13:36:20Z)
Asymmetry in Low-Rank Adapters of Foundation Models [47.310550805920585]
本稿では、低ランクアダプタ行列の重要性において、予期せぬ非対称性を特徴付け、活用する。我々は、細調整の$B$が、細調整の$A$よりも本質的に効果的であることを示し、ランダムな未トレーニングの$A$は、細調整の$A$よりもほぼ同等に機能することを示します。
論文参考訳（メタデータ） (2024-02-26T18:59:12Z)
Refined Sample Complexity for Markov Games with Independent Linear Function Approximation [49.5660193419984]
マルコフゲーム(MG)はマルチエージェント強化学習(MARL)の重要なモデルである本稿では、WangらによるAVLPRフレームワークを改良し(2023年)、最適部分ギャップの悲観的推定を設計する。マルチエージェントの呪いに取り組み、最適な$O(T-1/2)収束率を達成し、同時に$textpoly(A_max)$依存性を避ける最初のアルゴリズムを与える。
論文参考訳（メタデータ） (2024-02-11T01:51:15Z)
Scaling Distributed Multi-task Reinforcement Learning with Experience Sharing [38.883540444516605]
DARPAはShELLプログラムを立ち上げた。これは、経験共有が分散生涯学習エージェントにどのように役立つかを探求することを目的としている。分散マルチタスク強化学習(RL)の理論的および実証的研究を行い、N$エージェントのグループがM$タスクを協調的に解決する。我々はDistMT-LSVIと呼ばれるアルゴリズムを提案し、各エージェントは独立に$epsilon$-optimal Policyを全ての$M$タスクに対して学習する。
論文参考訳（メタデータ） (2023-07-11T22:58:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。