Fugu-MT 論文翻訳(概要): CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs

論文の概要: CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs

arxiv url: http://arxiv.org/abs/2605.09823v1
Date: Sun, 10 May 2026 23:56:02 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-12 23:28:50.436244
Title: CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs
Title（参考訳）: CalBench: マルチエージェントLLMにおけるコーディネーション・プライオリティのトレードオフ評価
Authors: Chelsea Zou, Yiheng Yao, Selena She, Robert D. Hawkins,
Abstract要約: CalBenchはカレンダースケジューリングを通じてマルチエージェント協調を研究するための制御された評価環境である。 Nエージェントはそれぞれ、既存のコミットメントを含むプライベートカレンダーを管理し、Mミーティングのストリームをスケジュールするために調整する必要があります。 CalBenchは、破壊コストの分散におけるタスク成功、コミュニケーション効率、公平性の正確な検証を可能にする。
参考スコア（独自算出の注目度）: 2.2966407195447727
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce CalBench, a controlled evaluation environment for studying multi-agent coordination through calendar scheduling. In CalBench, N agents each manage a private calendar containing pre-existing commitments and must coordinate to schedule a stream of M incoming meetings while minimizing disruption costs. Because agents observe only their own calendars, successful scheduling requires communication across private information boundaries. Each scenario is generated with an oracle solution, enabling precise measurement of coordination quality via realized-to-optimal cost, as well as a Distributed Constraint Optimization (DCOP) baseline to provide a fair comparison under the same private-information constraints. CalBench enables precise verification of task success, communication efficiency, and fairness in the distribution of disruption costs. Our environment also studies privacy-preserving coordination by augmenting calendar entries with private semantic contexts of varying sensitivity and measuring whether agents reveal task-irrelevant private information during negotiation. Unlike multi-agent benchmarks where a single capable agent can often substitute for the group, CalBench is inherently decentralized: no agent has access to another agent's private calendar, yet agents must still reach mutually consistent decisions over shared meeting scheduling. CalBench therefore provides a practical and verifiable setting for studying coordination protocols, communication efficiency, negotiation strategies, fairness, and privacy leakage in multi-agent systems.
Abstract（参考訳）: カレンダースケジューリングによるマルチエージェント協調学習のための制御評価環境であるCalBenchを紹介する。 CalBenchでは、Nエージェントはそれぞれ、既存のコミットメントを含むプライベートカレンダを管理し、混乱コストを最小限に抑えながらMからのミーティングのストリームをスケジュールするように調整する必要がある。エージェントは自身のカレンダーのみを観測するため、成功したスケジューリングはプライベートな情報境界を越えて通信する必要がある。各シナリオはオラクルソリューションで生成され、実際の最適コストによる調整品質の正確な測定と、同じプライベート情報制約の下で公正な比較を提供する分散型制約最適化(DCOP)ベースラインが実現される。 CalBenchは、破壊コストの分散におけるタスク成功、コミュニケーション効率、公平性の正確な検証を可能にする。我々の環境はまた、カレンダーエントリを様々な感度のプライベートセマンティックコンテキストで拡張し、交渉中にエージェントがタスク非関連なプライベート情報を明らかにするかどうかを測定することにより、プライバシ保護のコーディネーションも研究している。単一の有能なエージェントがグループを置換できるマルチエージェントベンチマークとは異なり、CalBenchは本質的に分散化されている: エージェントが他のエージェントのプライベートカレンダーにアクセスできないが、エージェントは共有ミーティングスケジュールよりも相互に一貫した決定を下さなければならない。 CalBenchは、多エージェントシステムにおける協調プロトコル、通信効率、交渉戦略、公正性、プライバシー漏洩を研究するための実用的で検証可能な設定を提供する。

関連論文リスト

Multi-Agent Reinforcement Learning for Task Offloading in Wireless Edge Networks [3.065057842316041]
エッジコンピューティングシステムでは、自律エージェントは共有リソースを競いながら、高速なローカル決定をしなければならない。本稿では,各エージェントが制約付きマルコフ決定プロセス(CMDP)を解き,共有制約ベクトルを通じて暗黙的にコーディネートする分散フレームワークを提案する。安全強化学習を用いて、エージェントは、地域とグローバルの両方の目標を満たすポリシーを学ぶ。
論文参考訳（メタデータ） (2025-09-01T08:47:36Z)
AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.291969093748005]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。静的ロールや集中制御の以前のアプローチとは異なり、AgentNetはエージェントがローカルの専門知識とコンテキストに基づいて接続とタスクのルーティングを調整することができる。実験の結果,AgentNetは単一エージェントと集中型マルチエージェントのベースラインよりも高いタスク精度を実現することがわかった。
論文参考訳（メタデータ） (2025-04-01T09:45:25Z)
MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents [59.825725526176655]
大規模言語モデル(LLM)は、自律的なエージェントとして顕著な能力を示している。既存のベンチマークでは、単一エージェントタスクにフォーカスするか、狭いドメインに限定されており、マルチエージェントのコーディネーションと競合のダイナミクスを捉えていない。多様な対話シナリオにまたがってLLMベースのマルチエージェントシステムを評価するためのベンチマークであるMultiAgentBenchを紹介する。
論文参考訳（メタデータ） (2025-03-03T05:18:50Z)
Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文参考訳（メタデータ） (2024-11-01T05:56:51Z)
Learning Multi-Agent Intention-Aware Communication for Optimal Multi-Order Execution in Finance [96.73189436721465]
まず,現実的な制約を考慮したマルチオーダー実行のためのマルチエージェントRL(MARL)手法を提案する。本稿では,学習可能なマルチラウンド通信プロトコルを提案する。 2つの実世界の市場のデータに関する実験では、優れたパフォーマンスを示し、コラボレーションの有効性が著しく向上した。
論文参考訳（メタデータ） (2023-07-06T16:45:40Z)
Differential Privacy in Cooperative Multiagent Planning [27.194032494266086]
我々は,到達不能な目的を持つマルコフゲームとして定式化された逐次決定問題について検討する。エージェントの通信されたシンボル状態軌跡を民営化するために,差分プライバシー機構を適用した。相関関係の価値を下げることにより、プライバシーに堅牢なポリシーを合成する。
論文参考訳（メタデータ） (2023-01-20T21:36:57Z)
Cooperative Actor-Critic via TD Error Aggregation [12.211031907519827]
本稿では、プライバシー問題に違反しないTDエラーアグリゲーションを備えた分散型アクター批判アルゴリズムを提案する。我々は,各エージェントが平均目標関数を最大化するために,ステップサイズを小さくして収束解析を行う。
論文参考訳（メタデータ） (2022-07-25T21:10:39Z)
Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文参考訳（メタデータ） (2021-12-03T19:23:48Z)
Scalable Multi-Agent Reinforcement Learning for Residential Load Scheduling under Data Governance [5.37556626581816]
マルチエージェント強化学習 (MARL) は, 協調型住宅負荷スケジューリング問題において, 顕著な進歩を遂げている。 MARLの最も一般的なパラダイムである集中型トレーニングは、通信制約のあるクラウドエッジ環境における大規模デプロイメントを制限する。提案手法は,家庭の局所的な観察のみに基づく個人評論家の学習機能である,アクタ批判的手法に基づく。
論文参考訳（メタデータ） (2021-10-06T14:05:26Z)
A Cordial Sync: Going Beyond Marginal Policies for Multi-Agent Embodied Tasks [111.34055449929487]
エージェントが協力して家具をリビングルームに移動させるという,新しいタスクFurnMoveを紹介した。既存のタスクとは異なり、FurnMoveはエージェントが各タイミングで調整する必要がある。既存の分散化されたアクションサンプリング手順は、表現力のある共同アクションポリシーを許さない。 SynC-policiesとCORDIALを用いて、我々のエージェントはFurnMoveで58%の完成率を達成する。
論文参考訳（メタデータ） (2020-07-09T17:59:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。