論文の概要: ProMediate: A Socio-cognitive framework for evaluating proactive agents in multi-party negotiation
- arxiv url: http://arxiv.org/abs/2510.25224v1
- Date: Wed, 29 Oct 2025 07:00:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.194536
- Title: ProMediate: A Socio-cognitive framework for evaluating proactive agents in multi-party negotiation
- Title(参考訳): ProMediate: 多党交渉における積極的エージェント評価のための社会認知フレームワーク
- Authors: Ziyi Liu, Bahar Sarrafzadeh, Pei Zhou, Longqi Yang, Jieyu Zhao, Ashish Sharma,
- Abstract要約: ProMediateは、複雑なマルチトピック、複数パーティの交渉において、プロアクティブなAIメディエータエージェントを評価するためのフレームワークである。
以上の結果から,社会的に知能なメディエータエージェントは,より速く,よりターゲットのよい介入によって,汎用的なベースラインよりも優れていたことが示唆された。
- 参考スコア(独自算出の注目度): 15.003377735831895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Large Language Models (LLMs) are increasingly used in agentic frameworks to assist individual users, there is a growing need for agents that can proactively manage complex, multi-party collaboration. Systematic evaluation methods for such proactive agents remain scarce, limiting progress in developing AI that can effectively support multiple people together. Negotiation offers a demanding testbed for this challenge, requiring socio-cognitive intelligence to navigate conflicting interests between multiple participants and multiple topics and build consensus. Here, we present ProMediate, the first framework for evaluating proactive AI mediator agents in complex, multi-topic, multi-party negotiations. ProMediate consists of two core components: (i) a simulation testbed based on realistic negotiation cases and theory-driven difficulty levels (ProMediate-Easy, ProMediate-Medium, and ProMediate-Hard), with a plug-and-play proactive AI mediator grounded in socio-cognitive mediation theories, capable of flexibly deciding when and how to intervene; and (ii) a socio-cognitive evaluation framework with a new suite of metrics to measure consensus changes, intervention latency, mediator effectiveness, and intelligence. Together, these components establish a systematic framework for assessing the socio-cognitive intelligence of proactive AI agents in multi-party settings. Our results show that a socially intelligent mediator agent outperforms a generic baseline, via faster, better-targeted interventions. In the ProMediate-Hard setting, our social mediator increases consensus change by 3.6 percentage points compared to the generic baseline (10.65\% vs 7.01\%) while being 77\% faster in response (15.98s vs. 3.71s). In conclusion, ProMediate provides a rigorous, theory-grounded testbed to advance the development of proactive, socially intelligent agents.
- Abstract(参考訳): 大きな言語モデル(LLM)は、個々のユーザを支援するためにエージェントフレームワークでますます使われていますが、複雑なマルチパーティのコラボレーションを積極的に管理できるエージェントの必要性が高まっています。
このようなプロアクティブエージェントの体系的評価手法は依然として乏しく、複数の人を効果的に支援できるAIの開発における進歩を制限している。
交渉は、複数の参加者と複数のトピック間の対立する関心をナビゲートし、コンセンサスを構築するために、社会認知知能を必要とする、この課題に対する要求の高いテストベッドを提供する。
本稿では,複雑なマルチトピック・マルチパーティ交渉において,プロアクティブなAIメディエータエージェントを評価するための最初のフレームワークであるProMediateを紹介する。
ProMediateは2つのコアコンポーネントで構成されている。
一 現実的な交渉事例及び理論駆動難易度(ProMediate-Easy、ProMediate-Medium、ProMediate-Hard)に基づくシミュレーションテストベッドで、社会認知メディエーション理論に基づくプラグアンドプレイプロアクティブAIメディエータにより、いつ、どのように介入するかを柔軟に決定することができる。
(2)コンセンサスの変化,介入遅延,メディエータの有効性,知性を測定するための新しい尺度群を備えた社会認知評価フレームワーク。
これらのコンポーネントは、多人数で活動するAIエージェントの社会的認知知能を評価するための体系的な枠組みを確立する。
以上の結果から,社会的に知能なメディエータエージェントは,より速く,よりターゲットのよい介入によって,汎用的なベースラインよりも優れていたことが示唆された。
ProMediate-Hard設定では、私たちのソーシャルメディエータは、一般的なベースライン(10.65\% vs 7.01\%)と比較してコンセンサスの変化を3.6ポイント増加させ、応答が77\%速く(15.98s vs. 3.71s)。
結論として、ProMediateは、活発で社会的にインテリジェントなエージェントの開発を進めるために、厳格で理論的な根拠のあるテストベッドを提供する。
関連論文リスト
- PartnerMAS: An LLM Hierarchical Multi-Agent Framework for Business Partner Selection on High-Dimensional Features [23.788838112113257]
評価を3層に分割する階層型マルチエージェントフレームワークを提案する。戦略を設計するプランナーエージェント,役割特異的評価を行う専門エージェント,アウトプットを統合するスーパーバイザエージェントである。
140のケースで、PartnerMASはシングルエージェントと議論ベースのマルチエージェントベースラインを一貫して上回り、最大10-15%のマッチレートを達成する。
論文 参考訳(メタデータ) (2025-09-28T19:39:03Z) - Learning to Summarize by Learning to Quiz: Adversarial Agentic Collaboration for Long Document Summarization [86.98098988779809]
SummQは長期文書要約のための新しい逆多重エージェントフレームワークである。
提案手法では,包括的な要約を作成し,評価するために協調作業を行う要約ジェネレータとレビュアーを用いる。
広範に使用されている3つの文書要約ベンチマーク上でSummQを評価する。
論文 参考訳(メタデータ) (2025-09-25T08:36:19Z) - An Automated Multi-modal Evaluation Framework for Mobile Intelligent Assistants Based on Large Language Models and Multi-Agent Collaboration [5.630646705589818]
本稿では,大規模言語モデルとマルチエージェント協調に基づく自動マルチモーダル評価フレームワークを提案する。
このフレームワークは、インタラクション評価エージェント、セマンティック検証エージェント、経験決定エージェントからなる3層エージェントアーキテクチャを採用している。
論文 参考訳(メタデータ) (2025-08-13T05:40:34Z) - From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review [1.4929298667651645]
大規模言語モデルと自律型AIエージェントを評価するベンチマークを2019年から2025年にかけて開発した。
本稿では,知識推論,数学的問題解決,コード生成とソフトウェア工学,事実的根拠と検索,ドメイン固有評価,マルチモーダルおよび具体的タスク,タスクオーケストレーション,インタラクティブアセスメントを対象とする約60のベンチマークの分類法を提案する。
我々は、材料科学、バイオメディカルリサーチ、学術思想、ソフトウェア工学、合成データ生成、数学的問題解決、地理情報システム、マルチメディア、医療、金融における自律型AIエージェントの現実的な応用を提示する。
論文 参考訳(メタデータ) (2025-04-28T11:08:22Z) - Towards Effective GenAI Multi-Agent Collaboration: Design and Evaluation for Enterprise Applications [15.480315462362531]
本稿では,新しいマルチエージェント協調フレームワークにおける協調とルーティング機能に関する総合的な評価について述べる。
コーディネート機能として,エージェント間通信とペイロード参照機構の有効性を実証し,エンドツーエンドの目標達成率を90%とする。
マルチエージェントコラボレーションは,ベンチマークの単一エージェントアプローチと比較して,目標達成率を最大70%向上させる。
論文 参考訳(メタデータ) (2024-12-06T22:14:17Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。