論文の概要: An Autonomous Negotiating Agent Framework with Reinforcement Learning
Based Strategies and Adaptive Strategy Switching Mechanism
- arxiv url: http://arxiv.org/abs/2102.03588v2
- Date: Tue, 9 Feb 2021 11:34:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-10 14:18:31.176484
- Title: An Autonomous Negotiating Agent Framework with Reinforcement Learning
Based Strategies and Adaptive Strategy Switching Mechanism
- Title(参考訳): 強化学習に基づく戦略と適応的戦略切り替え機構を備えた自律交渉エージェントフレームワーク
- Authors: Ayan Sengupta, Yasser Mohammad, Shinji Nakadai
- Abstract要約: 本研究は,専門家選択の問題の解決と,我々の自律交渉エージェントフレームワークで相手の行動に適応することに焦点を当てる。
我々のフレームワークは、新しい戦略を含めるか、古い戦略を定期的により良い戦略で置き換えることを決定することで、自己改善機能を可能にするレビュアーコンポーネントを持っています。
- 参考スコア(独自算出の注目度): 3.4376560669160394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite abundant negotiation strategies in literature, the complexity of
automated negotiation forbids a single strategy from being dominant against all
others in different negotiation scenarios. To overcome this, one approach is to
use mixture of experts, but at the same time, one problem of this method is the
selection of experts, as this approach is limited by the competency of the
experts selected. Another problem with most negotiation strategies is their
incapability of adapting to dynamic variation of the opponent's behaviour
within a single negotiation session resulting in poor performance. This work
focuses on both, solving the problem of expert selection and adapting to the
opponent's behaviour with our Autonomous Negotiating Agent Framework. This
framework allows real-time classification of opponent's behaviour and provides
a mechanism to select, switch or combine strategies within a single negotiation
session. Additionally, our framework has a reviewer component which enables
self-enhancement capability by deciding to include new strategies or replace
old ones with better strategies periodically. We demonstrate an instance of our
framework by implementing maximum entropy reinforcement learning based
strategies with a deep learning based opponent classifier. Finally, we evaluate
the performance of our agent against state-of-the-art negotiators under varied
negotiation scenarios.
- Abstract(参考訳): 文学における豊富な交渉戦略にもかかわらず、自動化された交渉の複雑さは、異なる交渉シナリオで他のすべてに対して支配的であるから単一の戦略を妨げます。
これを克服するための一つのアプローチは、専門家の混合を使うというものであるが、同時に、この方法の問題は専門家の選択であり、このアプローチは、選択した専門家の能力によって制限される。
ほとんどの交渉戦略のもう1つの問題は、単一の交渉セッションで相手の行動のダイナミックな変化に適応することができず、結果的にパフォーマンスが低下することである。
本研究は,専門家選択の問題を解決することと,自律交渉エージェントフレームワークを用いて相手の行動に適応することの両方に焦点を当てている。
このフレームワークは、相手の行動をリアルタイムで分類し、単一の交渉セッション内で戦略を選択、切り替え、または組み合わせるメカニズムを提供します。
さらに,新しい戦略を含めるか,古い戦略を定期的により良い戦略に置き換えるかを決めることで,自己啓発機能を実現するレビュアーコンポーネントも備えている。
本稿では,最大エントロピー強化学習に基づく戦略を深層学習に基づく敵分類器を用いて実装し,その実例を示す。
最後に,様々な交渉シナリオ下での最先端の交渉者に対するエージェントの性能を評価する。
関連論文リスト
- A Fairness-Driven Method for Learning Human-Compatible Negotiation Strategies [19.595627721072812]
報酬設計と探索に公正さを取り入れた交渉枠組みを提案し,人間と互換性のある交渉戦略を学習する。
提案手法は,より平等な交渉結果を達成し,交渉の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-09-26T23:16:47Z) - Towards General Negotiation Strategies with End-to-End Reinforcement Learning [3.332967260145465]
多様な交渉問題に対するエンドツーエンドの強化学習手法を開発した。
我々は,本手法が有効であること,また,これまでなかった交渉問題について,他のエージェントと交渉することを学ぶことができることを示す。
論文 参考訳(メタデータ) (2024-06-21T12:24:36Z) - Strength Lies in Differences! Improving Strategy Planning for Non-collaborative Dialogues via Diversified User Simulation [69.5677514160986]
本研究では,多様なユーザとの戦略的対話に携わる非協力的対話エージェントについて検討する。
これは既存の対話エージェントに2つの大きな課題をもたらす。
本稿では,ユーザ認識型戦略計画モジュールと人口ベーストレーニングパラダイムを取り入れた,適切な戦略計画の能力を高めるためのTripを提案する。
論文 参考訳(メタデータ) (2024-03-11T14:38:16Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - Rehearsal: Simulating Conflict to Teach Conflict Resolution [54.32934135393982]
リハーサル(Rehearsal)は、ユーザーがシミュレート可能なインターロケータで競合をリハーサルできるシステムである。
ユーザはRehearsalを使って、事前に定義されたさまざまなコンフリクトシナリオの処理を実践できる。
リハーサルはIRPを使って紛争解決理論に基づく発話を生成する。
論文 参考訳(メタデータ) (2023-09-21T17:59:20Z) - Conditional Imitation Learning for Multi-Agent Games [89.897635970366]
本研究では,条件付きマルチエージェント模倣学習の課題について考察する。
本稿では,スケーラビリティとデータ不足の難しさに対処する新しい手法を提案する。
我々のモデルは,egoやパートナエージェント戦略よりも低ランクなサブスペースを学習し,サブスペースに補間することで,新たなパートナ戦略を推論し,適応する。
論文 参考訳(メタデータ) (2022-01-05T04:40:13Z) - A Data-Driven Method for Recognizing Automated Negotiation Strategies [13.606307819976161]
本稿では,相手の交渉戦略を認識するための新しいデータ駆動型手法を提案する。
我々の手法は、エージェントがドメインに依存しないシーケンスを生成するためのデータ生成方法を含む。
4つの問題シナリオにまたがる広範な実験を行い、アプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-07-03T20:43:47Z) - Moody Learners -- Explaining Competitive Behaviour of Reinforcement
Learning Agents [65.2200847818153]
競合シナリオでは、エージェントは動的環境を持つだけでなく、相手の行動に直接影響される。
エージェントのQ値の観察は通常、その振る舞いを説明する方法であるが、選択されたアクション間の時間的関係は示さない。
論文 参考訳(メタデータ) (2020-07-30T11:30:42Z) - Learning Goal-oriented Dialogue Policy with Opposite Agent Awareness [116.804536884437]
本稿では,目標指向対話における政策学習のための逆行動認識フレームワークを提案する。
我々は、その行動から相手エージェントの方針を推定し、この推定を用いてターゲットエージェントを対象ポリシーの一部として関連づけて改善する。
論文 参考訳(メタデータ) (2020-04-21T03:13:44Z) - Automated Configuration of Negotiation Strategies [0.0]
入札と受理戦略は、線形加法および非線形効用関数を持つシナリオにおける交渉の結果に大きな影響を及ぼす。
提案手法は,自動アルゴリズムの構成を利用して,特定のネゴシエーション設定のための最善の戦略を見つける手法である。
自動設定されたエージェントは他のエージェントよりも優れており、次のエージェントに比べて交渉のペイオフが5.1%増加していることを示す。
論文 参考訳(メタデータ) (2020-03-31T20:31:33Z) - A Deep Reinforcement Learning Approach to Concurrent Bilateral
Negotiation [6.484413431061962]
本稿では,未知および動的電子市場において,エージェントが同時交渉の際の交渉方法を学ぶことのできる,新たな交渉モデルを提案する。
このエージェントは、モデルのない強化学習を備えたアクタークリティカルアーキテクチャを使用して、ディープニューラルネットワークとして表現された戦略を学ぶ。
その結果、事前プログラミングを必要とせず、異なる電子市場設定に適応できる並行交渉のための自動エージェントを構築できる。
論文 参考訳(メタデータ) (2020-01-31T12:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。