論文の概要: Automated Configuration of Negotiation Strategies
- arxiv url: http://arxiv.org/abs/2004.00094v1
- Date: Tue, 31 Mar 2020 20:31:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 00:31:21.607903
- Title: Automated Configuration of Negotiation Strategies
- Title(参考訳): 交渉戦略の自動化構成
- Authors: Bram M. Renting (1), Holger H. Hoos (2), Catholijn M. Jonker (1 and 2)
((1) Delft University of Technology, (2) Leiden University)
- Abstract要約: 入札と受理戦略は、線形加法および非線形効用関数を持つシナリオにおける交渉の結果に大きな影響を及ぼす。
提案手法は,自動アルゴリズムの構成を利用して,特定のネゴシエーション設定のための最善の戦略を見つける手法である。
自動設定されたエージェントは他のエージェントよりも優れており、次のエージェントに比べて交渉のペイオフが5.1%増加していることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bidding and acceptance strategies have a substantial impact on the outcome of
negotiations in scenarios with linear additive and nonlinear utility functions.
Over the years, it has become clear that there is no single best strategy for
all negotiation settings, yet many fixed strategies are still being developed.
We envision a shift in the strategy design question from: What is a good
strategy?, towards: What could be a good strategy? For this purpose, we
developed a method leveraging automated algorithm configuration to find the
best strategies for a specific set of negotiation settings. By empowering
automated negotiating agents using automated algorithm configuration, we obtain
a flexible negotiation agent that can be configured automatically for a rich
space of opponents and negotiation scenarios.
To critically assess our approach, the agent was tested in an ANAC-like
bilateral automated negotiation tournament setting against past competitors. We
show that our automatically configured agent outperforms all other agents, with
a 5.1% increase in negotiation payoff compared to the next-best agent. We note
that without our agent in the tournament, the top-ranked agent wins by a margin
of only 0.01%.
- Abstract(参考訳): 入札と受理戦略は、線形加法および非線形効用関数を持つシナリオにおける交渉の結果に大きな影響を及ぼす。
長年にわたり、全ての交渉設定に最善の戦略は存在しないが、まだ多くの固定戦略が開発されている。
戦略設計に関する質問は,次のような変化を想定しています。
優れた戦略とは何か?
そこで本研究では,特定の交渉設定に対して最適な戦略を見つけるために,アルゴリズムの自動設定を活用する手法を開発した。
自動アルゴリズム構成による自動交渉エージェントの強化により、対戦者や交渉シナリオの豊富なスペースに自動的に設定可能な柔軟な交渉エージェントが得られる。
このアプローチを批判的に評価するために、エージェントは過去の競合相手とのanacライクな二国間自動交渉トーナメントでテストされた。
当社の自動構成エージェントは他のエージェントよりも優れており、次のベストエージェントと比較して交渉報酬は5.1%増加した。
トーナメントで我々のエージェントがなければ、トップランクのエージェントはわずか0.01%のマージンで勝ちます。
関連論文リスト
- A Negotiator's Backup Plan: Optimal Concessions with a Reservation Value [3.3058382994863984]
本稿では,個人予約値との双方向交渉を行うため,MIA-RVelousと呼ばれる入札戦略を開発する。
提案したグリーディアルゴリズムは、エージェントが相手に対する信念を$O(n2D)$ timeで考えると、最適な入札順序を求める。
論文 参考訳(メタデータ) (2024-04-30T08:45:18Z) - Strategic Apple Tasting [35.25249063553063]
ハイテイク領域におけるアルゴリズムによる意思決定は、しばしばアルゴリズムへの入力を戦略的に修正するインセンティブを持つエージェントに決定を割り当てる。
我々は、この設定をリンゴ味のフィードバックによるオンライン学習問題として定式化する。
我々の目標は、プリンシパルのパフォーマンスを後見の最良の固定政策のパフォーマンスと比較する、サブリニアな戦略的後悔を達成することです。
論文 参考訳(メタデータ) (2023-06-09T20:46:31Z) - Provably Efficient Fictitious Play Policy Optimization for Zero-Sum
Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。
我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。
提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文 参考訳(メタデータ) (2022-07-25T18:29:16Z) - Decentralized Optimistic Hyperpolicy Mirror Descent: Provably No-Regret
Learning in Markov Games [95.10091348976779]
我々はマルコフゲームにおいて、非定常的でおそらく敵対的な相手と遊べる単一のエージェントを制御する分散ポリシー学習について研究する。
我々は、新しいアルゴリズム、アンダーラインデ集中型アンダーラインハイプラインRpolicy munderlineIrror deunderlineScent (DORIS)を提案する。
DORISは、一般的な関数近似の文脈で$sqrtK$-regretを達成する。
論文 参考訳(メタデータ) (2022-06-03T14:18:05Z) - Conditional Imitation Learning for Multi-Agent Games [89.897635970366]
本研究では,条件付きマルチエージェント模倣学習の課題について考察する。
本稿では,スケーラビリティとデータ不足の難しさに対処する新しい手法を提案する。
我々のモデルは,egoやパートナエージェント戦略よりも低ランクなサブスペースを学習し,サブスペースに補間することで,新たなパートナ戦略を推論し,適応する。
論文 参考訳(メタデータ) (2022-01-05T04:40:13Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - A Data-Driven Method for Recognizing Automated Negotiation Strategies [13.606307819976161]
本稿では,相手の交渉戦略を認識するための新しいデータ駆動型手法を提案する。
我々の手法は、エージェントがドメインに依存しないシーケンスを生成するためのデータ生成方法を含む。
4つの問題シナリオにまたがる広範な実験を行い、アプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-07-03T20:43:47Z) - A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in
Online Advertising [53.636153252400945]
本稿では,自動入札のための総合的マルチエージェント強化学習フレームワーク,すなわちMAABを提案し,自動入札戦略を学習する。
当社のアプローチは、社会的福祉の観点から、いくつかの基準的手法を上回り、広告プラットフォームの収益を保証します。
論文 参考訳(メタデータ) (2021-06-11T08:07:14Z) - An Autonomous Negotiating Agent Framework with Reinforcement Learning
Based Strategies and Adaptive Strategy Switching Mechanism [3.4376560669160394]
本研究は,専門家選択の問題の解決と,我々の自律交渉エージェントフレームワークで相手の行動に適応することに焦点を当てる。
我々のフレームワークは、新しい戦略を含めるか、古い戦略を定期的により良い戦略で置き換えることを決定することで、自己改善機能を可能にするレビュアーコンポーネントを持っています。
論文 参考訳(メタデータ) (2021-02-06T14:38:03Z) - Universal Trading for Order Execution with Oracle Policy Distillation [99.57416828489568]
本稿では,不完全な市場状態と注文実行のための最適な行動シーケンスとのギャップを埋める,新たなユニバーサル取引ポリシー最適化フレームワークを提案する。
本研究の枠組みは,完全情報を持つ託宣教師による実践的最適実行に向けて,共通政策の学習を指導する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-01-28T05:52:18Z) - A Deep Reinforcement Learning Approach to Concurrent Bilateral
Negotiation [6.484413431061962]
本稿では,未知および動的電子市場において,エージェントが同時交渉の際の交渉方法を学ぶことのできる,新たな交渉モデルを提案する。
このエージェントは、モデルのない強化学習を備えたアクタークリティカルアーキテクチャを使用して、ディープニューラルネットワークとして表現された戦略を学ぶ。
その結果、事前プログラミングを必要とせず、異なる電子市場設定に適応できる並行交渉のための自動エージェントを構築できる。
論文 参考訳(メタデータ) (2020-01-31T12:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。