論文の概要: A Data-Driven Method for Recognizing Automated Negotiation Strategies
- arxiv url: http://arxiv.org/abs/2107.01496v1
- Date: Sat, 3 Jul 2021 20:43:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 14:51:36.281531
- Title: A Data-Driven Method for Recognizing Automated Negotiation Strategies
- Title(参考訳): 自動交渉戦略認識のためのデータ駆動手法
- Authors: Ming Li, Pradeep K.Murukannaiah, Catholijn M.Jonker
- Abstract要約: 本稿では,相手の交渉戦略を認識するための新しいデータ駆動型手法を提案する。
我々の手法は、エージェントがドメインに依存しないシーケンスを生成するためのデータ生成方法を含む。
4つの問題シナリオにまたがる広範な実験を行い、アプローチの有効性を実証する。
- 参考スコア(独自算出の注目度): 13.606307819976161
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Understanding an opponent agent helps in negotiating with it. Existing works
on understanding opponents focus on preference modeling (or estimating the
opponent's utility function). An important but largely unexplored direction is
recognizing an opponent's negotiation strategy, which captures the opponent's
tactics, e.g., to be tough at the beginning but to concede toward the deadline.
Recognizing complex, state-of-the-art, negotiation strategies is extremely
challenging, and simple heuristics may not be adequate for this purpose. We
propose a novel data-driven approach for recognizing an opponent's s
negotiation strategy. Our approach includes a data generation method for an
agent to generate domain-independent sequences by negotiating with a variety of
opponents across domains, a feature engineering method for representing
negotiation data as time series with time-step features and overall features,
and a hybrid (recurrent neural network-based) deep learning method for
recognizing an opponent's strategy from the time series of bids. We perform
extensive experiments, spanning four problem scenarios, to demonstrate the
effectiveness of our approach.
- Abstract(参考訳): 相手のエージェントを理解することは交渉に役立ちます。
既存の研究では、相手の好みのモデリング(または相手の効用関数の推定)に焦点を当てている。
重要ではあるがほとんど未熟な方向は、相手の戦略を認識することであり、敵の戦術(例えば、初めは厳しいが期限に近付くこと)を捉えている。
複雑で最先端の交渉戦略を認識することは極めて困難であり、単純なヒューリスティックスはこの目的に適さないかもしれない。
本稿では,相手の交渉戦略を認識するための新しいデータ駆動手法を提案する。
提案手法は,エージェントがドメイン間のさまざまな相手と交渉することで,ドメインに依存しないシーケンスを生成するためのデータ生成方法と,ネゴシエーションデータを時系列として時間ステップ特徴と全体特徴と表現する特徴工学的手法と,入札の時系列から相手の戦略を認識するハイブリッド(リカレントニューラルネットワークベース)ディープラーニング手法とを含む。
4つの問題シナリオにまたがる広範な実験を行い,アプローチの有効性を実証した。
関連論文リスト
- A Fairness-Driven Method for Learning Human-Compatible Negotiation Strategies [19.595627721072812]
報酬設計と探索に公正さを取り入れた交渉枠組みを提案し,人間と互換性のある交渉戦略を学習する。
提案手法は,より平等な交渉結果を達成し,交渉の質を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-09-26T23:16:47Z) - Towards General Negotiation Strategies with End-to-End Reinforcement Learning [3.332967260145465]
多様な交渉問題に対するエンドツーエンドの強化学習手法を開発した。
我々は,本手法が有効であること,また,これまでなかった交渉問題について,他のエージェントと交渉することを学ぶことができることを示す。
論文 参考訳(メタデータ) (2024-06-21T12:24:36Z) - AnySkill: Learning Open-Vocabulary Physical Skill for Interactive Agents [58.807802111818994]
オープンな語彙の指示に従って物理的に妥当な相互作用を学習する新しい階層的手法であるAnySkillを提案する。
我々のアプローチは、模倣学習によって訓練された低レベルコントローラを介して、一連のアトミックアクションを開発することから始まります。
提案手法の重要な特徴は,手動の報酬工学を使わずにオブジェクトとのインタラクションを学習する,高レベルなポリシーに対する画像ベースの報酬の利用である。
論文 参考訳(メタデータ) (2024-03-19T15:41:39Z) - Mutual-modality Adversarial Attack with Semantic Perturbation [81.66172089175346]
本稿では,相互モダリティ最適化スキームにおける敵攻撃を生成する新しい手法を提案する。
我々の手法は最先端の攻撃方法より優れており、プラグイン・アンド・プレイ・ソリューションとして容易にデプロイできる。
論文 参考訳(メタデータ) (2023-12-20T05:06:01Z) - Look at What I'm Doing: Self-Supervised Spatial Grounding of Narrations
in Instructional Videos [78.34818195786846]
ビデオにおけるナレーション相互作用を空間的局所化するタスクについて紹介する。
提案手法の鍵となるのは,映像の大規模コーパスにおける自己スーパービジョンとの相互作用の空間的ローカライズを学習する能力である。
学習中のコントラスト損失を効果的に最適化できる多層マルチモーダルアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T14:45:13Z) - An Autonomous Negotiating Agent Framework with Reinforcement Learning
Based Strategies and Adaptive Strategy Switching Mechanism [3.4376560669160394]
本研究は,専門家選択の問題の解決と,我々の自律交渉エージェントフレームワークで相手の行動に適応することに焦点を当てる。
我々のフレームワークは、新しい戦略を含めるか、古い戦略を定期的により良い戦略で置き換えることを決定することで、自己改善機能を可能にするレビュアーコンポーネントを持っています。
論文 参考訳(メタデータ) (2021-02-06T14:38:03Z) - Finding Effective Security Strategies through Reinforcement Learning and
Self-Play [0.0]
私たちは、効果的なセキュリティ戦略が自己プレイから生まれることを示しています。
この領域における強化学習の既知の課題に対処する。
本手法は2つの基本手法よりも優れているが, 自己再生における政策収束は依然として課題である。
論文 参考訳(メタデータ) (2020-09-17T07:41:27Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Adversarial Augmentation Policy Search for Domain and Cross-Lingual
Generalization in Reading Comprehension [96.62963688510035]
理解モデルを読むことは、しばしばトレーニングデータセットのニュアンスに過度に適合し、敵対的な評価に失敗する。
本稿では,複数の効果的な敵と自動データ拡張ポリシー探索手法を提案し,対角的評価に対して,読解理解モデルをより堅牢にすることを目的とする。
論文 参考訳(メタデータ) (2020-04-13T17:20:08Z) - Dynamic Knowledge Routing Network For Target-Guided Open-Domain
Conversation [79.7781436501706]
本稿では,粗いキーワードを導入することで,システム応答の意図した内容を制御する構造的アプローチを提案する。
また,対話を円滑な目標達成に導くために,より高い成功率で対話を誘導する新たな二重談話レベルの目標誘導戦略を提案する。
論文 参考訳(メタデータ) (2020-02-04T09:49:36Z) - A Deep Reinforcement Learning Approach to Concurrent Bilateral
Negotiation [6.484413431061962]
本稿では,未知および動的電子市場において,エージェントが同時交渉の際の交渉方法を学ぶことのできる,新たな交渉モデルを提案する。
このエージェントは、モデルのない強化学習を備えたアクタークリティカルアーキテクチャを使用して、ディープニューラルネットワークとして表現された戦略を学ぶ。
その結果、事前プログラミングを必要とせず、異なる電子市場設定に適応できる並行交渉のための自動エージェントを構築できる。
論文 参考訳(メタデータ) (2020-01-31T12:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。