論文の概要: Towards General Negotiation Strategies with End-to-End Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2406.15096v1
- Date: Fri, 21 Jun 2024 12:24:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-24 13:42:28.589181
- Title: Towards General Negotiation Strategies with End-to-End Reinforcement Learning
- Title(参考訳): エンド・ツー・エンド強化学習による一般的なネゴシエーション戦略に向けて
- Authors: Bram M. Renting, Thomas M. Moerland, Holger H. Hoos, Catholijn M. Jonker,
- Abstract要約: 多様な交渉問題に対するエンドツーエンドの強化学習手法を開発した。
我々は,本手法が有効であること,また,これまでなかった交渉問題について,他のエージェントと交渉することを学ぶことができることを示す。
- 参考スコア(独自算出の注目度): 3.332967260145465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The research field of automated negotiation has a long history of designing agents that can negotiate with other agents. Such negotiation strategies are traditionally based on manual design and heuristics. More recently, reinforcement learning approaches have also been used to train agents to negotiate. However, negotiation problems are diverse, causing observation and action dimensions to change, which cannot be handled by default linear policy networks. Previous work on this topic has circumvented this issue either by fixing the negotiation problem, causing policies to be non-transferable between negotiation problems or by abstracting the observations and actions into fixed-size representations, causing loss of information and expressiveness due to feature design. We developed an end-to-end reinforcement learning method for diverse negotiation problems by representing observations and actions as a graph and applying graph neural networks in the policy. With empirical evaluations, we show that our method is effective and that we can learn to negotiate with other agents on never-before-seen negotiation problems. Our result opens up new opportunities for reinforcement learning in negotiation agents.
- Abstract(参考訳): 自動交渉の研究分野には、他のエージェントと交渉できるエージェントを設計する長い歴史がある。
このような交渉戦略は伝統的に手動設計とヒューリスティックに基づいている。
最近では、エージェントの交渉訓練にも強化学習アプローチが使われている。
しかし、交渉問題は多様であり、観測と行動の次元が変化し、デフォルトの線形ポリシーネットワークでは処理できない。
交渉課題の解決、交渉問題間の政策の伝達不能化、あるいは観察・行動の定型的表現への抽象化、特徴設計による情報の喪失、表現力の喪失などにより、この問題を回避してきた。
そこで我々は,グラフとして観測と動作を表現し,そのポリシーにグラフニューラルネットワークを適用することにより,多様な交渉問題に対するエンドツーエンド強化学習手法を開発した。
実証的な評価により,本手法は有効であり,これまでなかった交渉問題に対して,他のエージェントと交渉することを学ぶことができることを示す。
交渉員の強化学習の新たな機会が開ける。
関連論文リスト
- Modelling Political Coalition Negotiations Using LLM-based Agents [53.934372246390495]
我々は、新しいNLPタスクとして連立交渉を導入し、それを大規模言語モデルに基づくエージェント間の交渉としてモデル化する。
我々は、欧州政党の宣言とこれらの国における多数の選挙に関する連立協定を含む多言語データセット「POLCA」を導入する。
本稿では、政党間の連立交渉の過程をシミュレートし、その結果を予測するために、階層的なマルコフ決定プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-18T21:28:06Z) - Let's Negotiate! A Survey of Negotiation Dialogue Systems [56.01648785030208]
交渉は人間のコミュニケーションにおいて重要な能力である。
近年の交渉対話システムへの関心は、紛争の解決や合意の達成を支援するインテリジェントなエージェントを作ることを目標としている。
論文 参考訳(メタデータ) (2024-02-02T02:12:46Z) - Assistive Large Language Model Agents for Socially-Aware Negotiation Dialogues [47.977032883078664]
我々はLarge Language Models(LLM)に基づく支援エージェントを開発する。
2つのLLMエージェントをロールプレイに参加させることで、ビジネス交渉をシミュレートする。
第3のLLMは、交渉結果を改善するための基準に違反した発話を書き換える仲介役として機能する。
論文 参考訳(メタデータ) (2024-01-29T09:07:40Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - Language of Bargaining [60.218128617765046]
我々は、言語の使用が二国間交渉をどのように形成するかを研究するための新しいデータセットを構築した。
我々の研究は、交渉の結果を予測する言語信号も明らかにしている。
論文 参考訳(メタデータ) (2023-06-12T13:52:01Z) - Let's Negotiate! A Survey of Negotiation Dialogue Systems [50.8766991794008]
交渉は人間のコミュニケーションにおいて重要な能力の1つである。
目標とは、人間が紛争を解決したり、有益な合意に達するのを効率的に支援する能力を持つ知的エージェントを強化することである。
論文 参考訳(メタデータ) (2022-12-18T12:03:53Z) - A Data-Driven Method for Recognizing Automated Negotiation Strategies [13.606307819976161]
本稿では,相手の交渉戦略を認識するための新しいデータ駆動型手法を提案する。
我々の手法は、エージェントがドメインに依存しないシーケンスを生成するためのデータ生成方法を含む。
4つの問題シナリオにまたがる広範な実験を行い、アプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-07-03T20:43:47Z) - An Autonomous Negotiating Agent Framework with Reinforcement Learning
Based Strategies and Adaptive Strategy Switching Mechanism [3.4376560669160394]
本研究は,専門家選択の問題の解決と,我々の自律交渉エージェントフレームワークで相手の行動に適応することに焦点を当てる。
我々のフレームワークは、新しい戦略を含めるか、古い戦略を定期的により良い戦略で置き換えることを決定することで、自己改善機能を可能にするレビュアーコンポーネントを持っています。
論文 参考訳(メタデータ) (2021-02-06T14:38:03Z) - A Deep Reinforcement Learning Approach to Concurrent Bilateral
Negotiation [6.484413431061962]
本稿では,未知および動的電子市場において,エージェントが同時交渉の際の交渉方法を学ぶことのできる,新たな交渉モデルを提案する。
このエージェントは、モデルのない強化学習を備えたアクタークリティカルアーキテクチャを使用して、ディープニューラルネットワークとして表現された戦略を学ぶ。
その結果、事前プログラミングを必要とせず、異なる電子市場設定に適応できる並行交渉のための自動エージェントを構築できる。
論文 参考訳(メタデータ) (2020-01-31T12:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。