論文の概要: A Contextual Combinatorial Bandit Approach to Negotiation
- arxiv url: http://arxiv.org/abs/2407.00567v1
- Date: Sun, 30 Jun 2024 02:43:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 02:36:46.475069
- Title: A Contextual Combinatorial Bandit Approach to Negotiation
- Title(参考訳): コンテキストアベレーティブ・バンドのネゴシエーションへのアプローチ
- Authors: Yexin Li, Zhancun Mu, Siyuan Qi,
- Abstract要約: 効果的な交渉戦略の学習は、探索・探索ジレンマと大きな行動空間を扱うという2つの重要な課題を提起する。
本稿では,様々な交渉問題に対処するための包括的定式化を提案する。
交渉における部分的な観察や複雑な報酬関数といった共通問題にも対処する新しい手法であるNegUCBを導入する。
- 参考スコア(独自算出の注目度): 9.679237829784938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning effective negotiation strategies poses two key challenges: the exploration-exploitation dilemma and dealing with large action spaces. However, there is an absence of learning-based approaches that effectively address these challenges in negotiation. This paper introduces a comprehensive formulation to tackle various negotiation problems. Our approach leverages contextual combinatorial multi-armed bandits, with the bandits resolving the exploration-exploitation dilemma, and the combinatorial nature handles large action spaces. Building upon this formulation, we introduce NegUCB, a novel method that also handles common issues such as partial observations and complex reward functions in negotiation. NegUCB is contextual and tailored for full-bandit feedback without constraints on the reward functions. Under mild assumptions, it ensures a sub-linear regret upper bound. Experiments conducted on three negotiation tasks demonstrate the superiority of our approach.
- Abstract(参考訳): 効果的な交渉戦略の学習は、探索・探索ジレンマと大きな行動空間を扱うという2つの重要な課題を提起する。
しかし、交渉においてこれらの課題を効果的に解決する学習ベースのアプローチは存在しない。
本稿では,様々な交渉問題に対処するための包括的定式化を提案する。
提案手法は,探索・探索ジレンマを解き,組み合わせの性質が大きな行動空間を扱えるように,文脈的組合せ型マルチアーム・バンディットを活用している。
この定式化に基づいて、交渉における部分的な観察や複雑な報酬関数といった共通問題にも対処する新しい手法であるNegUCBを導入する。
NegUCBは文脈的であり、報酬関数に制約を加えることなくフルバンドフィードバックに適合する。
軽微な仮定の下では、サブ線形後悔の上界が保証される。
3つの交渉課題で行われた実験は、我々のアプローチの優位性を実証している。
関連論文リスト
- Towards General Negotiation Strategies with End-to-End Reinforcement Learning [3.332967260145465]
多様な交渉問題に対するエンドツーエンドの強化学習手法を開発した。
我々は,本手法が有効であること,また,これまでなかった交渉問題について,他のエージェントと交渉することを学ぶことができることを示す。
論文 参考訳(メタデータ) (2024-06-21T12:24:36Z) - Robustness Assessment of Mathematical Reasoning in the Presence of Missing and Contradictory Conditions [48.251724997889184]
我々は、ミス・コントラクタリー条件(PMC)に関する問題というベンチマークを開発する。
本稿では,これらのシナリオにおける数ショットプロンプト手法の性能を評価するための2つの新しい指標を提案する。
SMT-LIB Prompting (SLP) と呼ばれる,SMT-LIB言語を用いて直接解決する代わりに,この問題をモデル化する手法を提案する。
論文 参考訳(メタデータ) (2024-06-07T16:24:12Z) - Few-Shot Adversarial Prompt Learning on Vision-Language Models [62.50622628004134]
知覚不能な逆境摂動に対するディープニューラルネットワークの脆弱性は、広く注目を集めている。
それまでの努力は、相手の視覚的特徴をテキストの監督と整合させることで、ゼロショットの敵の堅牢性を達成した。
本稿では、限られたデータで入力シーケンスを適応させることで、対向性を大幅に向上させる、数ショットの対向的プロンプトフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-21T18:28:43Z) - Let's Negotiate! A Survey of Negotiation Dialogue Systems [56.01648785030208]
交渉は人間のコミュニケーションにおいて重要な能力である。
近年の交渉対話システムへの関心は、紛争の解決や合意の達成を支援するインテリジェントなエージェントを作ることを目標としている。
論文 参考訳(メタデータ) (2024-02-02T02:12:46Z) - Assistive Large Language Model Agents for Socially-Aware Negotiation Dialogues [47.977032883078664]
我々はLarge Language Models(LLM)に基づく支援エージェントを開発する。
2つのLLMエージェントをロールプレイに参加させることで、ビジネス交渉をシミュレートする。
第3のLLMは、交渉結果を改善するための基準に違反した発話を書き換える仲介役として機能する。
論文 参考訳(メタデータ) (2024-01-29T09:07:40Z) - Foundations of Reinforcement Learning and Interactive Decision Making [81.76863968810423]
本稿では,頻度主義的アプローチとベイズ的アプローチを用いた探索・探索ジレンマに対処するための統一的な枠組みを提案する。
ニューラルネットワークのような近似とフレキシブルなモデルクラスを機能させるために特別な注意が払われる。
論文 参考訳(メタデータ) (2023-12-27T21:58:45Z) - On the Robustness of Epoch-Greedy in Multi-Agent Contextual Bandit
Mechanisms [0.7734726150561088]
最も顕著な文脈的バンディットアルゴリズムである$epsilon$-greedyは、戦略兵器がもたらした課題に対処するために拡張可能であることを示す。
また、$epsilon$-greedyは本質的に敵対的なデータ汚職攻撃に対して堅牢であり、汚職の量とともに線形に劣化するパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2023-07-15T01:20:31Z) - Let's Negotiate! A Survey of Negotiation Dialogue Systems [50.8766991794008]
交渉は人間のコミュニケーションにおいて重要な能力の1つである。
目標とは、人間が紛争を解決したり、有益な合意に達するのを効率的に支援する能力を持つ知的エージェントを強化することである。
論文 参考訳(メタデータ) (2022-12-18T12:03:53Z) - Two-Level Supervised Contrastive Learning for Response Selection in
Multi-Turn Dialogue [18.668723854662584]
本稿では,教師付きコントラスト損失を用いたコントラスト学習を課題に適用する。
我々は,2段階の教師付きコントラスト学習と呼ばれる,教師付きコントラスト学習の新しい手法を開発した。
論文 参考訳(メタデータ) (2022-03-01T23:43:36Z) - A Bag of Tricks for Dialogue Summarization [7.7837843673493685]
課題は,複数の話者に属する対話の部分の処理と識別,否定的理解,状況の推論,非公式言語理解の4つである。
事前訓練されたシーケンス・ツー・シーケンス言語モデルを用いて、話者名置換、否定的スコープハイライト、関連するタスクによるマルチタスク学習、ドメイン内のデータの事前学習について検討する。
論文 参考訳(メタデータ) (2021-09-16T21:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。