論文の概要: Designing an Automatic Agent for Repeated Language based Persuasion
Games
- arxiv url: http://arxiv.org/abs/2105.04976v1
- Date: Tue, 11 May 2021 12:25:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 19:28:52.177374
- Title: Designing an Automatic Agent for Repeated Language based Persuasion
Games
- Title(参考訳): 繰り返し言語に基づく説得ゲームのための自動エージェントの設計
- Authors: Maya Raifer, Guy Rotman, Reut Apel, Moshe Tennenholtz, Roi Reichart
- Abstract要約: 繰り返す送信者(専門家) -- 受信者(意思決定者)ゲームを考える。
senderは、世界の状況について完全に知らされ、受信者にいくつかの可能な自然言語レビューの1つを送ることで、取引を受け入れるよう説得することを目的としている。
我々は、この繰り返しゲームをプレイする自動専門家をデザインし、最大報酬を達成することを目指している。
- 参考スコア(独自算出の注目度): 32.20930723085839
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Persuasion games are fundamental in economics and AI research and serve as
the basis for important applications. However, work on this setup assumes
communication with stylized messages that do not consist of rich human
language. In this paper we consider a repeated sender (expert) -- receiver
(decision maker) game, where the sender is fully informed about the state of
the world and aims to persuade the receiver to accept a deal by sending one of
several possible natural language reviews. We design an automatic expert that
plays this repeated game, aiming to achieve the maximal payoff. Our expert is
implemented within the Monte Carlo Tree Search (MCTS) algorithm, with deep
learning models that exploit behavioral and linguistic signals in order to
predict the next action of the decision maker, and the future payoff of the
expert given the state of the game and a candidate review. We demonstrate the
superiority of our expert over strong baselines, its adaptability to different
decision makers, and that its selected reviews are nicely adapted to the
proposed deal.
- Abstract(参考訳): 説得ゲームは経済学とAI研究の基本であり、重要な応用の基礎として機能する。
しかし、この設定では、リッチな人間の言語を含まないスタイル化されたメッセージとの通信を想定している。
本稿では,送信者が世界の状況を十分に把握し,複数の可能な自然言語レビューの1つを送ることで,受取人に取引を受け入れるよう説得することを目的とした,繰り返し送信者(専門家)-受信者(意思決定者)ゲームについて考察する。
我々は、この繰り返しゲームをプレイする自動専門家をデザインし、最大報酬を達成することを目指している。
我々のエキスパートはモンテカルロ木探索(mcts)アルゴリズムに実装されており、意思決定者の次の行動を予測するために行動および言語信号を利用するディープラーニングモデルと、ゲームの状態と候補レビューを与えられた専門家の今後の報酬モデルを備えている。
我々は、エキスパートの強力なベースラインに対する優位性、異なる意思決定者への適応性、そして選択したレビューが提案されたディールにうまく適合していることを示します。
関連論文リスト
- Bridging the Gap between Expert and Language Models: Concept-guided Chess Commentary Generation and Evaluation [9.277840736103554]
概念誘導型Chess注釈生成法(CCC)を導入し,GPTに基づくChess注釈評価法(GCC-Eval)を用いて評価を行った。
CCCは、優先順位付けされた概念に基づく説明を通じて、専門家モデルの意思決定の強みとLLMの言語流布を統合する。
GCC-Evalは、専門家の知識を活用して、情報性と言語的品質に基づいて、チェスの解説を評価する。
論文 参考訳(メタデータ) (2024-10-28T07:59:34Z) - Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.94709351266557]
検索強化に関して,言語モデルの信頼性に焦点をあてる。
検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。
言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文 参考訳(メタデータ) (2024-10-22T09:25:21Z) - Algorithmic Persuasion Through Simulation [51.23082754429737]
本研究では,受取人に製品購入などの二元的行動を取るよう説得するベイズ説得ゲームについて検討する。
送信者は、製品の品質が高いか低いかなどの世界の(バイナリ)状態について通知されるが、受信者の信念やユーティリティに関する情報は限られている。
顧客の調査やユーザスタディ、最近のAIの進歩によって動機づけられた私たちは、受信者の振る舞いをシミュレートする託宣をクエリすることで、送信側が受信者についてより深く学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-29T23:01:33Z) - Human Choice Prediction in Language-based Persuasion Games:
Simulation-based Off-Policy Evaluation [24.05034588588407]
本稿では,このようなエージェントの設計における重要な側面について論じる。
人工エージェントを用いた意思決定ゲームを繰り返し行う人間による87Kの意思決定データセットを収集した。
我々のアプローチでは、あるエージェントサブセットと人間のインタラクションに関するモデルをトレーニングして、他のエージェントとのインタラクションにおける決定を予測します。
論文 参考訳(メタデータ) (2023-05-17T16:38:11Z) - Improving Language Model Negotiation with Self-Play and In-Context
Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。
私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文 参考訳(メタデータ) (2023-05-17T11:55:32Z) - Predicting Decisions in Language Based Persuasion Games [31.63182861594025]
本稿では,説得ゲームにおける自然言語の利用について述べる。
これらの決定の予測に有効なモデルを構築することを目的としている。
私たちの結果は、相互作用シーケンスのプレフィックスを与えられたモデルが意思決定者の将来の決定を予測できることを示しています。
論文 参考訳(メタデータ) (2020-12-17T22:52:47Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z) - Expertise Style Transfer: A New Task Towards Better Communication
between Experts and Laymen [88.30492014778943]
そこで我々は,手動で注釈付きデータセットを手動で提供し,専門的なスタイルの転送を行う新しいタスクを提案する。
このタスクの解決は、プロの言語を単純化するだけでなく、レイメンの記述の正確さと専門性の向上にも寄与する。
スタイル転送とテキスト単純化のための5つの最先端モデルのベンチマーク性能を確立する。
論文 参考訳(メタデータ) (2020-05-02T04:50:20Z) - Predicting Strategic Behavior from Free Text [38.506665373140876]
我々は,ゲームとしてモデル化された経済状況下でのメッセージと行動の関連性について検討する。
本研究では,個人が提供した自由テキストに基づくワンショットゲームにおいて,個人の行動予測に関する研究を紹介する。
これらの属性に基づいたワンショットゲームにおいて,これらの個人が行う行動を予測するために,トランスダクティブ・ラーニング(transductive learning)を採用している。
論文 参考訳(メタデータ) (2020-04-06T20:05:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。