論文の概要: Designing an Automatic Agent for Repeated Language based Persuasion
Games
- arxiv url: http://arxiv.org/abs/2105.04976v1
- Date: Tue, 11 May 2021 12:25:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 19:28:52.177374
- Title: Designing an Automatic Agent for Repeated Language based Persuasion
Games
- Title(参考訳): 繰り返し言語に基づく説得ゲームのための自動エージェントの設計
- Authors: Maya Raifer, Guy Rotman, Reut Apel, Moshe Tennenholtz, Roi Reichart
- Abstract要約: 繰り返す送信者(専門家) -- 受信者(意思決定者)ゲームを考える。
senderは、世界の状況について完全に知らされ、受信者にいくつかの可能な自然言語レビューの1つを送ることで、取引を受け入れるよう説得することを目的としている。
我々は、この繰り返しゲームをプレイする自動専門家をデザインし、最大報酬を達成することを目指している。
- 参考スコア(独自算出の注目度): 32.20930723085839
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Persuasion games are fundamental in economics and AI research and serve as
the basis for important applications. However, work on this setup assumes
communication with stylized messages that do not consist of rich human
language. In this paper we consider a repeated sender (expert) -- receiver
(decision maker) game, where the sender is fully informed about the state of
the world and aims to persuade the receiver to accept a deal by sending one of
several possible natural language reviews. We design an automatic expert that
plays this repeated game, aiming to achieve the maximal payoff. Our expert is
implemented within the Monte Carlo Tree Search (MCTS) algorithm, with deep
learning models that exploit behavioral and linguistic signals in order to
predict the next action of the decision maker, and the future payoff of the
expert given the state of the game and a candidate review. We demonstrate the
superiority of our expert over strong baselines, its adaptability to different
decision makers, and that its selected reviews are nicely adapted to the
proposed deal.
- Abstract(参考訳): 説得ゲームは経済学とAI研究の基本であり、重要な応用の基礎として機能する。
しかし、この設定では、リッチな人間の言語を含まないスタイル化されたメッセージとの通信を想定している。
本稿では,送信者が世界の状況を十分に把握し,複数の可能な自然言語レビューの1つを送ることで,受取人に取引を受け入れるよう説得することを目的とした,繰り返し送信者(専門家)-受信者(意思決定者)ゲームについて考察する。
我々は、この繰り返しゲームをプレイする自動専門家をデザインし、最大報酬を達成することを目指している。
我々のエキスパートはモンテカルロ木探索(mcts)アルゴリズムに実装されており、意思決定者の次の行動を予測するために行動および言語信号を利用するディープラーニングモデルと、ゲームの状態と候補レビューを与えられた専門家の今後の報酬モデルを備えている。
我々は、エキスパートの強力なベースラインに対する優位性、異なる意思決定者への適応性、そして選択したレビューが提案されたディールにうまく適合していることを示します。
関連論文リスト
- Beyond Profile: From Surface-Level Facts to Deep Persona Simulation in LLMs [50.0874045899661]
本稿では,キャラクタの言語パターンと特徴的思考過程の両方を再現するモデルであるキャラクタボットを紹介する。
ケーススタディとしてLu Xunを用いて、17冊のエッセイコレクションから得られた4つのトレーニングタスクを提案する。
これには、外部の言語構造と知識を習得することに焦点を当てた事前訓練タスクと、3つの微調整タスクが含まれる。
言語的正確性と意見理解の3つのタスクにおいて、キャラクタボットを評価し、適応されたメトリクスのベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-02-18T16:11:54Z) - Verbalized Bayesian Persuasion [54.55974023595722]
情報設計(ID)は、送信者が受信者の最適な振る舞いにどのように影響し、特定の目的を達成するかを探索する。
本研究は,従来のBPを人間の対話を含む現実のゲームに拡張した,ベイズ説得(BP)における言語化フレームワークを提案する。
勧告書,法廷相互作用,法執行機関などの対話シナリオにおける数値実験により,従来のBPの理論的結果の再現と効果的な説得戦略の発見が可能であることを確認した。
論文 参考訳(メタデータ) (2025-02-03T18:20:10Z) - Mastering Board Games by External and Internal Planning with Language Models [30.782334791241556]
検索ベースプランニングにより,複数のボードゲームにおいてLLMのプレイ能力を大幅に向上させることができることを示す。
外部探索において、モデルはモンテカルロ木探索のロールアウトと外部エンジンへの呼び出しなしに評価をガイドし、内部探索では、モデルが潜在的将来性の線形化木を直接コンテキスト内で生成する。
どちらも、関連するドメイン知識に基づいて事前訓練された言語モデルを構築し、これらのゲーム間の遷移と価値関数をキャプチャする。
論文 参考訳(メタデータ) (2024-12-02T18:56:51Z) - Bridging the Gap between Expert and Language Models: Concept-guided Chess Commentary Generation and Evaluation [9.277840736103554]
我々は,言語による複雑な意思決定プロセスを説明する代表的タスクとして,チェスの解説に焦点をあてる。
概念誘導型Chess注釈生成法(CCC)を導入し,GPTに基づくChess注釈評価法(GCC-Eval)を用いて評価を行った。
論文 参考訳(メタデータ) (2024-10-28T07:59:34Z) - Algorithmic Persuasion Through Simulation [51.23082754429737]
本研究では、送信者が受信機にバイナリアクションを取るよう説得するベイズ説得ゲームについて検討する。
送信者は、製品の品質などの世界の(実価値の高い)状態について通知されるが、受信者の信念やユーティリティに関する情報は限られている。
顧客の調査やユーザスタディ、最近のAIの進歩によって、送信側は受信者についてより深く学ぶことができるようになりました。
論文 参考訳(メタデータ) (2023-11-29T23:01:33Z) - Human Choice Prediction in Language-based Persuasion Games:
Simulation-based Off-Policy Evaluation [24.05034588588407]
本稿では,このようなエージェントの設計における重要な側面について論じる。
人工エージェントを用いた意思決定ゲームを繰り返し行う人間による87Kの意思決定データセットを収集した。
我々のアプローチでは、あるエージェントサブセットと人間のインタラクションに関するモデルをトレーニングして、他のエージェントとのインタラクションにおける決定を予測します。
論文 参考訳(メタデータ) (2023-05-17T16:38:11Z) - Improving Language Model Negotiation with Self-Play and In-Context
Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。
私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文 参考訳(メタデータ) (2023-05-17T11:55:32Z) - Predicting Decisions in Language Based Persuasion Games [31.63182861594025]
本稿では,説得ゲームにおける自然言語の利用について述べる。
これらの決定の予測に有効なモデルを構築することを目的としている。
私たちの結果は、相互作用シーケンスのプレフィックスを与えられたモデルが意思決定者の将来の決定を予測できることを示しています。
論文 参考訳(メタデータ) (2020-12-17T22:52:47Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。