Fugu-MT 論文翻訳(概要): Designing an Automatic Agent for Repeated Language based Persuasion Games

論文の概要: Designing an Automatic Agent for Repeated Language based Persuasion Games

arxiv url: http://arxiv.org/abs/2105.04976v1
Date: Tue, 11 May 2021 12:25:57 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-12 19:28:52.177374
Title: Designing an Automatic Agent for Repeated Language based Persuasion Games
Title（参考訳）: 繰り返し言語に基づく説得ゲームのための自動エージェントの設計
Authors: Maya Raifer, Guy Rotman, Reut Apel, Moshe Tennenholtz, Roi Reichart
Abstract要約: 繰り返す送信者(専門家) -- 受信者(意思決定者)ゲームを考える。 senderは、世界の状況について完全に知らされ、受信者にいくつかの可能な自然言語レビューの1つを送ることで、取引を受け入れるよう説得することを目的としている。我々は、この繰り返しゲームをプレイする自動専門家をデザインし、最大報酬を達成することを目指している。
参考スコア（独自算出の注目度）: 32.20930723085839
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Persuasion games are fundamental in economics and AI research and serve as the basis for important applications. However, work on this setup assumes communication with stylized messages that do not consist of rich human language. In this paper we consider a repeated sender (expert) -- receiver (decision maker) game, where the sender is fully informed about the state of the world and aims to persuade the receiver to accept a deal by sending one of several possible natural language reviews. We design an automatic expert that plays this repeated game, aiming to achieve the maximal payoff. Our expert is implemented within the Monte Carlo Tree Search (MCTS) algorithm, with deep learning models that exploit behavioral and linguistic signals in order to predict the next action of the decision maker, and the future payoff of the expert given the state of the game and a candidate review. We demonstrate the superiority of our expert over strong baselines, its adaptability to different decision makers, and that its selected reviews are nicely adapted to the proposed deal.
Abstract（参考訳）: 説得ゲームは経済学とAI研究の基本であり、重要な応用の基礎として機能する。しかし、この設定では、リッチな人間の言語を含まないスタイル化されたメッセージとの通信を想定している。本稿では,送信者が世界の状況を十分に把握し,複数の可能な自然言語レビューの1つを送ることで,受取人に取引を受け入れるよう説得することを目的とした,繰り返し送信者(専門家)-受信者(意思決定者)ゲームについて考察する。我々は、この繰り返しゲームをプレイする自動専門家をデザインし、最大報酬を達成することを目指している。我々のエキスパートはモンテカルロ木探索(mcts)アルゴリズムに実装されており、意思決定者の次の行動を予測するために行動および言語信号を利用するディープラーニングモデルと、ゲームの状態と候補レビューを与えられた専門家の今後の報酬モデルを備えている。我々は、エキスパートの強力なベースラインに対する優位性、異なる意思決定者への適応性、そして選択したレビューが提案されたディールにうまく適合していることを示します。

関連論文リスト

How Far Are LLMs from Professional Poker Players? Revisiting Game-Theoretic Reasoning with Agentic Tool Use [52.394999779049606]
大規模言語モデル(LLMs)は、ハイテイクなドメインにますます適用されています。 LLMは従来のアルゴリズムと競合しない。ツール統合推論フレームワークであるToolPokerを提案する。
論文参考訳（メタデータ） (2026-01-31T05:45:25Z)
People use fast, flat goal-directed simulation to reason about novel problems [68.55490343866545]
私たちは、人々が初めてゲームをする方法に体系的かつ適応的に合理的であることを示します。直感型ゲーマー」と呼ばれる計算認知モデルを用いて,これらの能力を説明する。私たちの研究は、人々が新しい問題に遭遇するとき、どのように素早く評価し、行動し、提案するかに関する新しい洞察を提供する。
論文参考訳（メタデータ） (2025-10-13T15:12:08Z)
FAIRGAME: a Framework for AI Agents Bias Recognition using Game Theory [51.96049148869987]
ゲーム理論を用いたAIエージェントバイアス認識フレームワークFAIRGAMEを提案する。我々は,AIエージェント間の人気ゲームにおけるバイアスのある結果を明らかにするために,その実装と利用について述べる。全体として、FAIRGAMEはユーザーが望むゲームやシナリオを確実に簡単にシミュレートできる。
論文参考訳（メタデータ） (2025-04-19T15:29:04Z)
Beyond Profile: From Surface-Level Facts to Deep Persona Simulation in LLMs [50.0874045899661]
本稿では,キャラクタの言語パターンと特徴的思考過程の両方を再現するモデルであるキャラクタボットを紹介する。ケーススタディとしてLu Xunを用いて、17冊のエッセイコレクションから得られた4つのトレーニングタスクを提案する。これには、外部の言語構造と知識を習得することに焦点を当てた事前訓練タスクと、3つの微調整タスクが含まれる。言語的正確性と意見理解の3つのタスクにおいて、キャラクタボットを評価し、適応されたメトリクスのベースラインを著しく上回ることを示す。
論文参考訳（メタデータ） (2025-02-18T16:11:54Z)
Should I Trust You? Detecting Deception in Negotiations using Counterfactual RL [30.6942857922867]
我々は、自然言語通信と戦略的推論の両方を必要とするボードゲームであるTextitDiplomacyにおいて、人間がいかに戦略的にお互いを欺くかを分析した。提案手法は,大規模言語モデルと比較して高い精度で人間の偽造を検知する。今後のヒューマン・アブライインタラクションツールは,不審な提案を疑う機会をユーザに与えるために,テキストフリクションをトリガーすることで,偽造検出の手法に基づいて構築することができる。
論文参考訳（メタデータ） (2025-02-18T02:11:41Z)
Verbalized Bayesian Persuasion [54.55974023595722]
情報設計(ID)は、送信者が受信者の最適な振る舞いにどのように影響し、特定の目的を達成するかを探索する。本研究は,従来のBPを人間の対話を含む現実のゲームに拡張した,ベイズ説得(BP)における言語化フレームワークを提案する。勧告書,法廷相互作用,法執行機関などの対話シナリオにおける数値実験により,従来のBPの理論的結果の再現と効果的な説得戦略の発見が可能であることを確認した。
論文参考訳（メタデータ） (2025-02-03T18:20:10Z)
Conversation Games and a Strategic View of the Turing Test [0.0]
私たちは、評決ゲームと呼ばれるゲームのサブセットに焦点を当てています。評決ゲームでは、2人のプレーヤーが交互に会話に寄与し、各ステージで非ストラテジックな審査員によって評価される。シミュレーション実験により提案する概念の実践的妥当性を示し、戦略エージェントが高いマージンでナイーブエージェントより優れていることを示す。
論文参考訳（メタデータ） (2025-01-30T16:08:37Z)
Bridging the Gap between Expert and Language Models: Concept-guided Chess Commentary Generation and Evaluation [9.277840736103554]
概念誘導型Chess注釈生成法(CCC)を導入し,GPTに基づくChess注釈評価法(GCC-Eval)を用いて評価を行った。 CCCは、優先順位付けされた概念に基づく説明を通じて、専門家モデルの意思決定の強みとLLMの言語流布を統合する。 GCC-Evalは、専門家の知識を活用して、情報性と言語的品質に基づいて、チェスの解説を評価する。
論文参考訳（メタデータ） (2024-10-28T07:59:34Z)
Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.94709351266557]
検索強化に関して,言語モデルの信頼性に焦点をあてる。検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文参考訳（メタデータ） (2024-10-22T09:25:21Z)
Algorithmic Persuasion Through Simulation [51.23082754429737]
本研究では,受取人に製品購入などの二元的行動を取るよう説得するベイズ説得ゲームについて検討する。送信者は、製品の品質が高いか低いかなどの世界の(バイナリ)状態について通知されるが、受信者の信念やユーティリティに関する情報は限られている。顧客の調査やユーザスタディ、最近のAIの進歩によって動機づけられた私たちは、受信者の振る舞いをシミュレートする託宣をクエリすることで、送信側が受信者についてより深く学ぶことを可能にする。
論文参考訳（メタデータ） (2023-11-29T23:01:33Z)
Human Choice Prediction in Language-based Persuasion Games: Simulation-based Off-Policy Evaluation [24.05034588588407]
本稿では,このようなエージェントの設計における重要な側面について論じる。人工エージェントを用いた意思決定ゲームを繰り返し行う人間による87Kの意思決定データセットを収集した。我々のアプローチでは、あるエージェントサブセットと人間のインタラクションに関するモデルをトレーニングして、他のエージェントとのインタラクションにおける決定を予測します。
論文参考訳（メタデータ） (2023-05-17T16:38:11Z)
Improving Language Model Negotiation with Self-Play and In-Context Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文参考訳（メタデータ） (2023-05-17T11:55:32Z)
Predicting Decisions in Language Based Persuasion Games [31.63182861594025]
本稿では,説得ゲームにおける自然言語の利用について述べる。これらの決定の予測に有効なモデルを構築することを目的としている。私たちの結果は、相互作用シーケンスのプレフィックスを与えられたモデルが意思決定者の将来の決定を予測できることを示しています。
論文参考訳（メタデータ） (2020-12-17T22:52:47Z)
Deep Reinforcement Learning with Stacked Hierarchical Attention for Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文参考訳（メタデータ） (2020-10-22T12:40:22Z)
Expertise Style Transfer: A New Task Towards Better Communication between Experts and Laymen [88.30492014778943]
そこで我々は,手動で注釈付きデータセットを手動で提供し,専門的なスタイルの転送を行う新しいタスクを提案する。このタスクの解決は、プロの言語を単純化するだけでなく、レイメンの記述の正確さと専門性の向上にも寄与する。スタイル転送とテキスト単純化のための5つの最先端モデルのベンチマーク性能を確立する。
論文参考訳（メタデータ） (2020-05-02T04:50:20Z)
Predicting Strategic Behavior from Free Text [38.506665373140876]
我々は,ゲームとしてモデル化された経済状況下でのメッセージと行動の関連性について検討する。本研究では,個人が提供した自由テキストに基づくワンショットゲームにおいて,個人の行動予測に関する研究を紹介する。これらの属性に基づいたワンショットゲームにおいて,これらの個人が行う行動を予測するために,トランスダクティブ・ラーニング(transductive learning)を採用している。
論文参考訳（メタデータ） (2020-04-06T20:05:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。