論文の概要: A Soft Inducement Framework for Incentive-Aided Steering of No-Regret Players
- arxiv url: http://arxiv.org/abs/2508.21672v1
- Date: Fri, 29 Aug 2025 14:34:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:11.081682
- Title: A Soft Inducement Framework for Incentive-Aided Steering of No-Regret Players
- Title(参考訳): ゲームプレイヤのインセンティブ型ステアリングのためのソフトインデューサフレームワーク
- Authors: Asrin Efe Yorulmaz, Raj Kiriti Velicheti, Melih Bastopcu, Tamer Başar,
- Abstract要約: メディエータ強化2プレーヤ正規形式ゲームにおけるステアリング問題について検討する。
所望のアクションプロファイルに対してプレイヤーを操ることは、情報設計だけでは必ずしも達成できないことを示す。
繰り返しゲーム開始前のワンショット情報設計フェーズは、前のインタラクションをスタックルバーグゲームに変換する。
- 参考スコア(独自算出の注目度): 3.814858728853162
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we investigate a steering problem in a mediator-augmented two-player normal-form game, where the mediator aims to guide players toward a specific action profile through information and incentive design. We first characterize the games for which successful steering is possible. Moreover, we establish that steering players to any desired action profile is not always achievable with information design alone, nor when accompanied with sublinear payment schemes. Consequently, we derive a lower bound on the constant payments required per round to achieve this goal. To address these limitations incurred with information design, we introduce an augmented approach that involves a one-shot information design phase before the start of the repeated game, transforming the prior interaction into a Stackelberg game. Finally, we theoretically demonstrate that this approach improves the convergence rate of players' action profiles to the target point by a constant factor with high probability, and support it with empirical results.
- Abstract(参考訳): 本研究では,仲介者が情報やインセンティブ設計を通じて,特定のアクションプロファイルに向けてプレイヤーを誘導することを目的とした,仲介者強化型2プレーヤノーマルフォームゲームにおけるステアリング問題について検討する。
まず、ステアリングを成功させることが可能なゲームを特徴付ける。
さらに,任意のアクションプロファイルに対するプレイヤーの操舵は,情報設計だけでも,サブリニア支払い方式を伴っても,必ずしも達成可能であるとは限らないことを確認した。
その結果、この目標を達成するのに1ラウンドあたりの一定の支払いの上限を低くする。
情報設計に伴うこれらの制限に対処するため,繰り返しゲーム開始前のワンショット情報設計フェーズを含む拡張アプローチを導入し,事前のインタラクションをStackelbergゲームに変換する。
最後に,この手法はプレイヤーの行動プロファイルの目標点への収束率を高い確率で向上させ,経験的結果で支援するものであることを理論的に実証する。
関連論文リスト
- Online Competitive Information Gathering for Partially Observable Trajectory Games [24.25139588281181]
ゲーム理論エージェントは、相手に関する情報を最適に収集する計画を立てなければならない。
我々は、軌道空間における競合情報収集行動を認めるPOSGの有限履歴/水平改良を定式化する。
これらのゲームにおいて,状態空間の粒子ベース推定を活用し,グラデーションプレイを行う合理的な軌道計画を計算するためのオンライン手法を提案する。
論文 参考訳(メタデータ) (2025-06-02T17:45:58Z) - Bidding Games on Markov Decision Processes with Quantitative Reachability Objectives [3.4486432774139355]
本研究では,環境不確かさとエージェント間のオークションベースの相互作用を組み合わせた新しいグラフゲーム群について検討する。
我々は、一般のMDPに対して、しきい値と最適なポリシーを近似するバリューイットアルゴリズムを考案する。
しきい値の発見は、単純な確率的なゲームを解くのと同じくらい難しいことを示します。
論文 参考訳(メタデータ) (2024-12-27T12:10:00Z) - Human-Agent Coordination in Games under Incomplete Information via Multi-Step Intent [21.170542003568674]
自律エージェントと人間のパートナー間の戦略的調整はターンベースの協調ゲームとしてモデル化できる。
不完全な情報の下でターンベースのゲームを拡張し、プレイヤーが単一のアクションではなく、ターンごとに複数のアクションを実行できるようにする。
論文 参考訳(メタデータ) (2024-10-23T19:37:19Z) - Collaborative-Enhanced Prediction of Spending on Newly Downloaded Mobile Games under Consumption Uncertainty [49.431361908465036]
ラベルのばらつきと極端性を緩和する頑健なモデルトレーニングと評価フレームワークを提案する。
本フレームワークでは,ユーザIDに頼ることなく,ユーザのゲーム支出を予測するための協調型モデルを提案する。
当社のアプローチは、オフラインデータに対する注目すべき textbf17.11% の強化を実現し、プロダクションモデルよりも顕著に改善されていることを示す。
論文 参考訳(メタデータ) (2024-04-12T07:47:02Z) - Instruction-Driven Game Engines on Large Language Models [59.280666591243154]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文 参考訳(メタデータ) (2024-03-30T08:02:16Z) - Deep Policy Networks for NPC Behaviors that Adapt to Changing Design
Parameters in Roguelike Games [137.86426963572214]
例えばRoguelikesのようなターンベースの戦略ゲームは、Deep Reinforcement Learning(DRL)にユニークな課題を提示する。
複雑なカテゴリ状態空間をより適切に処理し、設計決定によって強制的に再訓練する必要性を緩和する2つのネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-07T08:47:25Z) - Moody Learners -- Explaining Competitive Behaviour of Reinforcement
Learning Agents [65.2200847818153]
競合シナリオでは、エージェントは動的環境を持つだけでなく、相手の行動に直接影響される。
エージェントのQ値の観察は通常、その振る舞いを説明する方法であるが、選択されたアクション間の時間的関係は示さない。
論文 参考訳(メタデータ) (2020-07-30T11:30:42Z) - Metagame Autobalancing for Competitive Multiplayer Games [0.10499611180329801]
ゲーム設計において,マルチプレイヤーゲームのバランスをとるためのツールを提案する。
我々のアプローチでは,設計者がメタゲームターゲットの直感的なグラフィカル表現を構築する必要がある。
このツールの能力は、Rock-Paper-Scissors から継承された例や、より複雑な非対称戦闘ゲームにおいて示す。
論文 参考訳(メタデータ) (2020-06-08T08:55:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。