論文の概要: Human strategic decision making in parametrized games
- arxiv url: http://arxiv.org/abs/2104.14744v1
- Date: Fri, 30 Apr 2021 03:40:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:47:22.224941
- Title: Human strategic decision making in parametrized games
- Title(参考訳): パラメトリケーションゲームにおける人間の戦略的意思決定
- Authors: Sam Ganzfried
- Abstract要約: 我々は,人間の意思決定者がリアルタイム解法を使わずに素早く意思決定できる新しいフレームワークを提案する。
複数のプレイヤーによる設定や不完全な情報を含む様々な状況に適用可能であることを示す。
- 参考スコア(独自算出の注目度): 4.264192013842095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world games contain parameters which can affect payoffs, action
spaces, and information states. For fixed values of the parameters, the game
can be solved using standard algorithms. However, in many settings agents must
act without knowing the values of the parameters that will be encountered in
advance. Often the decisions must be made by a human under time and resource
constraints, and it is unrealistic to assume that a human can solve the game in
real time. We present a new framework that enables human decision makers to
make fast decisions without the aid of real-time solvers. We demonstrate
applicability to a variety of situations including settings with multiple
players and imperfect information.
- Abstract(参考訳): 現実世界のゲームの多くは、支払い、アクションスペース、情報状態に影響を与えるパラメータを含んでいる。
パラメータの固定値の場合、ゲームは標準的なアルゴリズムで解くことができる。
しかし、多くの設定では、エージェントは事前に遭遇するパラメータの値を知ることなく行動しなければならない。
多くの場合、決定は時間とリソースの制約の下で人間が行う必要があり、人間がリアルタイムでゲームを解けると仮定するのは現実的ではない。
我々は,人間の意思決定者がリアルタイム解法を使わずに素早く意思決定できる新しいフレームワークを提案する。
複数のプレイヤーによる設定や不完全な情報を含む様々な状況に適用可能であることを示す。
関連論文リスト
- People use fast, goal-directed simulation to reason about novel games [75.25089384921557]
我々は,シンプルだが斬新なコネクテッドnスタイルのボードゲームについて,人々がどう考えるかを研究する。
ゲームがどんなに公平か、そしてどんなに楽しいのかを、ごくわずかな経験から判断するよう、私たちは人々に求めます。
論文 参考訳(メタデータ) (2024-07-19T07:59:04Z) - Imperfect-Recall Games: Equilibrium Concepts and Their Complexity [74.01381499760288]
エージェントが以前保持していた情報を忘れたとき、不完全なリコールの下で最適な意思決定を行う。
不完全なリコールを伴う広範囲形式のゲームフレームワークにおいて、マルチプレイヤー設定における平衡を求める際の計算複雑性を解析する。
論文 参考訳(メタデータ) (2024-06-23T00:27:28Z) - Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文 参考訳(メタデータ) (2024-02-14T02:17:37Z) - Modeling Player Personality Factors from In-Game Behavior and Affective
Expression [17.01727448431269]
我々は,記録されたゲーム内行動から,一連のプレイヤパーソナリティアンケート値を予測する可能性を探る。
ロールプレイングゲーム『Fallout: New Vegas』のカスタマイズ版を60分間のゲームプレイで62人を対象に,定評ある7つの質問紙から,さまざまなパーソナリティ指標を予測した。
論文 参考訳(メタデータ) (2023-08-27T22:59:08Z) - Value-based Fast and Slow AI Nudging [37.53694593692918]
看護とは、人々の思考や行動に影響を与える行動戦略である。
本稿では,AIシステムが人間を虐待する,価値に基づくAIと人間による協調的な枠組みを提案し,議論する。
論文 参考訳(メタデータ) (2023-07-14T20:57:27Z) - The Update-Equivalence Framework for Decision-Time Planning [78.44953498421854]
本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-04-25T20:28:55Z) - Decision-aid or Controller? Steering Human Decision Makers with
Algorithms [5.449173263947196]
人間の意思決定者について学習し、最終決定に影響を与えるために「個人化された推薦」を提供する意思決定支援アルゴリズムについて検討する。
このようなアルゴリズムの潜在的な応用とその社会的意味について論じる。
論文 参考訳(メタデータ) (2023-03-23T23:24:26Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Abstracting Imperfect Information Away from Two-Player Zero-Sum Games [85.27865680662973]
Nayyar et al. (2013) は、プレイヤーがプレイ中にポリシーを公に発表することで、不完全な情報を共通のペイオフゲームから抽象化できることを示した。
この研究は、ある正規化された平衡が上記の非対応問題を持たないことを示している。
これらの正規化された平衡はナッシュ平衡に任意に近づくことができるので、この結果は2つのプレイヤーゼロサムゲームを解くための新たな視点への扉を開く。
論文 参考訳(メタデータ) (2023-01-22T16:54:06Z) - Model-Free Online Learning in Unknown Sequential Decision Making
Problems and Games [114.90723492840499]
大規模な2人プレイのゼロサム情報ゲームでは、反事実後悔最小化(cfr)の現代的な拡張がnash均衡を計算するための実用的な技術である。
私たちは、戦略空間がエージェントに知られていないオンライン学習設定を形式化します。
エージェントが逆の環境に直面しても、その設定に高い確率で$O(T3/4)$後悔を達成する効率的なアルゴリズムを提供します。
論文 参考訳(メタデータ) (2021-03-08T04:03:24Z) - A Bandit Model for Human-Machine Decision Making with Private
Information and Opacity [16.665883787432858]
一方のプレイヤーが機械であり,他方のプレイヤーが人間である2人のプレイヤーの学習問題を示す。
下限は、不透明な意思決定者に対して最適に助言する最悪の難易度を定量化する。
上界は、単純な調整戦略が極端に最適であることを示している。
論文 参考訳(メタデータ) (2020-07-09T13:43:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。