論文の概要: Human strategic decision making in parametrized games
- arxiv url: http://arxiv.org/abs/2104.14744v1
- Date: Fri, 30 Apr 2021 03:40:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:47:22.224941
- Title: Human strategic decision making in parametrized games
- Title(参考訳): パラメトリケーションゲームにおける人間の戦略的意思決定
- Authors: Sam Ganzfried
- Abstract要約: 我々は,人間の意思決定者がリアルタイム解法を使わずに素早く意思決定できる新しいフレームワークを提案する。
複数のプレイヤーによる設定や不完全な情報を含む様々な状況に適用可能であることを示す。
- 参考スコア(独自算出の注目度): 4.264192013842095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world games contain parameters which can affect payoffs, action
spaces, and information states. For fixed values of the parameters, the game
can be solved using standard algorithms. However, in many settings agents must
act without knowing the values of the parameters that will be encountered in
advance. Often the decisions must be made by a human under time and resource
constraints, and it is unrealistic to assume that a human can solve the game in
real time. We present a new framework that enables human decision makers to
make fast decisions without the aid of real-time solvers. We demonstrate
applicability to a variety of situations including settings with multiple
players and imperfect information.
- Abstract(参考訳): 現実世界のゲームの多くは、支払い、アクションスペース、情報状態に影響を与えるパラメータを含んでいる。
パラメータの固定値の場合、ゲームは標準的なアルゴリズムで解くことができる。
しかし、多くの設定では、エージェントは事前に遭遇するパラメータの値を知ることなく行動しなければならない。
多くの場合、決定は時間とリソースの制約の下で人間が行う必要があり、人間がリアルタイムでゲームを解けると仮定するのは現実的ではない。
我々は,人間の意思決定者がリアルタイム解法を使わずに素早く意思決定できる新しいフレームワークを提案する。
複数のプレイヤーによる設定や不完全な情報を含む様々な状況に適用可能であることを示す。
関連論文リスト
- CivRealm: A Learning and Reasoning Odyssey in Civilization for
Decision-Making Agents [63.79739920174535]
文明ゲームに触発された環境であるCivRealmを紹介する。
CivRealmは、意思決定エージェントにとってユニークな学習と推論の課題である。
論文 参考訳(メタデータ) (2024-01-19T09:14:11Z) - Modeling Player Personality Factors from In-Game Behavior and Affective
Expression [17.01727448431269]
我々は,記録されたゲーム内行動から,一連のプレイヤパーソナリティアンケート値を予測する可能性を探る。
ロールプレイングゲーム『Fallout: New Vegas』のカスタマイズ版を60分間のゲームプレイで62人を対象に,定評ある7つの質問紙から,さまざまなパーソナリティ指標を予測した。
論文 参考訳(メタデータ) (2023-08-27T22:59:08Z) - Value-based Fast and Slow AI Nudging [37.53694593692918]
看護とは、人々の思考や行動に影響を与える行動戦略である。
本稿では,AIシステムが人間を虐待する,価値に基づくAIと人間による協調的な枠組みを提案し,議論する。
論文 参考訳(メタデータ) (2023-07-14T20:57:27Z) - Decision-aid or Controller? Steering Human Decision Makers with
Algorithms [5.449173263947196]
人間の意思決定者について学習し、最終決定に影響を与えるために「個人化された推薦」を提供する意思決定支援アルゴリズムについて検討する。
このようなアルゴリズムの潜在的な応用とその社会的意味について論じる。
論文 参考訳(メタデータ) (2023-03-23T23:24:26Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Abstracting Imperfect Information Away from Two-Player Zero-Sum Games [85.27865680662973]
Nayyar et al. (2013) は、プレイヤーがプレイ中にポリシーを公に発表することで、不完全な情報を共通のペイオフゲームから抽象化できることを示した。
この研究は、ある正規化された平衡が上記の非対応問題を持たないことを示している。
これらの正規化された平衡はナッシュ平衡に任意に近づくことができるので、この結果は2つのプレイヤーゼロサムゲームを解くための新たな視点への扉を開く。
論文 参考訳(メタデータ) (2023-01-22T16:54:06Z) - Who Leads and Who Follows in Strategic Classification? [82.44386576129295]
戦略分類における役割の順序は、決定者とエージェントが互いの行動に適応する相対周波数によって決定される。
更新頻度を自由に選択できる意思決定者は,いずれの順番でスタックルバーグ均衡に収束する学習力学を誘導できることを示す。
論文 参考訳(メタデータ) (2021-06-23T16:48:46Z) - Model-Free Online Learning in Unknown Sequential Decision Making
Problems and Games [114.90723492840499]
大規模な2人プレイのゼロサム情報ゲームでは、反事実後悔最小化(cfr)の現代的な拡張がnash均衡を計算するための実用的な技術である。
私たちは、戦略空間がエージェントに知られていないオンライン学習設定を形式化します。
エージェントが逆の環境に直面しても、その設定に高い確率で$O(T3/4)$後悔を達成する効率的なアルゴリズムを提供します。
論文 参考訳(メタデータ) (2021-03-08T04:03:24Z) - Indecision Modeling [50.00689136829134]
AIシステムは人間の価値観に合わせて行動することが重要である。
人々はしばしば決定的ではなく、特に彼らの決定が道徳的な意味を持つときです。
論文 参考訳(メタデータ) (2020-12-15T18:32:37Z) - A Bandit Model for Human-Machine Decision Making with Private
Information and Opacity [16.665883787432858]
一方のプレイヤーが機械であり,他方のプレイヤーが人間である2人のプレイヤーの学習問題を示す。
下限は、不透明な意思決定者に対して最適に助言する最悪の難易度を定量化する。
上界は、単純な調整戦略が極端に最適であることを示している。
論文 参考訳(メタデータ) (2020-07-09T13:43:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。