論文の概要: Effect of Adaptation Rate and Cost Display in a Human-AI Interaction Game
- arxiv url: http://arxiv.org/abs/2408.14640v1
- Date: Mon, 26 Aug 2024 21:08:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 15:34:19.174541
- Title: Effect of Adaptation Rate and Cost Display in a Human-AI Interaction Game
- Title(参考訳): 人間-AIインタラクションゲームにおける適応率とコスト表示の効果
- Authors: Jason T. Isa, Bohan Wu, Qirui Wang, Yilin Zhang, Samuel A. Burden, Lillian J. Ratliff, Benjamin J. Chasnov,
- Abstract要約: 我々は,AIの適応アルゴリズムの変化が2プレイヤー連続ゲームにおける行動予測に与える影響について検討した。
緩やかな適応率は結果をナッシュ均衡にシフトし、速さは結果を人間主導のスタッケルベルク均衡にシフトさせる。
- 参考スコア(独自算出の注目度): 15.991622356042551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As interactions between humans and AI become more prevalent, it is critical to have better predictors of human behavior in these interactions. We investigated how changes in the AI's adaptive algorithm impact behavior predictions in two-player continuous games. In our experiments, the AI adapted its actions using a gradient descent algorithm under different adaptation rates while human participants were provided cost feedback. The cost feedback was provided by one of two types of visual displays: (a) cost at the current joint action vector, or (b) cost in a local neighborhood of the current joint action vector. Our results demonstrate that AI adaptation rate can significantly affect human behavior, having the ability to shift the outcome between two game theoretic equilibrium. We observed that slow adaptation rates shift the outcome towards the Nash equilibrium, while fast rates shift the outcome towards the human-led Stackelberg equilibrium. The addition of localized cost information had the effect of shifting outcomes towards Nash, compared to the outcomes from cost information at only the current joint action vector. Future work will investigate other effects that influence the convergence of gradient descent games.
- Abstract(参考訳): 人間とAIの相互作用がより一般的になるにつれて、これらの相互作用における人間の振る舞いをより正確に予測することが重要である。
我々は,AIの適応アルゴリズムの変化が2プレイヤー連続ゲームにおける行動予測に与える影響について検討した。
我々の実験では、AIは異なる適応率で勾配降下アルゴリズムを用いて行動に適応し、人間の参加者はコストフィードバックを提供した。
コストフィードバックは2種類の視覚ディスプレイのうちの1つによって提供された。
(a)現在の共同行動ベクトルのコスト、又は
(b)現在の関節動作ベクトルの局所的な近傍におけるコスト
実験の結果,AI適応率は人間の行動に大きく影響し,ゲーム理論の平衡を2つに分けた結果が得られた。
適応速度の遅さはナッシュ均衡に移行し, 高速速度は人間主導のスタッケルベルク均衡に移行した。
局所的なコスト情報の追加は、現在の共同行動ベクトルのみのコスト情報から得られる結果と比較して、結果をナッシュにシフトさせる効果があった。
今後の研究は、勾配降下ゲームの収束に影響を与える他の効果について検討する。
関連論文リスト
- ReGenNet: Towards Human Action-Reaction Synthesis [87.57721371471536]
我々は、人間と人間の相互作用の非対称、動的、同期、および詳細な性質を分析する。
本研究では,人間の行動に条件付けされた人間の反応を生成するための,最初のマルチセットヒト行動反応ベンチマークを提案する。
論文 参考訳(メタデータ) (2024-03-18T15:33:06Z) - AdvMT: Adversarial Motion Transformer for Long-term Human Motion
Prediction [2.837740438355204]
本稿では,AdvMT(Adversarial Motion Transformer)について述べる。
逆行訓練では,予測の不要な成果物を効果的に削減し,より現実的で流動的な人間の動作の学習を確実にする。
論文 参考訳(メタデータ) (2024-01-10T09:15:50Z) - "AI enhances our performance, I have no doubt this one will do the
same": The Placebo effect is robust to negative descriptions of AI [18.760251521240892]
高度なAI期待は、プラセボ効果を通じて人間とAIのインタラクションのパフォーマンスを促進する。
ユーザの期待がAIインタラクションや評価に与える影響について論じる。
論文 参考訳(メタデータ) (2023-09-28T17:05:59Z) - Towards Human-Like RL: Taming Non-Naturalistic Behavior in Deep RL via
Adaptive Behavioral Costs in 3D Games [14.31087095939213]
ABC-RL(Adaptive Behavioral Costs in Reinforcement Learning)と呼ばれる新しい手法を提案する。
ABC-RLは、動的に調整された重み付き強化学習におけるコスト信号として、行動制限を増大させる。
ABC-RLは同じ性能を示しながら、揺動や回転の事例を著しく減らした。
論文 参考訳(メタデータ) (2023-09-27T08:28:59Z) - Assessing the Influence of Different Types of Probing on Adversarial Decision-Making in a Deception Game [0.0]
我々は,敵対的決定に関するさまざまな費用を調査するために,騙しゲーム(DG)を使用します。
その結果, 探索コストの増加に伴い, 探索はわずかに削減された。
論文 参考訳(メタデータ) (2023-09-15T04:31:11Z) - HODN: Disentangling Human-Object Feature for HOI Detection [51.48164941412871]
本稿では,Human and Object Disentangling Network (HODN) を提案し,Human-Object Interaction (HOI) の関係を明示的にモデル化する。
インタラクションに人間的特徴がより寄与していることを考慮し,インタラクションデコーダが人間中心の領域に焦点を当てていることを確認するためのヒューマンガイドリンク手法を提案する。
提案手法は,V-COCOとHICO-Det Linkingデータセットの競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-20T04:12:50Z) - Learning to Influence Human Behavior with Offline Reinforcement Learning [70.7884839812069]
人間の準最適性を捉える必要があるような環境での影響に焦点を当てる。
人間によるオンライン実験は安全ではない可能性があり、環境の高忠実度シミュレータを作成することは現実的ではないことが多い。
オフライン強化学習は、観察された人間・人間の行動の要素を拡張し、組み合わせることで、人間に効果的に影響を及ぼすことができることを示す。
論文 参考訳(メタデータ) (2023-03-03T23:41:55Z) - Homophily and Incentive Effects in Use of Algorithms [17.55279695774825]
本稿では,2つの要因がAIによる意思決定に与える影響を評価するために,クラウドソーシング・ヴィグネット研究を提案する。
まず、ホモフィリー(homophily)を検証します。
次に、インセンティブについて考えます -- ハイブリッドな意思決定環境に(既知の)コスト構造を組み込むには、どうすればよいのでしょう?
論文 参考訳(メタデータ) (2022-05-19T17:11:04Z) - The world seems different in a social context: a neural network analysis
of human experimental data [57.729312306803955]
本研究では,先行・知覚的信号の精度を変化させることで,個人・社会的タスク設定の両方で人間の行動データを再現可能であることを示す。
トレーニングされたネットワークの神経活性化トレースの分析は、情報が個人や社会的条件のネットワークにおいて、根本的に異なる方法でコード化されていることを示す。
論文 参考訳(メタデータ) (2022-03-03T17:19:12Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - An Analysis of the Adaptation Speed of Causal Models [80.77896315374747]
最近、Bengioらは、すべての候補モデルの中で、$G$は、あるデータセットから別のデータセットに適応する最速のモデルであると推測した。
最適化からの収束率を用いた原因影響SCMの適応速度について検討する。
驚くべきことに、私たちは反因果モデルが有利である状況を見つけ、初期仮説を偽造する。
論文 参考訳(メタデータ) (2020-05-18T23:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。