論文の概要: Modeling Attention during Dimensional Shifts with Counterfactual and Delayed Feedback
- arxiv url: http://arxiv.org/abs/2501.11161v1
- Date: Sun, 19 Jan 2025 20:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:21:32.105535
- Title: Modeling Attention during Dimensional Shifts with Counterfactual and Delayed Feedback
- Title(参考訳): 実測的および遅延フィードバックを伴う次元シフト中の注意のモデル化
- Authors: Tyler Malloy, Roderick Seow, Cleotilde Gonzalez,
- Abstract要約: 意思決定タスクの特定の特徴に人間がどのように参加するかをモデル化する2つの手法を比較した。
経験の歴史から情報理論の計量を計算することは、人間のような行動を考えるのに最適であることがわかった。
- 参考スコア(独自算出の注目度): 0.4915744683251151
- License:
- Abstract: Attention can be used to inform choice selection in contextual bandit tasks even when context features have not been previously experienced. One example of this is in dimensional shifts, where additional feature values are introduced and the relationship between features and outcomes can either be static or variable. Attentional mechanisms have been extensively studied in contextual bandit tasks where the feedback of choices is provided immediately, but less research has been done on tasks where feedback is delayed or in counterfactual feedback cases. Some methods have successfully modeled human attention with immediate feedback based on reward prediction errors (RPEs), though recent research raises questions of the applicability of RPEs onto more general attentional mechanisms. Alternative models suggest that information theoretic metrics can be used to model human attention, with broader applications to novel stimuli. In this paper, we compare two different methods for modeling how humans attend to specific features of decision making tasks, one that is based on calculating an information theoretic metric using a memory of past experiences, and another that is based on iteratively updating attention from reward prediction errors. We compare these models using simulations in a contextual bandit task with both intradimensional and extradimensional domain shifts, as well as immediate, delayed, and counterfactual feedback. We find that calculating an information theoretic metric over a history of experiences is best able to account for human-like behavior in tasks that shift dimensions and alter feedback presentation. These results indicate that information theoretic metrics of attentional mechanisms may be better suited than RPEs to predict human attention in decision making, though further studies of human behavior are necessary to support these results.
- Abstract(参考訳): コンテクストの特徴が以前に経験されていなくても、コンテキスト的バンディットタスクにおける選択の選択を通知するために注意が用いられる。
例えば、次元シフトでは、付加的な特徴値が導入され、特徴と結果の関係は静的か可変である。
意図的なメカニズムは、選択のフィードバックが即座に提供される文脈的包括的タスクにおいて広範囲に研究されているが、フィードバックが遅れたタスクや、反現実的なフィードバックケースでは、より少ない研究がなされている。
報酬予測誤差(RPE)に基づく即時フィードバックで人間の注意をモデル化する手法もあるが、近年の研究では、より一般的な注意機構へのRPEの適用性に関する疑問が提起されている。
代替モデルでは、情報理論のメトリクスが人間の注意をモデル化するために利用でき、新しい刺激への幅広い応用が提案されている。
本稿では,過去の経験の記憶を用いて情報理論量を計算する手法と,報酬予測誤差から注意を反復的に更新する手法とを比較した。
我々は,これらのモデルについて,時間的・遅延的・反実的なフィードバックだけでなく,次元内および外的ドメインシフトの双方で,文脈的バンディットタスクのシミュレーションを用いて比較する。
経験の履歴から情報理論のメトリクスを計算することは、次元を変化させ、フィードバックの提示を変更するタスクにおいて、人間のような振る舞いを考慮できるのが最適である。
これらの結果から, 注意機構に関する情報理論の指標は, 意思決定における人間の注意を予測するために, RPEよりも適している可能性が示唆された。
関連論文リスト
- Re-Visiting Explainable AI Evaluation Metrics to Identify The Most Informative Features [0.0]
関数性またはプロキシベースのアプローチは、人工知能手法の品質を評価するために使用されるアプローチの1つである。
その中では、選択性(Selectivity)やRemOve And Retrain(ROAR)、Permutation Importance(PI)が最も一般的に使用されるメトリクスである。
本稿では,ROAR や IP が実装された場合のモデルの上と下の境界を予測するための予測精度区間 (EAI) を提案する。
論文 参考訳(メタデータ) (2025-01-31T17:18:43Z) - TSFeatLIME: An Online User Study in Enhancing Explainability in Univariate Time Series Forecasting [1.9314780151274307]
本稿では, TSLIMEを拡張したTSFeatLIMEというフレームワークを提案する。
TSFeatLIMEは補助的特徴をサロゲートモデルに統合し、クエリされた時系列と生成されたサンプルの間の一対のユークリッド距離を考察する。
その結果,TSFeatLIMEフレームワーク下でのサロゲートモデルは,距離を考慮したブラックボックスの挙動を,精度を犠牲にすることなくより良くシミュレートできることがわかった。
論文 参考訳(メタデータ) (2024-09-24T10:24:53Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Modeling User Preferences via Brain-Computer Interfacing [54.3727087164445]
我々はBrain-Computer Interface技術を用いてユーザの好みを推測し、その注意力は視覚的コンテンツと感情的体験との関連性に相関する。
我々はこれらを,情報検索,生成モデルのパーソナライズされたステアリング,感情経験のクラウドソーシング人口推定など,関連するアプリケーションにリンクする。
論文 参考訳(メタデータ) (2024-05-15T20:41:46Z) - Evaluating the Utility of Model Explanations for Model Development [54.23538543168767]
機械学習モデル構築の実践シナリオにおいて、説明が人間の意思決定を改善するかどうかを評価する。
驚いたことに、サリエンシマップが提供されたとき、タスクが大幅に改善されたという証拠は見つからなかった。
以上の結果から,サリエンシに基づく説明における誤解の可能性と有用性について注意が必要であることが示唆された。
論文 参考訳(メタデータ) (2023-12-10T23:13:23Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Incorporating Heterogeneous User Behaviors and Social Influences for
Predictive Analysis [32.31161268928372]
我々は,行動予測に異質なユーザ行動と社会的影響を取り入れることを目指している。
本稿では,行動シーケンスのコンテキストを考慮したLong-Short Term Memory (LSTM)を提案する。
残差学習に基づくデコーダは、社会的行動表現に基づいて、複数の高次クロス機能を自動的に構築するように設計されている。
論文 参考訳(メタデータ) (2022-07-24T17:05:37Z) - Explain, Edit, and Understand: Rethinking User Study Design for
Evaluating Model Explanations [97.91630330328815]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。
単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文 参考訳(メタデータ) (2021-12-17T18:29:56Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - Context-Aware Attentive Knowledge Tracing [21.397976659857793]
本稿では、フレキシブルアテンションに基づくニューラルネットワークモデルと、新しい解釈可能なモデルコンポーネントを結合した注意知識追跡手法を提案する。
AKTは、学習者の将来の応答と過去の応答に対する評価質問を関連付ける新しいモノトニックアテンションメカニズムを使用する。
AKT は,既存の KT 手法(場合によっては AUC で最大6% 以上)よりも,将来の学習者応答の予測に優れることを示す。
論文 参考訳(メタデータ) (2020-07-24T02:45:43Z) - Learning Opinion Dynamics From Social Traces [25.161493874783584]
本稿では,現実の社会的トレースに,生成的,エージェントライクな意見力学モデルを適用するための推論機構を提案する。
本稿では,古典的エージェントに基づく意見力学モデルから,その生成的モデルへの変換による提案について紹介する。
われわれのモデルをRedditの現実世界のデータに適用して、バックファイア効果の影響に関する長年にわたる疑問を探る。
論文 参考訳(メタデータ) (2020-06-02T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。