論文の概要: Limitations of a proposed correction for slow drifts in decision
criterion
- arxiv url: http://arxiv.org/abs/2205.10912v1
- Date: Sun, 22 May 2022 19:33:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-29 18:55:08.689949
- Title: Limitations of a proposed correction for slow drifts in decision
criterion
- Title(参考訳): 決定基準における遅いドリフトに対する補正提案の限界
- Authors: Diksha Gupta and Carlos D. Brody
- Abstract要約: ランダムドリフトからの系統的な更新を曖昧にするためのモデルに基づくアプローチを提案する。
提案手法は,決定基準におけるドリフトの潜航軌跡を正確に回復することを示す。
本結果は,生成過程の仮定を直接意思決定モデルに組み込むことの利点を強調した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Trial history biases in decision-making tasks are thought to reflect
systematic updates of decision variables, therefore their precise nature
informs conclusions about underlying heuristic strategies and learning
processes. However, random drifts in decision variables can corrupt this
inference by mimicking the signatures of systematic updates. Hence, identifying
the trial-by-trial evolution of decision variables requires methods that can
robustly account for such drifts. Recent studies (Lak'20, Mendon\c{c}a'20) have
made important advances in this direction, by proposing a convenient method to
correct for the influence of slow drifts in decision criterion, a key decision
variable. Here we apply this correction to a variety of updating scenarios, and
evaluate its performance. We show that the correction fails for a wide range of
commonly assumed systematic updating strategies, distorting one's inference
away from the veridical strategies towards a narrow subset. To address these
limitations, we propose a model-based approach for disambiguating systematic
updates from random drifts, and demonstrate its success on real and synthetic
datasets. We show that this approach accurately recovers the latent trajectory
of drifts in decision criterion as well as the generative systematic updates
from simulated data. Our results offer recommendations for methods to account
for the interactions between history biases and slow drifts, and highlight the
advantages of incorporating assumptions about the generative process directly
into models of decision-making.
- Abstract(参考訳): 意思決定タスクにおける試行履歴バイアスは、決定変数の体系的な更新を反映していると考えられており、その正確な性質は、基礎となるヒューリスティック戦略と学習プロセスに関する結論を知らせる。
しかし、決定変数のランダムなドリフトは、体系的な更新のシグネチャを模倣することで、この推論を損なう可能性がある。
したがって、決定変数の試行的な進化を特定するには、そのようなドリフトをしっかりと説明できる方法が必要である。
最近の研究(Lak'20, Mendon\c{c}a'20)は、決定基準における遅いドリフトの影響を補正する便利な方法を提案することで、この方向に重要な進歩を遂げている。
ここでは,この補正を様々な更新シナリオに適用し,その性能評価を行う。
この修正は, 広く想定された体系的更新戦略では失敗し, 検証的戦略から限定的な部分集合への推論を歪めている。
これらの制約に対処するために,ランダムドリフトから体系的な更新を曖昧化するためのモデルベースアプローチを提案し,実データと合成データセットでの成功を実証する。
本手法は, 決定基準におけるドリフトの潜在軌道を正確に復元し, シミュレーションデータから生成的体系的更新を行うことを示す。
本研究は,歴史バイアスと緩やかなドリフトの相互作用を考慮に入れた手法を提案するとともに,生成過程の仮定を直接意思決定モデルに組み込むことの利点を強調した。
関連論文リスト
- Making Large Language Models Better Planners with Reasoning-Decision Alignment [70.5381163219608]
マルチモーダリティ強化LLMに基づくエンドツーエンド意思決定モデルを提案する。
ペア化されたCoTと計画結果との推論・決定アライメントの制約を提案する。
提案する大規模言語プランナをRDA-Driverとして推論・決定アライメントする。
論文 参考訳(メタデータ) (2024-08-25T16:43:47Z) - Sequential sampling without comparison to boundary through model-free reinforcement learning [0.0]
不確実性を考慮した知覚決定のためのモデルなし強化学習アルゴリズムを提案する。
我々のモデルは、利用可能な証拠を与えられた決定にコミットするか、あるいは情報収集をコストで継続するかを学習する。
論文 参考訳(メタデータ) (2024-08-12T11:56:39Z) - Decision-Focused Forecasting: Decision Losses for Multistage Optimisation [0.0]
本稿では,予測の時間的時間的決定効果を考慮した多層モデルである決定中心予測を提案する。
本モデルでは,予測による状態パスを考慮した調整を行った。
エネルギー貯蔵調停タスクへのモデルの適用を実証し,本モデルが既存手法より優れていることを報告する。
論文 参考訳(メタデータ) (2024-05-23T15:48:46Z) - Effective Restoration of Source Knowledge in Continual Test Time
Adaptation [44.17577480511772]
本稿では、動的環境におけるドメインシフトを識別できる教師なし領域変更検出手法を提案する。
情報源から知識を復元することにより、モデルパラメータの段階的劣化に起因する負の結果を効果的に補正する。
我々は,最先端の適応手法と比較して,提案手法の優れた性能を示すために,ベンチマークデータセットの広範な実験を行った。
論文 参考訳(メタデータ) (2023-11-08T19:21:48Z) - RISE: Robust Individualized Decision Learning with Sensitive Variables [1.5293427903448025]
素直なベースラインは、決定規則を学習する際の繊細な変数を無視し、重大な不確実性と偏見をもたらすことである。
本稿では、オフライントレーニング中に機密変数を組み込む決定学習フレームワークを提案するが、モデル展開中に学習された決定ルールの入力には含まない。
論文 参考訳(メタデータ) (2022-11-12T04:31:38Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Modularity in Reinforcement Learning via Algorithmic Independence in
Credit Assignment [79.5678820246642]
提案手法は, 事前決定の順序に対して, スパース変化のみを必要とする伝達問題に対して, 政策段階の手法よりも, より標本効率が高いことを示す。
我々は最近提案された社会的意思決定の枠組みをマルコフ決定プロセスよりもよりきめ細かい形式主義として一般化する。
論文 参考訳(メタデータ) (2021-06-28T21:29:13Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z) - Effective Reinforcement Learning through Evolutionary Surrogate-Assisted
Prescription [18.547387505708485]
本稿では、進化的サロゲート支援処方(ESP)と呼ばれる一般的なアプローチを紹介する。
ESPは現実世界の問題における決定の最適化のための有望な基盤を形成する。
論文 参考訳(メタデータ) (2020-02-13T06:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。