論文の概要: Uncertainty quantification and exploration-exploitation trade-off in
humans
- arxiv url: http://arxiv.org/abs/2102.07647v1
- Date: Fri, 5 Feb 2021 16:03:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:33:53.215624
- Title: Uncertainty quantification and exploration-exploitation trade-off in
humans
- Title(参考訳): 不確実性定量化と探査・探査トレードオフ
- Authors: Antonio Candelieri, Andrea Ponti, Francesco Archetti
- Abstract要約: 本稿では,不確実性下における人間の意思決定戦略が情報収集(探索)と報酬獲得(探索)のトレードオフをどのように管理するかを分析する理論的枠組みを概説する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The main objective of this paper is to outline a theoretical framework to
analyse how humans' decision-making strategies under uncertainty manage the
trade-off between information gathering (exploration) and reward seeking
(exploitation). A key observation, motivating this line of research, is the
awareness that human learners are amazingly fast and effective at adapting to
unfamiliar environments and incorporating upcoming knowledge: this is an
intriguing behaviour for cognitive sciences as well as an important challenge
for Machine Learning. The target problem considered is active learning in a
black-box optimization task and more specifically how the
exploration/exploitation dilemma can be modelled within Gaussian Process based
Bayesian Optimization framework, which is in turn based on uncertainty
quantification. The main contribution is to analyse humans' decisions with
respect to Pareto rationality where the two objectives are improvement expected
and uncertainty quantification. According to this Pareto rationality model, if
a decision set contains a Pareto efficient (dominant) strategy, a rational
decision maker should always select the dominant strategy over its dominated
alternatives. The distance from the Pareto frontier determines whether a choice
is (Pareto) rational (i.e., lays on the frontier) or is associated to
"exasperate" exploration. However, since the uncertainty is one of the two
objectives defining the Pareto frontier, we have investigated three different
uncertainty quantification measures and selected the one resulting more
compliant with the Pareto rationality model proposed. The key result is an
analytical framework to characterize how deviations from "rationality" depend
on uncertainty quantifications and the evolution of the reward seeking process.
- Abstract(参考訳): 本研究の目的は,情報収集(探索)と報酬探索(探索)のトレードオフを不確実性の下で人間の意思決定戦略がどのように管理するかを解析するための理論的枠組みを概説することである。
この一連の研究のモチベーションとなる重要な観察は、人間の学習者が見慣れない環境に適応し、今後の知識を取り入れて驚くほど高速かつ効果的である、という認識である。
対象とする問題は、ブラックボックス最適化タスクにおけるアクティブラーニングであり、より具体的には、探索/探索ジレンマがガウス過程に基づくベイズ最適化フレームワーク内でどのようにモデル化できるかである。
主な貢献は、2つの目的が期待される改善と不確実な定量化であるパレートの合理性に関する人間の決定を分析することである。
このパレート合理性モデルによれば、決定集合がパレート効率的な(支配的な)戦略を含むならば、合理的な意思決定者は、支配的な代替戦略よりも支配的な戦略を選択するべきである。
パレートフロンティアからの距離は、選択が(パレート)合理的であるか(すなわちフロンティアに横たわるか)、あるいは「過剰な」探検に関係しているかを決定する。
しかし,不確実性はパレートフロンティアを定義する2つの目標の1つであり,我々は3つの異なる不確実性定量化手法を調査し,提案するパレート合理性モデルに適合した1つを選択した。
主要な結果は、「合理性」からの逸脱が不確実な定量化と報酬を求める過程の進化にどのように依存するかを特徴づける分析的枠組みである。
関連論文リスト
- Scalarisation-based risk concepts for robust multi-objective optimisation [4.12484724941528]
この問題の多目的事例について検討する。
我々は、ロバストな多目的アルゴリズムの大多数が、ロバスト化とスカラー化という2つの重要な操作に依存していることを確認した。
これらの操作は必ずしも可換であるとは限らないので、それらが実行される順序は結果の解に影響を及ぼす。
論文 参考訳(メタデータ) (2024-05-16T16:11:00Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - A Semantic Approach to Decidability in Epistemic Planning (Extended
Version) [72.77805489645604]
我々は決定可能性を達成するために新しい意味論的アプローチを用いる。
具体的には、知識の論理S5$_n$と(知識)可換性と呼ばれる相互作用公理を拡大する。
我々は,本フレームワークが,独立した知識である共通知識の有限的非固定点的特徴を認めていることを証明した。
論文 参考訳(メタデータ) (2023-07-28T11:26:26Z) - On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - Explainability's Gain is Optimality's Loss? -- How Explanations Bias
Decision-making [0.0]
説明は、アルゴリズムと人間の意思決定者とのコミュニケーションを促進するのに役立つ。
因果モデルに関する特徴に基づく説明のセマンティクスは、意思決定者の以前の信念から漏れを引き起こす。
このような違いは、準最適かつ偏った決定結果をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-06-17T11:43:42Z) - The Statistical Complexity of Interactive Decision Making [126.04974881555094]
複雑度尺度であるDecision-Estimation Coefficientは,サンプル効率のインタラクティブ学習に必要かつ十分であることが証明された。
統合アルゴリズム設計原則であるE2Dは、教師付き推定のための任意のアルゴリズムを、意思決定のためのオンラインアルゴリズムに変換する。
論文 参考訳(メタデータ) (2021-12-27T02:53:44Z) - Gamifying optimization: a Wasserstein distance-based analysis of human
search [0.0]
本稿では,不確実性の下での人間の意思決定戦略を特徴づける理論的枠組みを概説する。
本稿では,人間の学習者の行動パターンを離散確率分布として表現する。
論文 参考訳(メタデータ) (2021-12-12T18:23:46Z) - Why do you think that? Exploring Faithful Sentence-Level Rationales
Without Supervision [60.62434362997016]
文レベルで忠実な論理を出力するモデルを作成するために,異なる訓練枠組みを提案する。
本モデルでは,各理性に基づいて各課題を個別に解決し,その課題を最もよく解決した者に高いスコアを割り当てることを学ぶ。
論文 参考訳(メタデータ) (2020-10-07T12:54:28Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z) - Causal Strategic Linear Regression [5.672132510411465]
信用スコアや学術試験のような多くの予測的な意思決定シナリオでは、意思決定者は、決定ルールを「ゲーム」するためにエージェントの正当性を説明するモデルを構築しなければならない。
私たちは、変更可能な属性の関数として、モデリングエージェントの結果の同時処理に参加します。
3つの異なる意思決定目標を最適化する意思決定ルールを学習するための効率的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-02-24T03:57:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。