論文の概要: Probabilistic Loss and its Online Characterization for Simplified
Decision Making Under Uncertainty
- arxiv url: http://arxiv.org/abs/2105.05789v1
- Date: Wed, 12 May 2021 17:02:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 14:07:28.704009
- Title: Probabilistic Loss and its Online Characterization for Simplified
Decision Making Under Uncertainty
- Title(参考訳): 不確実性下における簡易意思決定のための確率損失とそのオンライン評価
- Authors: Andrey Zhitnikov, Vadim Indelman
- Abstract要約: 標準近似を取り除き, 従来抑制されていた変動要因をすべて考慮し, 意思決定機構全体を拡張した。
この枠組みを用いた簡略化が特定の簡略化技術に与える影響をオンライン上で特徴づける。
- 参考スコア(独自算出の注目度): 13.807859854345834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is a long-standing objective to ease the computation burden incurred by
the decision making process. Identification of this mechanism's sensitivity to
simplification has tremendous ramifications. Yet, algorithms for decision
making under uncertainty usually lean on approximations or heuristics without
quantifying their effect. Therefore, challenging scenarios could severely
impair the performance of such methods. In this paper, we extend the decision
making mechanism to the whole by removing standard approximations and
considering all previously suppressed stochastic sources of variability. On top
of this extension, our key contribution is a novel framework to simplify
decision making while assessing and controlling online the simplification's
impact. Furthermore, we present novel stochastic bounds on the return and
characterize online the effect of simplification using this framework on a
particular simplification technique - reducing the number of samples in belief
representation for planning. Finally, we verify the advantages of our approach
through extensive simulations.
- Abstract(参考訳): 意思決定プロセスによって生じる計算負担を緩和することが長年の目標である。
この機構の単純化に対する感度の同定は、大きな影響をもたらす。
しかし、不確実性の下で意思決定を行うアルゴリズムは通常、その効果を定量化せずに近似やヒューリスティックに依存する。
したがって、困難なシナリオはそのような手法の性能を著しく損なう可能性がある。
本稿では, 標準近似を取り除き, 従来抑制されていた確率的変動源をすべて考慮し, 意思決定機構全体を拡張する。
この拡張に加えて、私たちの重要な貢献は、オンラインの簡易化の影響を評価し制御しながら意思決定を簡素化する新しいフレームワークです。
さらに, 帰納に関する新たな確率的境界を提示し, 計画のための信念表現におけるサンプル数を削減し, この枠組みを用いた単純化の効果をオンライン上で特徴付ける。
最後に,本手法の利点を広範囲なシミュレーションにより検証する。
関連論文リスト
- Know Where You're Uncertain When Planning with Multimodal Foundation Models: A Formal Framework [54.40508478482667]
認識と計画生成の不確実性を解消し、定量化し、緩和する包括的枠組みを提案する。
本稿では,知覚と意思決定の独特な性質に合わせた手法を提案する。
この不確実性分散フレームワークは, 変動率を最大40%削減し, タスク成功率をベースラインに比べて5%向上させることを示した。
論文 参考訳(メタデータ) (2024-11-03T17:32:00Z) - Rethinking State Disentanglement in Causal Reinforcement Learning [78.12976579620165]
因果性は、根底にある状態が識別可能性によって一意に回復できることを保証するための厳密な理論的支援を提供する。
我々はこの研究ラインを再考し、RL固有のコンテキストを取り入れることで、潜在状態に対する以前の識別可能性分析における不要な仮定を低減できることを示した。
本稿では, 従来手法の複雑な構造制約を, 遷移と報酬保存の2つの簡単な制約に置き換えることにより, 一般に部分的に観測可能なマルコフ決定過程(POMDP)を提案する。
論文 参考訳(メタデータ) (2024-08-24T06:49:13Z) - Disparate Impact on Group Accuracy of Linearization for Private Inference [48.27026603581436]
多数派と比較して,ReLUアクティベーション数の減少は少数派に対する精度を著しく低下させることを示す。
また,線形化モデルの微調整手順を変更する簡単な手順が,効果的な緩和戦略として有効であることを示す。
論文 参考訳(メタデータ) (2024-02-06T01:56:29Z) - Decomposing Counterfactual Explanations for Consequential Decision
Making [11.17545155325116]
我々は、IMFと強い因果的前提の間のギャップを埋める、新しく実践的な枠組みを開発する。
textttは、共変特徴の潜在表現をアンタングルすることで、recoursesを生成する。
実世界のデータに関する我々の実験は、理論上動機づけられたリコースモデルと相関し、信頼性と低コストのリコースを提供するフレームワークの能力を強調します。
論文 参考訳(メタデータ) (2022-11-03T21:26:55Z) - Offline Policy Optimization with Eligible Actions [34.4530766779594]
オフラインポリシーの最適化は多くの現実世界の意思決定問題に大きな影響を与える可能性がある。
重要度サンプリングとその変種は、オフラインポリシー評価において一般的に使用されるタイプの推定器である。
そこで本稿では, 州ごとの正規化制約によって過度に適合することを避けるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-01T19:18:15Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Provable Guarantees on the Robustness of Decision Rules to Causal
Interventions [20.27500901133189]
データ生成プロセスの変化に対する決定ルールのロバストさは、意思決定システムのデプロイの成功に不可欠である。
我々は因果ベイズネットワークを考察し、介入堅牢性問題を正式に定義する。
干渉確率の保証された上下境界を計算するための効率的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-05-19T13:09:47Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。