論文の概要: Worst-Case Risk Quantification under Distributional Ambiguity using
Kernel Mean Embedding in Moment Problem
- arxiv url: http://arxiv.org/abs/2004.00166v2
- Date: Sun, 6 Sep 2020 15:02:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 02:05:53.212023
- Title: Worst-Case Risk Quantification under Distributional Ambiguity using
Kernel Mean Embedding in Moment Problem
- Title(参考訳): モーメント問題におけるカーネル平均埋め込みを用いた分布あいまいさ下の最悪のリスク定量化
- Authors: Jia-Jie Zhu, Wittawat Jitkrittum, Moritz Diehl, Bernhard Sch\"olkopf
- Abstract要約: カーネルの平均埋め込みを用いた分布あいまいさ下での最悪のケースリスクの定量化を提案する。
制約制御システムのコンテキストにおける最悪の制約違反確率を特徴付ける上で,提案手法を数値的に検証する。
- 参考スコア(独自算出の注目度): 17.909696462645023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In order to anticipate rare and impactful events, we propose to quantify the
worst-case risk under distributional ambiguity using a recent development in
kernel methods -- the kernel mean embedding. Specifically, we formulate the
generalized moment problem whose ambiguity set (i.e., the moment constraint) is
described by constraints in the associated reproducing kernel Hilbert space in
a nonparametric manner. We then present the tractable approximation and its
theoretical justification. As a concrete application, we numerically test the
proposed method in characterizing the worst-case constraint violation
probability in the context of a constrained stochastic control system.
- Abstract(参考訳): 希少かつ影響の大きい事象を予測するために,カーネルメソッドの最近の開発 -- カーネルは組込みを意味する -- を用いて,分布的曖昧性の下で最悪のリスクを定量化する。
具体的には、曖昧性集合(すなわちモーメント制約)が関連する再生カーネルヒルベルト空間の制約によって非パラメトリックな方法で記述される一般化モーメント問題を定式化する。
次に、抽出可能な近似とその理論的正当性を示す。
具体的な応用として,制約付き確率制御系のコンテキストにおける最悪の制約違反確率を特徴付けるために提案手法を数値的に検証する。
関連論文リスト
- Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Online Constraint Tightening in Stochastic Model Predictive Control: A
Regression Approach [49.056933332667114]
確率制約付き最適制御問題に対する解析解は存在しない。
制御中の制約強調パラメータをオンラインで学習するためのデータ駆動型アプローチを提案する。
提案手法は, 確率制約を厳密に満たす制約強調パラメータを導出する。
論文 参考訳(メタデータ) (2023-10-04T16:22:02Z) - On Regularization and Inference with Label Constraints [62.60903248392479]
機械学習パイプラインにおけるラベル制約を符号化するための2つの戦略、制約付き正規化、制約付き推論を比較した。
正規化については、制約に不整合なモデルを前置することで一般化ギャップを狭めることを示す。
制約付き推論では、モデルの違反を訂正することで人口リスクを低減し、それによってその違反を有利にすることを示す。
論文 参考訳(メタデータ) (2023-07-08T03:39:22Z) - Margin theory for the scenario-based approach to robust optimization in
high dimension [0.0]
本稿では、ロバストな最適化のためのシナリオアプローチを扱う。
これは、問題の不確実性によって引き起こされる可能性のある無限個の制約のランダムサンプリングに依存する。
論文 参考訳(メタデータ) (2023-03-07T13:33:46Z) - Kernel Conditional Moment Constraints for Confounding Robust Inference [22.816690686310714]
本研究では,非保守的共同設立者を対象に,オフラインの文脈的盗賊の政策評価について検討した。
政策値のシャープな下限を提供する一般推定器を提案する。
論文 参考訳(メタデータ) (2023-02-26T16:44:13Z) - On the Importance of Gradient Norm in PAC-Bayesian Bounds [92.82627080794491]
対数ソボレフ不等式の縮約性を利用する新しい一般化法を提案する。
我々は、この新たな損失段階的ノルム項が異なるニューラルネットワークに与える影響を実証的に分析する。
論文 参考訳(メタデータ) (2022-10-12T12:49:20Z) - Probabilistic learning inference of boundary value problem with
uncertainties based on Kullback-Leibler divergence under implicit constraints [0.0]
本稿では,境界値問題に対する後続確率モデルを事前確率モデルから推定できる確率論的学習推定法を提案する。
制約を表す暗黙マッピングの統計的代理モデルを導入する。
第2部では、提案した理論を説明するために応用を提示し、また、不均一な線形弾性媒体の3次元均質化への寄与も示している。
論文 参考訳(メタデータ) (2022-02-10T16:00:10Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - On Lower Bounds for Standard and Robust Gaussian Process Bandit
Optimization [55.937424268654645]
有界ノルムを持つ関数のブラックボックス最適化問題に対するアルゴリズム非依存な下界を考える。
本稿では, 単純さ, 汎用性, エラー確率への依存性の向上など, 後悔の下位境界を導出するための新しい証明手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T03:48:14Z) - Cautious Reinforcement Learning via Distributional Risk in the Dual
Domain [45.17200683056563]
マルコフ決定過程(MDP)によって定義される強化学習問題において,状態と行動空間が可算有限である場合のリスク感受性ポリシーの推定について検討する。
本稿では,強化学習の線形プログラミング(LP)の2つの目的に付加されるペナルティ関数として,新たなリスク定義を提案する。
論文 参考訳(メタデータ) (2020-02-27T23:18:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。