論文の概要: Fully probabilistic design for knowledge fusion between Bayesian filters
under uniform disturbances
- arxiv url: http://arxiv.org/abs/2109.10596v1
- Date: Wed, 22 Sep 2021 08:49:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 13:42:37.020864
- Title: Fully probabilistic design for knowledge fusion between Bayesian filters
under uniform disturbances
- Title(参考訳): 一様外乱下におけるベイズフィルタ間の知識融合の完全確率的設計
- Authors: Lenka Kukli\v{s}ov\'a Pavelkov\'a (1), Ladislav Jirsa (1), Anthony
Quinn (1 and 2) ((1) Czech Academy of Sciences, Institute of Information
Theory and Automation, Czech Republic, (2) Trinity College Dublin, the
University of Dublin, Ireland)
- Abstract要約: 本稿では,線形状態空間プロセス間のベイズ移動学習に基づく知識融合の問題について考察する。
ターゲットとソースのジョイントモデルは不要で、引き起こされません。
結果として得られるFPD最適学習者は、質の悪い情報源知識を拒否できるという意味で、堅牢である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers the problem of Bayesian transfer learning-based
knowledge fusion between linear state-space processes driven by uniform state
and observation noise processes. The target task conditions on probabilistic
state predictor(s) supplied by the source filtering task(s) to improve its own
state estimate. A joint model of the target and source(s) is not required and
is not elicited. The resulting decision-making problem for choosing the optimal
conditional target filtering distribution under incomplete modelling is solved
via fully probabilistic design (FPD), i.e. via appropriate minimization of
Kullback-Leibler divergence (KLD). The resulting FPD-optimal target learner is
robust, in the sense that it can reject poor-quality source knowledge. In
addition, the fact that this Bayesian transfer learning (BTL) scheme does not
depend on a model of interaction between the source and target tasks ensures
robustness to the misspecification of such a model. The latter is a problem
that affects conventional transfer learning methods. The properties of the
proposed BTL scheme are demonstrated via extensive simulations, and in
comparison with two contemporary alternatives.
- Abstract(参考訳): 本稿では,一様状態による線形状態空間過程と観測雑音過程とのベイズ伝達学習に基づく知識融合の問題について考察する。
ソースフィルタリングタスク(s)から供給される確率的状態予測器の目標タスク条件は、自身の状態推定を改善する。
ターゲットとソース(s)のジョイントモデルを必要としない。
完全確率設計(FPD)、すなわちクルバック・リーブラー発散(KLD)の適切な最小化により、不完全モデリングの下で最適条件目標フィルタリング分布を選択するための意思決定問題を解く。
FPD最適目標学習者は、質の悪い情報源知識を拒絶できるという意味で、堅牢である。
さらに、このベイズ変換学習(BTL)スキームは、ソースとターゲットタスク間の相互作用モデルに依存しないという事実は、そのようなモデルの誤特定に対して堅牢性を保証する。
後者は従来の移動学習法に影響を与える問題である。
提案するbtl方式の特性は, 広範なシミュレーションにより実証され, 従来の2つの代替案と比較した。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Decomposing Uncertainty for Large Language Models through Input Clarification Ensembling [69.83976050879318]
大規模言語モデル(LLM)では、不確実性の原因を特定することが、信頼性、信頼性、解釈可能性を改善するための重要なステップである。
本稿では,LLMのための不確実性分解フレームワークについて述べる。
提案手法は,入力に対する一連の明確化を生成し,それらをLLMに入力し,対応する予測をアンサンブルする。
論文 参考訳(メタデータ) (2023-11-15T05:58:35Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Distributional Shift-Aware Off-Policy Interval Estimation: A Unified
Error Quantification Framework [8.572441599469597]
本研究では、無限水平マルコフ決定過程の文脈における高信頼オフ政治評価について検討する。
目的は、未知の行動ポリシーから事前に収集されたオフラインデータのみを用いて、対象の政策値に対する信頼区間(CI)を確立することである。
提案アルゴリズムは, 非線形関数近似設定においても, サンプル効率, 誤差ローバスト, 既知収束性を示す。
論文 参考訳(メタデータ) (2023-09-23T06:35:44Z) - Practical Probabilistic Model-based Deep Reinforcement Learning by
Integrating Dropout Uncertainty and Trajectory Sampling [7.179313063022576]
本稿では,ニューラルネットワーク上に構築された現在の確率モデルベース強化学習(MBRL)の予測安定性,予測精度,制御能力について述べる。
トラジェクトリサンプリング(DPETS)を用いた新しいアプローチであるドロップアウト型確率アンサンブルを提案する。
論文 参考訳(メタデータ) (2023-09-20T06:39:19Z) - Model-based Offline Policy Optimization with Adversarial Network [0.36868085124383626]
本稿では,新たなモデルベースオフラインポリシー最適化フレームワーク(MOAN)を提案する。
主なアイデアは、敵の学習を使って、より良い一般化を伴う遷移モデルを構築することである。
我々の手法は、広く研究されているオフラインRLベンチマークにおいて、最先端のベースラインよりも優れている。
論文 参考訳(メタデータ) (2023-09-05T11:49:33Z) - Uncertainty-guided Source-free Domain Adaptation [77.3844160723014]
ソースフリードメイン適応(SFDA)は、事前訓練されたソースモデルのみを使用することで、未ラベルのターゲットデータセットに分類器を適応させることを目的としている。
本稿では、ソースモデル予測の不確実性を定量化し、ターゲット適応の導出に利用することを提案する。
論文 参考訳(メタデータ) (2022-08-16T08:03:30Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - BayesIMP: Uncertainty Quantification for Causal Data Fusion [52.184885680729224]
本研究では,複数の因果グラフに関連するデータセットを組み合わせ,対象変数の平均処理効果を推定する因果データ融合問題について検討する。
本稿では、確率積分とカーネル平均埋め込みのアイデアを組み合わせて、再生されたカーネルヒルベルト空間における干渉分布を表現するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-07T10:14:18Z) - Transferring model structure in Bayesian transfer learning for Gaussian
process regression [1.370633147306388]
本稿では、転送源分布上の目標確率分布を条件付けるタスクを定義する。
この最適意思決定問題を解決するために、完全な確率的設計が採用されている。
ソースのより高いモーメントを転送することで、ターゲットは信頼できないソース知識を拒否することができる。
論文 参考訳(メタデータ) (2021-01-18T05:28:02Z) - Distributionally Robust Chance Constrained Programming with Generative
Adversarial Networks (GANs) [0.0]
GAN(Generative Adversarial Network)をベースとしたデータ駆動型分散ロバストな制約付きプログラミングフレームワークを提案する。
非パラメトリックかつ教師なしの方法で、歴史的データから分布情報を完全抽出するために、GANを適用する。
提案手法は需要不確実性の下でサプライチェーン最適化に適用される。
論文 参考訳(メタデータ) (2020-02-28T00:05:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。