論文の概要: Resolving Multiple-Dynamic Model Uncertainty in Hypothesis-Driven Belief-MDPs
- arxiv url: http://arxiv.org/abs/2411.14404v1
- Date: Thu, 21 Nov 2024 18:36:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-22 15:18:18.011615
- Title: Resolving Multiple-Dynamic Model Uncertainty in Hypothesis-Driven Belief-MDPs
- Title(参考訳): 仮説駆動型Belief-MDPにおけるマルチダイナミックモデル不確かさの解消
- Authors: Ofer Dagan, Tyler Becker, Zachary N. Sunberg,
- Abstract要約: 複数の仮説に対する推論を可能にする仮説駆動の信念 MDP を提案する。
また,(ほぼ)正しい仮説を確定し,基礎となるPOMDPで良好に機能するという目標をバランスづける新たな信念であるMDPを提案する。
- 参考スコア(独自算出の注目度): 4.956709222278243
- License:
- Abstract: When human operators of cyber-physical systems encounter surprising behavior, they often consider multiple hypotheses that might explain it. In some cases, taking information-gathering actions such as additional measurements or control inputs given to the system can help resolve uncertainty and determine the most accurate hypothesis. The task of optimizing these actions can be formulated as a belief-space Markov decision process that we call a hypothesis-driven belief MDP. Unfortunately, this problem suffers from the curse of history similar to a partially observable Markov decision process (POMDP). To plan in continuous domains, an agent needs to reason over countlessly many possible action-observation histories, each resulting in a different belief over the unknown state. The problem is exacerbated in the hypothesis-driven context because each action-observation pair spawns a different belief for each hypothesis, leading to additional branching. This paper considers the case in which each hypothesis corresponds to a different dynamic model in an underlying POMDP. We present a new belief MDP formulation that: (i) enables reasoning over multiple hypotheses, (ii) balances the goals of determining the (most likely) correct hypothesis and performing well in the underlying POMDP, and (iii) can be solved with sparse tree search.
- Abstract(参考訳): サイバー物理システムの人間のオペレーターが驚くべき行動に遭遇したとき、彼らはしばしばそれを説明できる複数の仮説を考える。
場合によっては、システムに与えられた追加の測定や制御入力のような情報収集のアクションをとることは、不確実性を解消し、最も正確な仮説を決定するのに役立つ。
これらの行動を最適化するタスクは、仮説駆動的信念 MDP と呼ばれる信念空間マルコフ決定プロセスとして定式化することができる。
残念ながら、この問題は部分的に観測可能なマルコフ決定プロセス(POMDP)に似た歴史の呪いに悩まされている。
連続的なドメインを計画するためには、エージェントは数え切れないほど多くのアクション・オブザーブレーション履歴を推論し、それぞれが未知の状態に対する異なる信念をもたらす必要がある。
この問題は、各行動観測ペアがそれぞれの仮説に対して異なる信念を生じさせ、さらなる分岐をもたらすため、仮説駆動の文脈で悪化する。
本稿では,各仮説が基礎となるPOMDPの異なる動的モデルに対応する場合について考察する。
MDPの新たな定式化について述べる。
(i)複数の仮説に対する推論を可能にする。
(二)(最も可能性の高い)正しい仮説を決定し、基礎となるPOMDPでうまく機能するという目標のバランスをとること。
(iii)スパースツリーサーチで解決できる。
関連論文リスト
- Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - On Continuity of Robust and Accurate Classifiers [3.8673630752805437]
敵の訓練が仮説の堅牢性を向上させることが示されている。
仮説の頑健性と正確性は互いに相反していることが示唆されている。
本稿では,その頑健さと精度に相容れない仮説の連続性について,その代替案を提示する。
論文 参考訳(メタデータ) (2023-09-29T08:14:25Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Data Association Aware POMDP Planning with Hypothesis Pruning
Performance Guarantees [7.928094304325113]
あいまいなデータアソシエーションによるプランニングのためのプルーニングに基づくアプローチを導入する。
我々の重要な貢献は、仮説の完全な集合に基づく値関数と仮説のプルーンド・サブセットに基づく値関数とのバウンダリを導出することである。
我々は,これらの境界が,ふりかえりにおけるプルーニングの証明にどのように使用できるかを実証し,その損失に対する事前定義された限界を確保するために,どの仮説がプルーンであるかを決定する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-03-03T18:35:01Z) - Neural Causal Models for Counterfactual Identification and Estimation [62.30444687707919]
本稿では,ニューラルモデルによる反事実文の評価について検討する。
まず、神経因果モデル(NCM)が十分に表現可能であることを示す。
第2に,反事実分布の同時同定と推定を行うアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-09-30T18:29:09Z) - Causal Discovery in Heterogeneous Environments Under the Sparse
Mechanism Shift Hypothesis [7.895866278697778]
機械学習のアプローチは、一般に独立で同一に分散されたデータ(すなわち、d)の仮定に依存する。
実際、この仮定は環境間の分散シフトによってほとんど常に破られる。
そこで我々は,様々な経験的推定器に適用可能なスコアベースアプローチであるメカニズムシフトスコア(MSS)を提案する。
論文 参考訳(メタデータ) (2022-06-04T15:39:30Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - Distribution Preserving Multiple Hypotheses Prediction for Uncertainty
Modeling [0.0]
本稿では,複数の仮説予測手法を保存するための代替的損失を提案する。
実験により,本手法は,合成および実世界の動き予測データセット上でより代表的な仮説を導出することを示す。
提案手法の出力は, サンプリングに基づくモンテカルロ法で直接利用することができる。
論文 参考訳(メタデータ) (2021-10-06T15:36:17Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - A General Framework for Distributed Inference with Uncertain Models [14.8884251609335]
異種エージェントのネットワークを用いた分散分類の問題について検討する。
我々は、エージェントの不確実性を可能性に組み込む不確実性モデルの概念に基づいて構築する。
論文 参考訳(メタデータ) (2020-11-20T22:17:12Z) - Empirically Verifying Hypotheses Using Reinforcement Learning [58.09414653169534]
本稿では,仮説検証をRL問題として定式化する。
我々は、世界の力学に関する仮説を前提として、仮説が真か偽かを予測するのに役立つ観測結果を生成することができるエージェントを構築することを目指している。
論文 参考訳(メタデータ) (2020-06-29T01:01:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。