論文の概要: Distill-Belief: Closed-Loop Inverse Source Localization and Characterization in Physical Fields
- arxiv url: http://arxiv.org/abs/2604.26095v1
- Date: Tue, 28 Apr 2026 20:18:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.161207
- Title: Distill-Belief: Closed-Loop Inverse Source Localization and Characterization in Physical Fields
- Title(参考訳): Distill-Belief: 閉ループ逆音源定位と物理分野のキャラクタリゼーション
- Authors: Yiwei Shi, Zixing Song, Mengyue Yang, Cunjia Liu, Weiru Liu,
- Abstract要約: 正しさを効率から分離する教師学生向けフレームワークである textbfDistill-Belief を提案する。
実験の結果,Distill-Beliefはセンサコストを一貫して低減し,成功率,後部収縮率,ベースライン上の推定精度を向上することがわかった。
- 参考スコア(独自算出の注目度): 19.32007397161956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: {Closed-loop inverse source localization and characterization (ISLC) requires a mobile agent to select measurements that localize sources and infer latent field parameters under strict time constraints.} {The core challenge lies in the belief-space objective: valid uncertainty estimation requires expensive Bayesian inference, whereas using fast learned belief model leads to reward hacking, in which the policy exploits approximation errors rather than actually reducing uncertainty.} {We propose \textbf{Distill-Belief}, a teacher--student framework that decouples correctness from efficiency. A Bayes-correct particle-filter teacher maintains the posterior and supplies a dense information-gain signal, while a compact student distills the posterior into belief statistics for control and an uncertainty certificate for stopping. At deployment, only the student is used, yielding constant per-step cost.} {Experiments on seven field modalities and two stress tests show that Distill-Belief consistently reduces sensing cost and improves success, posterior contraction, and estimation accuracy over baselines, while mitigating reward hacking.}
- Abstract(参考訳): {Closed-loop inverse source localization and characterization (ISLC) では、移動体エージェントがソースをローカライズし、厳密な時間制約の下で潜在フィールドパラメータを推論する測定をする必要がある。
妥当な不確実性推定には高価なベイズ推定が必要であり、一方、高速学習された信念モデルを使用することは、不確実性を実際に低減するのではなく、近似誤差を悪用する報奨ハッキングにつながる。
正しさを効率から切り離す教師主導のフレームワークである。
ベイズ補正粒子フィルタ教師は、後部を維持し、濃厚な情報ゲイン信号を供給する一方、コンパクトな学生は後部を制御のための信頼統計と停止のための不確実性証明に蒸留する。
デプロイでは、学生のみが使用され、ステップ毎のコストが一定になる。
フィールドの7つのモダリティの実験と2つのストレステストにより、Distill-Beliefは、報酬ハッキングを軽減しつつ、検知コストを一貫して削減し、成功、後部収縮、およびベースライン上の推定精度を向上させることが示されている。
※
関連論文リスト
- The Illusion of Certainty: Decoupling Capability and Calibration in On-Policy Distillation [67.26315138466312]
モデルロールアウトから経験的信頼性を推定するキャリブレーション対応のOPDフレームワークであるCaOPDを提案する。
本研究は, 能力蒸留が信頼性を示唆するものではないこと, 信頼性をポストトレーニングの本質的な目的として扱うべきであることを明らかにする。
論文 参考訳(メタデータ) (2026-04-18T04:43:40Z) - Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency [78.91846841708586]
完全な自己整合性で答えられた事実でさえ、軽微な文脈干渉の下で急速に崩壊することを示します。
本研究では,概念的近傍における応答コヒーレンスを評価する信念の構造尺度であるNighbor-Consistency Belief(NCB)を提案する。
また、文脈不変の信念構造を最適化し、長い知識の脆さを約30%低減する構造意識訓練(SAT)を提案する。
論文 参考訳(メタデータ) (2026-01-09T16:23:21Z) - Causality-Inspired Safe Residual Correction for Multivariate Time Series [12.183024727781449]
我々はCRC(Causality-inspired Safe Residual Correction)を提案する。
因果性にインスパイアされたエンコーダを用いて、自己および相互変数のダイナミクスを分離することで方向認識構造を公開する。
実験の結果、CRCは精度を継続的に改善する一方、深部アブレーションの研究は、そのコアセーフティメカニズムが例外的に高い非劣化速度(NDR)を保証していることを確認した。
論文 参考訳(メタデータ) (2025-12-27T01:34:14Z) - Uncertainty-Driven Reliability: Selective Prediction and Trustworthy Deployment in Modern Machine Learning [1.2183405753834562]
この論文は、不確実性推定が機械学習(ML)システムの安全性と信頼性を高める方法について考察する。
まず、モデルのトレーニング軌道は、アーキテクチャの変更や損失を伴わずに活用できるような、豊富な不確実性信号を含むことを示す。
本稿では,タスク間で動作し,深層アンサンブルのコストを回避し,最先端の選択的予測性能を実現する軽量なポストホック禁忌手法を提案する。
論文 参考訳(メタデータ) (2025-08-11T02:33:53Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Latent Veracity Inference for Identifying Errors in Stepwise Reasoning [78.29317733206643]
本稿では、精度割当てに対する離散探索アルゴリズムであるVeracity Search(VS)を紹介する。
その他の方法では、後続の精度値よりも後続の分布において難解な推論を行う。
VSを一般化し、新しいコンテキストで正確なゼロショットの精度推論を可能にする。
論文 参考訳(メタデータ) (2025-05-17T04:16:36Z) - Robustness and Accuracy Could Be Reconcilable by (Proper) Definition [109.62614226793833]
強靭性と精度のトレードオフは、敵文学において広く研究されている。
局所的不変性の帰納的バイアスを課す不適切に定義された頑健な誤差に由来する可能性がある。
定義上、SCOREは、最悪のケースの不確実性に対処しながら、堅牢性と正確性の間の和解を促進する。
論文 参考訳(メタデータ) (2022-02-21T10:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。