論文の概要: Goal inference with Rao-Blackwellized Particle Filters
- arxiv url: http://arxiv.org/abs/2512.09269v1
- Date: Wed, 10 Dec 2025 02:48:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.374893
- Title: Goal inference with Rao-Blackwellized Particle Filters
- Title(参考訳): Rao-Blackwellized Particle Filterによるゴール推定
- Authors: Yixuan Wang, Dan P. Guralnik, Warren E. Dixon,
- Abstract要約: 軌跡のノイズ観測から移動エージェントの最終的な目標を推定することは基本的な推定問題である。
我々は、ラオブラックウェル化粒子フィルタ(RBPF)の変種を用いて、そのような意図推論を行う。
我々は,情報理論漏洩指標を用いて,敵がエージェントの意図をどの程度回復できるかを定量化する。
- 参考スコア(独自算出の注目度): 5.633221187382381
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inferring the eventual goal of a mobile agent from noisy observations of its trajectory is a fundamental estimation problem. We initiate the study of such intent inference using a variant of a Rao-Blackwellized Particle Filter (RBPF), subject to the assumption that the agent's intent manifests through closed-loop behavior with a state-of-the-art provable practical stability property. Leveraging the assumed closed-form agent dynamics, the RBPF analytically marginalizes the linear-Gaussian substructure and updates particle weights only, improving sample efficiency over a standard particle filter. Two difference estimators are introduced: a Gaussian mixture model using the RBPF weights and a reduced version confining the mixture to the effective sample. We quantify how well the adversary can recover the agent's intent using information-theoretic leakage metrics and provide computable lower bounds on the Kullback-Leibler (KL) divergence between the true intent distribution and RBPF estimates via Gaussian-mixture KL bounds. We also provide a bound on the difference in performance between the two estimators, highlighting the fact that the reduced estimator performs almost as well as the complete one. Experiments illustrate fast and accurate intent recovery for compliant agents, motivating future work on designing intent-obfuscating controllers.
- Abstract(参考訳): 軌跡のノイズ観測から移動エージェントの最終的な目標を推定することは基本的な推定問題である。
我々は, エージェントの意図が, 最先端の実証可能な実用安定性特性を持つ閉ループ挙動によって現れるという仮定のもとに, RBPFの変種を用いてそのような意図推論を開始する。
仮定されたクローズドフォームエージェントのダイナミクスを活用して、RBPFは線形ガウス部分構造を解析的に辺縁化し、粒子重量のみを更新し、標準粒子フィルタよりも試料効率を向上する。
RBPF重みを用いたガウス混合モデルと有効試料を補充した還元版とを2つの差分推定器として導入した。
我々は,情報理論的漏洩指標を用いてエージェントの意図をどの程度回復できるかを定量化し,真の意図分布とRBPF推定とのKL(Kulback-Leibler)偏差をガウス混合KL境界で計算可能な下界を与える。
また,2つの推定器間の性能差についても考察し,推定器の縮小がほぼ同じ性能を示すことを示す。
実験では、適合エージェントの高速かつ正確な意図回復を図示し、インテントオブファスティングコントローラの設計に向けた将来の取り組みを動機付けている。
関連論文リスト
- Chicken Swarm Kernel Particle Filter: A Structured Rejuvenation Approach with KLD-Efficient Sampling [0.0]
粒子フィルタ (PF) は、チキン・スワム最適化 (CSO) など、しばしばスワム・インテリジェンス (SI) アルゴリズムと組み合わせられる。
本稿では,SI-based rejuvenation kernel と Kullback-Leibler divergence (KLD) サンプリングの理論的相互作用について検討する。
論文 参考訳(メタデータ) (2025-11-15T13:55:29Z) - G$^2$RPO: Granular GRPO for Precise Reward in Flow Models [74.21206048155669]
本稿では,サンプリング方向の高精度かつ包括的な報酬評価を実現する新しいグラニュラー-GRPO(G$2$RPO)フレームワークを提案する。
複数の拡散スケールで計算された利点を集約するマルチグラニュラリティ・アドバンテージ・インテグレーション・モジュールを導入する。
G$2$RPOは既存のフローベースGRPOベースラインを著しく上回る。
論文 参考訳(メタデータ) (2025-10-02T12:57:12Z) - Training-Free Stein Diffusion Guidance: Posterior Correction for Sampling Beyond High-Density Regions [46.59494117137471]
自由拡散誘導の訓練は、追加の訓練なしに既成の分類器を活用する柔軟な方法を提供する。
本稿では,SOC を対象とする新たなトレーニングフリーフレームワークである Stein Diffusion Guidance (SDG) を紹介する。
分子低密度サンプリングタスクの実験は、SDGが標準のトレーニングフリーガイダンス手法を一貫して上回っていることを示唆している。
論文 参考訳(メタデータ) (2025-07-07T21:14:27Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Towards Understanding the Robustness of Diffusion-Based Purification: A Stochastic Perspective [65.10019978876863]
拡散性浄化(DBP)は、敵の攻撃に対する効果的な防御機構として出現している。
本稿では,DBPプロセスの本質性がロバスト性を駆動する主要な要因であることを示す。
論文 参考訳(メタデータ) (2024-04-22T16:10:38Z) - An analysis of the noise schedule for score-based generative models [7.180235086275926]
スコアベース生成モデル(SGM)は、目標からのノイズ摂動サンプルのみを用いてスコア関数を学習することにより、目標データ分布を推定することを目的としている。
近年の文献では、ターゲットと推定分布の誤差を評価し、KL(Kulback-Leibler)の発散とワッサーシュタイン距離を通じて生成品質を測ることに重点を置いている。
対象と推定分布のKL分散の上限を時間依存ノイズスケジュールによって明確に設定する。
論文 参考訳(メタデータ) (2024-02-07T08:24:35Z) - A Bayesian Semiparametric Method For Estimating Causal Quantile Effects [1.1118668841431563]
擬似分布の任意の関数を推測できる半パラメトリックな条件分布回帰モデルを提案する。
共振調整に二重バランススコアを用いることで, 単一スコアのみの調整よりも性能が向上することを示す。
提案手法をノースカロライナ出生体重データセットに適用し,母体喫煙が幼児の出生体重に与える影響を解析した。
論文 参考訳(メタデータ) (2022-11-03T05:15:18Z) - On the Practicality of Differential Privacy in Federated Learning by
Tuning Iteration Times [51.61278695776151]
フェデレートラーニング(FL)は、分散クライアント間で機械学習モデルを協調的にトレーニングする際のプライバシ保護でよく知られている。
最近の研究では、naive flは勾配リーク攻撃の影響を受けやすいことが指摘されている。
ディファレンシャルプライバシ(dp)は、勾配漏洩攻撃を防御するための有望な対策として現れる。
論文 参考訳(メタデータ) (2021-01-11T19:43:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。