論文の概要: Variational Neural Belief Parameterizations for Robust Dexterous Grasping under Multimodal Uncertainty
- arxiv url: http://arxiv.org/abs/2604.25897v1
- Date: Tue, 28 Apr 2026 17:40:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.979799
- Title: Variational Neural Belief Parameterizations for Robust Dexterous Grasping under Multimodal Uncertainty
- Title(参考訳): マルチモーダル不確かさ下でのロバストデクスタラスグラフプのための変分ニューラルネットワークのパラメータ化
- Authors: Clinton Enwerem, Shreya Kalyanaraman, John S. Baras, Calin Belta,
- Abstract要約: リスクに敏感なPOMDPは、スケールの低さ、勾配に基づく最適化、条件付き値-アット・リスクの推定といった粒子フィルタの信念を使用する。
代わりに、潜在接触パラメータとオブジェクトのポーズに対する変分推論として把握獲得を定式化し、微分可能なガウス混合による信念を表現する。
- 参考スコア(独自算出の注目度): 5.4872967954342675
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contact variability, sensing uncertainty, and external disturbances make grasp execution stochastic. Expected-quality objectives ignore tail outcomes and often select grasps that fail under adverse contact realizations. Risk-sensitive POMDPs address this failure mode, but many use particle-filter beliefs that scale poorly, obstruct gradient-based optimization, and estimate Conditional Value-at-Risk (CVaR) with high-variance approximations. We instead formulate grasp acquisition as variational inference over latent contact parameters and object pose, representing the belief with a differentiable Gaussian mixture. We use Gumbel-Softmax component selection and location-scale reparameterization to express samples as smooth functions of the belief parameters, enabling pathwise gradients through a differentiable CVaR surrogate for direct optimization of tail robustness. In simulation, our variational neural belief improves robust grasp success under contact-parameter uncertainty and exogenous force perturbations while reducing planning time by roughly an order of magnitude relative to particle-filter model-predictive control. On a serial-chain robot arm with a multifingered hand, we validate grasp-and-lift success under object-pose uncertainty against a Gaussian baseline. Both methods succeed on the tested perturbations, but our controller terminates in fewer steps and less wall-clock time while achieving a higher tactile grasp-quality proxy. Our learned belief also calibrates risk more accurately, keeping mean absolute calibration error below 0.14 across tested simulation regimes, compared with 0.58 for a Cross-Entropy Method planner.
- Abstract(参考訳): 接触のばらつき、感覚の不確実性、外乱は、把握実行を確率的にする。
期待された品質の目的は、尾の成果を無視し、しばしば、悪質な接触実現の下で失敗する把握を選択する。
リスクに敏感なPMDPは、この障害モードに対処するが、多くの人は、低スケールの粒子フィルタの信念を使い、勾配に基づく最適化を妨害し、高分散近似で条件付き値-アット・リスク(CVaR)を推定する。
代わりに、潜在接触パラメータとオブジェクトのポーズに対する変分推論として把握獲得を定式化し、微分可能なガウス混合による信念を表現する。
我々は,Gumbel-Softmax成分選択と位置スケール再パラメータ化を用いて,標本を信念パラメータのスムーズな関数として表現する。
シミュレーションでは, 接触パラメータの不確実性および外因性力の摂動下での頑健な把握が向上し, 粒子フィルタモデル予測制御と比較して約1桁の計画時間を短縮する。
マルチフィンガーハンドを持つシリアルチェーンロボットアームにおいて,ガウスベースラインに対する物体的不確実性の下での把持と昇降の成功を検証した。
どちらの手法も実験で成功したが、我々の制御器はより少ないステップで終了し、またより触覚的なグリップクオリティのプロキシを実現する。
また,クロスエントロピー・メソッド・プランナでは0.58に対して,平均絶対校正誤差は0.14以下である。
関連論文リスト
- Does "Do Differentiable Simulators Give Better Policy Gradients?'' Give Better Policy Gradients? [25.53040167917892]
不連続力学はバイアスを引き起こし、1階推定器の有効性を損なう。
非滑らかな領域で推定器を切り替える軽量なテストであるDDCGを導入する。
また,各ステップ毎の逆分散実装であるIVW-Hについて,明示的な不連続検出を伴わずに分散を安定化する。
論文 参考訳(メタデータ) (2026-04-20T12:23:48Z) - TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same [2.755751829139168]
ほとんどの不確実性を認識したロボットシステムは、予測の不確実性を単一のスカラースコアに分解し、それを使って一様に修正された応答をトリガーする。
このアグリゲーションは、破損した観測結果から不確実性が生じるか、あるいは学習されたモデルと真のシステム力学とのミスマッチから生じるのかを曖昧にしている。
本研究では,不確かさを動脈およびてんかん成分に分解する軽量なポストホックフレームワークを導入し,これらの信号を用いて推論時のシステム応答を調節する。
論文 参考訳(メタデータ) (2026-03-09T09:07:43Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - Accelerated Gradient Methods with Biased Gradient Estimates: Risk Sensitivity, High-Probability Guarantees, and Large Deviation Bounds [12.025550076793396]
本研究では,収束率と強靭性への勾配のトレードオフについて,一階法の文脈で検討する。
潜在的なバイアス付き準ガウス勾配誤差の下では、リスク・センシティブ・インデックス(RSI)の有限時間アナログ上の非漸近境界を導出する。
滑らかな凸関数の場合、RSIと収束率境界との間の類似のトレードオフも観察する。
論文 参考訳(メタデータ) (2025-09-17T01:56:31Z) - Sample Margin-Aware Recalibration of Temperature Scaling [20.87493013833571]
近年のディープラーニングの進歩は予測精度を大幅に改善した。
現代のニューラルネットワークは体系的に過信され、安全クリティカルなシナリオに展開するリスクを生じさせる。
本稿では,上位2つのロジット間のマージンに基づいて,ロジットを正確にスケールする軽量でデータ効率の高いリカバリ手法を提案する。
論文 参考訳(メタデータ) (2025-06-30T03:35:05Z) - RF-BayesPhysNet: A Bayesian rPPG Uncertainty Estimation Method for Complex Scenarios [5.349703489635052]
リモート光合成技術は、カメラを用いて顔の皮膚の微妙な色変化を捉え、心拍数を推定する。
測定精度は複雑なシナリオで著しく低下します
ディープラーニングモデルは、しばしば測定の不確実性を無視し、ダイナミックなシーンにおける信頼性を制限する。
論文 参考訳(メタデータ) (2025-04-04T20:24:57Z) - Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Robustness and Accuracy Could Be Reconcilable by (Proper) Definition [109.62614226793833]
強靭性と精度のトレードオフは、敵文学において広く研究されている。
局所的不変性の帰納的バイアスを課す不適切に定義された頑健な誤差に由来する可能性がある。
定義上、SCOREは、最悪のケースの不確実性に対処しながら、堅牢性と正確性の間の和解を促進する。
論文 参考訳(メタデータ) (2022-02-21T10:36:09Z) - Differentiable Annealed Importance Sampling and the Perils of Gradient
Noise [68.44523807580438]
Annealed importance sample (AIS) と関連するアルゴリズムは、限界推定のための非常に効果的なツールである。
差別性は、目的として限界確率を最適化する可能性を認めるため、望ましい性質である。
我々はメトロポリス・ハスティングスのステップを放棄して微分可能アルゴリズムを提案し、ミニバッチ計算をさらに解き放つ。
論文 参考訳(メタデータ) (2021-07-21T17:10:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。