論文の概要: Sensitivity Shaping for Latent Modeling
- arxiv url: http://arxiv.org/abs/2606.14585v1
- Date: Fri, 12 Jun 2026 16:01:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.974912
- Title: Sensitivity Shaping for Latent Modeling
- Title(参考訳): 潜在モデルのための感度整形
- Authors: Hongzhan Yu, Chenghao Li, Ruipeng Zhang, Henrik Christensen, Sicun Gao,
- Abstract要約: 本稿では,学習力学における制御入力変化に対する応答性の向上を目的とした,サポート条件付き制御感度正規化を提案する。
視覚に基づく障害物回避、操作、実ロボットナビゲーションの実験では、OODの検出とより安全なクローズループ計画が改善された。
- 参考スコア(独自算出の注目度): 24.352929199796236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative dynamics models enable planning in challenging robotic systems, but safe deployment requires reliably detecting policy-induced out-of-distribution (OOD) transitions. Existing methods typically treat the learned dynamics as fixed and attach post hoc support surrogates. We show that these surrogates can fail when the dynamics are locally insensitive to critical action choices: unsupported control actions may produce latent predictions that resemble demonstrated transitions, suppressing OOD signals despite large true predictive errors. To address this, we introduce support-conditioned control-sensitivity regularization, which promotes sensitive local response to control input changes in learned dynamics in high-support training regions. This preserves control-induced variation while limiting unstable extrapolation due to weak empirical support. Experiments in vision-based obstacle avoidance, manipulation, and real-robot navigation show improved OOD detection and safer closed-loop planning.
- Abstract(参考訳): 生成力学モデルは、挑戦的なロボットシステムの計画を可能にするが、安全な配置には、ポリシーによって引き起こされるアウト・オブ・ディストリビューション(OOD)遷移を確実に検出する必要がある。
既存の方法は通常、学習したダイナミクスを固定として扱い、ポストホックサポートサロゲートをアタッチする。
これらのサロゲートは、ダイナミクスが局所的に重要な行動選択に無関心であるときに失敗する可能性があることを示す:サポートされていない制御アクションは、実演的な遷移に似た潜伏予測を生成し、真の予測誤差が大きいにもかかわらずOOD信号を抑制する。
そこで本研究では,高機能トレーニング領域における学習力学における制御入力変化に対する応答性の向上を目的とした,サポート条件付き制御感度正則化を提案する。
これは、弱い経験的支持による不安定な外挿を制限しながら、制御によって引き起こされる変動を保存する。
視覚に基づく障害物回避、操作、実ロボットナビゲーションの実験では、OODの検出とより安全なクローズループ計画が改善された。
関連論文リスト
- Activation Steering Induces Emergent Misalignment: A More Comprehensive Evaluation [74.17379276939599]
近年のQwen-3.5シリーズにおいても,アクティベーションステアリングが広範囲のアライメントを引き起こすことが示されている。
ステアリングサイズ, ステアリングサブスペースの低ランク構造, ステアリングベクター構築時のエポック数など, キーステアリング固有の因子を解析することにより, AS誘起EMの特性を特徴づける。
論文 参考訳(メタデータ) (2026-06-07T15:34:59Z) - Mitigating Error Amplification in Fast Adversarial Training [58.74042726356826]
FAT(Fast Adversarial Training)は、ネットワークに摂動不変表現の学習を促すことによって、モデルロバスト性の向上に有効であることが証明されている。
FATは、しばしば破滅的なオーバーフィッティング(CO)に悩まされ、モデルがトレーニングアタックに過度に適合し、目に見えないものへの一般化に失敗する。
本稿では、摂動予算と監視信号の両方を動的に調整する分散対応動的ガイダンス(DDG)戦略を提案する。
論文 参考訳(メタデータ) (2026-04-27T11:23:18Z) - Latent Dynamics-Aware OOD Monitoring for Trajectory Prediction with Provable Guarantees [8.920589816043298]
安全クリティカルなサイバー物理システムでは、正確な軌道予測が下流の計画と制御に不可欠なガイダンスを提供する。
このようなOODイベントの検出は、トラフィック条件の進化とインタラクションパターンの変化によって困難である。
我々は,変化後分布の明示的な知識を必要とせずに,累積最大離散性アプローチを拡張して検出を可能にする。
3つの実世界の運転データセットの実験では、重み付きエラーや未知のポストチェンジ条件に対する検出遅延と堅牢性の低減が示されている。
論文 参考訳(メタデータ) (2026-03-15T20:56:57Z) - When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift [64.37959940809633]
時間的持続的なセンサ故障下でのPPOのロバスト性について検討する。
トランスフォーマーを用いたシーケンスポリシーは, センサ数が少ない場合でも高いリターンを保ちながら, 堅牢性, RNN, SSMよりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-03-04T22:21:54Z) - From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - LatentGuard: Controllable Latent Steering for Robust Refusal of Attacks and Reliable Response Generation [4.29885665563186]
LATENTGUARDは、行動アライメントと教師付き潜在空間制御を組み合わせて、解釈可能で正確な安全操縦を行うフレームワークである。
本研究は, 実用性を損なうことなく, 安全性制御性と応答解釈性の両方を向上することを示す。
論文 参考訳(メタデータ) (2025-09-24T07:31:54Z) - Preliminary Investigation into Uncertainty-Aware Attack Stage Classification [81.28215542218724]
この研究は、不確実性の下での攻撃段階推論の問題に対処する。
Evidential Deep Learning (EDL) に基づく分類手法を提案し、ディリクレ分布のパラメータを可能な段階に出力することで予測の不確実性をモデル化する。
シミュレーション環境における予備実験により,提案モデルが精度良く攻撃の段階を推定できることが実証された。
論文 参考訳(メタデータ) (2025-08-01T06:58:00Z) - Hierarchical Reinforcement Learning Framework for Adaptive Walking Control Using General Value Functions of Lower-Limb Sensor Signals [0.40498500266986387]
階層強化学習を用いて,低域外骨格に対する適応制御戦略を開発する。
提案手法は,エクソスケルトン制御適応の複雑なタスクを,地形戦略適応のための高レベルフレームワークと予測情報を提供する低レベルフレームワークに分解する。
本研究では,実際のセンサ信号と予測センサ信号を政策ネットワークに組み込むことにより,制御システムの意思決定能力を向上させることを目的とした2つの手法について検討した。
論文 参考訳(メタデータ) (2025-07-22T19:47:04Z) - Probing the Robustness of Large Language Models Safety to Latent Perturbations [30.16804362984161]
安全アライメントは、信頼できる人工知能を構築する上で重要な要件である。
我々は、小さな潜伏シフトが、整列モデルにおける安全でない応答を引き起こすことを観察する。
学習中に隠された表現に制御された摂動を注入する微調整戦略であるLayer-wise Adversarial Patch Training (LAPT)を導入する。
論文 参考訳(メタデータ) (2025-06-19T07:03:05Z) - Predictive Coding for Locally-Linear Control [92.35650774524399]
高次元観測と未知のダイナミクスは、多くの実世界の意思決定タスクに最適な制御を適用する際に大きな課題である。
Learning Controllable Embedding (LCE)フレームワークは、観測結果を低次元の潜伏空間に埋め込むことによって、これらの課題に対処する。
理論的には、明示的な次観測予測を予測符号化に置き換えることが可能である。
論文 参考訳(メタデータ) (2020-03-02T18:20:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。