論文の概要: World Model Robustness via Surprise Recognition
- arxiv url: http://arxiv.org/abs/2512.01119v1
- Date: Sun, 30 Nov 2025 22:25:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.594296
- Title: World Model Robustness via Surprise Recognition
- Title(参考訳): サプライズ認識による世界モデルロバストネス
- Authors: Geigh Zollicoffer, Tanush Chopra, Mingkuan Yan, Xiaoxu Ma, Kenneth Eaton, Mark Riedl,
- Abstract要約: 我々は,世界モデルに基づく強化学習エージェントにおける雑音の影響を低減するアルゴリズムを開発した。
本手法は,ノイズの種類やレベルによって,ベースラインに対する性能を保っていることを示す。
提案手法は,基礎となるアーキテクチャが著しく異なる2つの最先端世界モデルの安定性を向上させることを実証する。
- 参考スコア(独自算出の注目度): 2.019328356430632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI systems deployed in the real world must contend with distractions and out-of-distribution (OOD) noise that can destabilize their policies and lead to unsafe behavior. While robust training can reduce sensitivity to some forms of noise, it is infeasible to anticipate all possible OOD conditions. To mitigate this issue, we develop an algorithm that leverages a world model's inherent measure of surprise to reduce the impact of noise in world model--based reinforcement learning agents. We introduce both multi-representation and single-representation rejection sampling, enabling robustness to settings with multiple faulty sensors or a single faulty sensor. While the introduction of noise typically degrades agent performance, we show that our techniques preserve performance relative to baselines under varying types and levels of noise across multiple environments within self-driving simulation domains (CARLA and Safety Gymnasium). Furthermore, we demonstrate that our methods enhance the stability of two state-of-the-art world models with markedly different underlying architectures: Cosmos and DreamerV3. Together, these results highlight the robustness of our approach across world modeling domains. We release our code at https://github.com/Bluefin-Tuna/WISER .
- Abstract(参考訳): 現実世界に展開されるAIシステムは、彼らのポリシーを不安定にし、安全でない行動を引き起こす可能性のある、気晴らしとアウト・オブ・ディストリビューション(OOD)ノイズと競合しなければならない。
頑健なトレーニングはある種のノイズに対する感度を低下させるが、あらゆるOOD条件を予測できない。
この問題を軽減するため,世界モデルに基づく強化学習エージェントにおけるノイズの影響を低減するために,世界モデル固有のサプライズ尺度を活用するアルゴリズムを開発した。
複数故障センサや単一故障センサの設定に対してロバスト性を実現するために,複数表現と単一表現の両方の拒否サンプリングを導入する。
ノイズの導入はエージェントの性能を低下させるのが一般的であるが,我々の手法は,自律走行シミュレーション領域(CARLA,Safety Gymnasium)内の複数の環境にまたがる様々な種類のノイズのレベルにおいて,ベースラインに対する性能を保っていることを示す。
さらに,本手法により,コスモスとドリーマーV3という,異なる基礎構造を持つ2つの最先端世界モデルの安定性が向上することが実証された。
これらの結果は、世界モデリング領域における我々のアプローチの堅牢性を強調している。
コードについてはhttps://github.com/Bluefin-Tuna/WISERで公開しています。
関連論文リスト
- STORI: A Benchmark and Taxonomy for Stochastic Environments [2.8825582215429186]
Reinforcement Learning (RL)技術は、Atari100kのようなシミュレーションベンチマークで素晴らしいパフォーマンスを達成した。
現実のシステムはノイズの多い観測、予測不可能な力学、非定常状態を含むため、中心的な障害は環境性である。
本稿では,環境の包括的5種類の分類法を提案し,最先端のモデルベースRLアルゴリズムの系統的脆弱性を実証する。
論文 参考訳(メタデータ) (2025-09-01T21:43:22Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文 参考訳(メタデータ) (2025-04-06T20:35:44Z) - From Perfect to Noisy World Simulation: Customizable Embodied Multi-modal Perturbations for SLAM Robustness Benchmarking [32.52171076424419]
エンボディードエージェントは、非構造環境で運用するために堅牢なナビゲーションシステムを必要とする。
ノイズの多いデータ合成のための,新しい,カスタマイズ可能なパイプラインを提案する。
我々はニューラル(NeRF)モデルと非ニューラルSLAMモデルの両方の障害に対する感受性を明らかにする。
論文 参考訳(メタデータ) (2024-06-24T17:57:05Z) - Advancing the Robustness of Large Language Models through Self-Denoised Smoothing [50.54276872204319]
大規模言語モデル(LLM)は大きな成功を収めたが、敵の摂動に対する脆弱性は大きな懸念を引き起こしている。
本稿では,LLMのマルチタスク特性を活用して,まずノイズの入力を識別し,次にこれらの復号化バージョンに基づいて予測を行う。
LLMのロバスト性を高めるために個別のモデルを訓練する必要がある従来のコンピュータビジョンのスムース化技術とは異なり、本手法は効率と柔軟性を著しく向上させる。
論文 参考訳(メタデータ) (2024-04-18T15:47:00Z) - Customizable Perturbation Synthesis for Robust SLAM Benchmarking [33.74471840597803]
ノイズの多いデータ合成のための,新しい,カスタマイズ可能なパイプラインを提案する。
このパイプラインには、カスタマイズ可能なハードウェアセットアップ、ソフトウェアコンポーネント、摂動環境が含まれている。
多様な摂動型を含むRobust-SLAMベンチマークをインスタンス化し、既存の高度SLAMモデルのリスク許容性を評価する。
論文 参考訳(メタデータ) (2024-02-12T23:49:40Z) - Realistic Noise Synthesis with Diffusion Models [44.404059914652194]
ディープラーニングモデルには、大規模な実世界のトレーニングデータが必要です。
本稿では,これらの課題に対処するために拡散モデルを用いた新しい実音合成拡散器(RNSD)法を提案する。
論文 参考訳(メタデータ) (2023-05-23T12:56:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。