論文の概要: The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift
- arxiv url: http://arxiv.org/abs/2603.08455v1
- Date: Mon, 09 Mar 2026 14:51:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:16.213594
- Title: The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift
- Title(参考訳): 沸騰するフロッグ閾値--重力ドリフト下の世界モデルによる異常検出における臨界度と盲点-
- Authors: Zhe Hong,
- Abstract要約: 4つのMuJoCo環境における連続観測ドリフト下での世界モデルに基づく自己監視について検討した。
我々は、鋭い検出しきい値$varepsilon*$が普遍的に存在することを発見した。
我々の結果は、創発的な世界モデル特性から、ノイズフロア、検出器、環境力学の間の3方向の相互作用へと、$varepsilon*$を再設定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When an RL agent's observations are gradually corrupted, at what drift rate does it "wake up" -- and what determines this boundary? We study world model-based self-monitoring under continuous observation drift across four MuJoCo environments, three detector families (z-score, variance, percentile), and three model capacities. We find that (1) a sharp detection threshold $\varepsilon^*$ exists universally: below it, drift is absorbed as normal variation; above it, detection occurs rapidly. The threshold's existence and sigmoid shape are invariant across all detector families and model capacities, though its position depends on the interaction between detector sensitivity, noise floor structure, and environment dynamics. (2) Sinusoidal drift is completely undetectable by all detector families -- including variance and percentile detectors with no temporal smoothing -- establishing this as a world model property rather than a detector artifact. (3) Within each environment, $\varepsilon^*$ follows a power law in detector parameters ($R^2 = 0.89$-$0.97$), but cross-environment prediction fails ($R^2 = 0.45$), revealing that the missing variable is environment-specific dynamics structure $\partial \mathrm{PE}/\partial\varepsilon$. (4) In fragile environments, agents collapse before any detector can fire ("collapse before awareness"), creating a fundamentally unmonitorable failure mode. Our results reframe $\varepsilon^*$ from an emergent world model property to a three-way interaction between noise floor, detector, and environment dynamics, providing a more defensible and empirically grounded account of self-monitoring boundaries in RL agents.
- Abstract(参考訳): RLエージェントの観測が徐々に悪化すると、どのドリフト速度で「起き上がった」のか?
本研究では,4つのMuJoCo環境,3つの検出器ファミリー(zスコア,分散,パーセンタイル),3つのモデル容量の連続観測ドリフト下での世界モデルに基づく自己監視について検討した。
1) 鋭い検出しきい値$\varepsilon^*$は普遍的に存在し, ドリフトは正常な変動として吸収される。
しきい値の存在とシグモイド形状は、検出器の感度、ノイズフロア構造、環境力学の相互作用に依存するが、全ての検出器ファミリーとモデル容量で不変である。
2) 正弦波のドリフトは、時間的スムージングのない分散やパーセンタイル検出器を含む全ての検出器群によって完全に検出不可能であり、検出器アーティファクトではなく世界モデル特性として確立されている。
(3) 各環境において、$\varepsilon^*$は、検出器パラメータ(R^2 = 0.89$-0.97$)のパワー則に従うが、クロス環境予測が失敗する(R^2 = 0.45$)。
(4) 脆弱な環境では、検知器が点火する前にエージェントが崩壊する(「認識前の崩壊」)。
我々の結果は、創発的世界モデル特性からノイズフロア、検出器、環境力学の3方向相互作用に再配置し、RLエージェントの自己監視境界のより防御的で経験的な根拠を与える。
関連論文リスト
- UniSTOK: Uniform Inductive Spatio-Temporal Kriging [18.058350565240637]
本稿では,観察不足下でのインダクティブ・クリグ・バックボーンを向上するプラグイン・アンド・プレイ・フレームワークを提案する。
我々のフレームワークは、元の観測結果と、欠落したエントリのみにプロキシシグナルを合成するジグソー a-augmented とからなるデュアルブランチ入力を形成する。
さまざまなパターンが欠如している複数の実世界のデータセットの実験は、大幅な改善を示している。
論文 参考訳(メタデータ) (2026-03-05T15:42:03Z) - Rethinking Cross-Generator Image Forgery Detection through DINOv3 [62.80415066351157]
クロスジェネレータ検出は、新しい挑戦フォージェネレータモデルとして登場した。
凍結した視覚基盤モデル、特にDINOv3は、既に強力なクロスジェネレータ検出能力を持っていることを示す。
トレーニング不要なトークンランク戦略を導入し、続いて軽量な線形プローブを用いて、認証関連トークンの小さなサブセットを選択する。
論文 参考訳(メタデータ) (2025-11-27T14:01:50Z) - Continuous subsurface property retrieval from sparse radar observations using physics informed neural networks [0.3580891736370874]
本研究では, 地下誘電率を, 深さの完全なニューラルかつ連続的な関数として再構成する機械学習フレームワークを提案する。
このアプローチは境界駆動から連続特性推定への地下反転を再構成し、滑らかな誘電率変動の正確なキャラクタリゼーションを可能にする。
論文 参考訳(メタデータ) (2025-10-29T16:09:24Z) - Federated Spatiotemporal Graph Learning for Passive Attack Detection in Smart Grids [2.721477719641864]
本稿では,時間的ウィンドウ上で物理層と行動指標を融合させて受動的攻撃を検出するグラフ中心型マルチモーダル検出器を提案する。
テスト精度は98.32%、シーケンス毎の93.35%を0.15% FPRで達成している。
論文 参考訳(メタデータ) (2025-09-29T08:52:30Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Recurrent Transformer U-Net Surrogate for Flow Modeling and Data Assimilation in Subsurface Formations with Faults [0.0]
本研究では, 実断層下帯水層における圧力およびCO2飽和度を予測するために, 再帰型変圧器U-Netサロゲートモデルを開発した。
このジオモデルには、ターゲット帯水層(超臨界二酸化炭素が注入される場所)、周辺地域、キャップロック、2つの広範な断層、2つのオーバーライド帯水層が含まれる。
論文 参考訳(メタデータ) (2025-08-15T18:56:45Z) - Evaluating ML Robustness in GNSS Interference Classification, Characterization & Localization [42.14439854721613]
ジャミング装置はグローバルナビゲーション衛星システム(GNSS)からの信号を妨害する
本稿では、低周波アンテナから得られたスナップショットからなる広範囲なデータセットを提案する。
本研究の目的は,機械学習モデル(ML)の環境変化に対するレジリエンスを評価することである。
論文 参考訳(メタデータ) (2024-09-23T15:20:33Z) - Ancilla quantum measurements on interacting chains: Sensitivity of entanglement dynamics to the type and concentration of detectors [46.76612530830571]
我々は、自由度(検出器')に結合した量子多体格子系を考える。
鎖内の密度と絡み合いエントロピーのダイナミクスを、$rho_a$と$M$の様々な値で探求する。
論文 参考訳(メタデータ) (2023-11-21T21:41:11Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Attribute-Guided Adversarial Training for Robustness to Natural
Perturbations [64.35805267250682]
本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。
我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文 参考訳(メタデータ) (2020-12-03T10:17:30Z) - Detecting Rewards Deterioration in Episodic Reinforcement Learning [63.49923393311052]
多くのRLアプリケーションでは、トレーニングが終了すると、エージェント性能の劣化をできるだけ早く検出することが不可欠である。
我々は,各エピソードにおける報酬が独立でもなく,同一に分散した,マルコフでもない,エピソード的枠組みを考察する。
平均シフトは、時間信号の劣化(報酬など)に対応する方法で定義し、最適な統計的パワーでこの問題の試行を導出する。
論文 参考訳(メタデータ) (2020-10-22T12:45:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。