論文の概要: DEEDEE: Fast and Scalable Out-of-Distribution Dynamics Detection
- arxiv url: http://arxiv.org/abs/2510.21638v1
- Date: Fri, 24 Oct 2025 16:51:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.548662
- Title: DEEDEE: Fast and Scalable Out-of-Distribution Dynamics Detection
- Title(参考訳): DEEDEE: 高速でスケーラブルなアウト・オブ・ディストリビューション・ダイナミクス検出
- Authors: Tala Aljaafari, Varun Kanade, Philip Torr, Christian Schroeder de Witt,
- Abstract要約: DEEDEEは、表現量の多いパイプラインを最小限の選択肢で再検討する2つの統計検出器である。
従来のRL OODスイートと一致し、コンピュートを600倍削減する。
以上の結果から,RLトラジェクトリに多種多様な異常型が小さな低次統計値を用いて印字されることが示唆された。
- 参考スコア(独自算出の注目度): 25.971059146268487
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deploying reinforcement learning (RL) in safety-critical settings is constrained by brittleness under distribution shift. We study out-of-distribution (OOD) detection for RL time series and introduce DEEDEE, a two-statistic detector that revisits representation-heavy pipelines with a minimal alternative. DEEDEE uses only an episodewise mean and an RBF kernel similarity to a training summary, capturing complementary global and local deviations. Despite its simplicity, DEEDEE matches or surpasses contemporary detectors across standard RL OOD suites, delivering a 600-fold reduction in compute (FLOPs / wall-time) and an average 5% absolute accuracy gain over strong baselines. Conceptually, our results indicate that diverse anomaly types often imprint on RL trajectories through a small set of low-order statistics, suggesting a compact foundation for OOD detection in complex environments.
- Abstract(参考訳): 安全クリティカルな環境での強化学習(RL)の展開は、分散シフト時の脆性によって制限される。
本稿では,RL 時系列のアウト・オブ・ディストリビューション (OOD) 検出について検討し,最小限の選択肢で表現量の多いパイプラインを再検討する2つの統計検出器 DEEDEE を導入する。
DEEDEEは、エピソード平均とRBFカーネルをトレーニング概要に類似させ、補完的なグローバルとローカルの偏差を捉えている。
その単純さにもかかわらず、DEEDEEは標準のRL OODスイートにまたがって現代の検出器をマッチまたは超過し、600倍の計算(FLOPs / wall-time)と、強いベースラインよりも平均5%の絶対精度の向上をもたらす。
概念的には, 複雑な環境下でのOOD検出のコンパクトな基盤として, 様々な異常型が低次統計の小さなセットを通してRL軌道に印字されることが示唆された。
関連論文リスト
- Scalable, Explainable and Provably Robust Anomaly Detection with One-Step Flow Matching [14.503330877000758]
Time-Conditioned Contraction Matching is a novel method for semi-supervised anomaly detection in tabular data。
これは、確率分布間の速度場を学習する最近の生成モデリングフレームワークであるフローマッチングにインスパイアされている。
ADBenchベンチマークの大規模な実験により、TCCMは検出精度と推論コストのバランスが良好であることが示されている。
論文 参考訳(メタデータ) (2025-10-21T06:26:38Z) - SCOPED: Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion [5.008779702997125]
アウト・オブ・ディストリビューション(OOD)検出は、視覚、ロボット工学、強化学習などにおける機械学習システムの信頼性の高い展開に不可欠である。
SCOPED(Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion)を紹介する。
SCOPEDは、多様なデータセットでトレーニングされた単一の拡散モデルから計算され、モデルのスコア関数のジャコビアントレースと2乗ノルムを単一のテスト統計量に結合する。
4つのビジョンベンチマークでは、SCOPEDは計算コストの低いにもかかわらず、競合または最先端の精度リコールスコアを達成している。
論文 参考訳(メタデータ) (2025-10-01T20:54:49Z) - TinyDef-DETR: A Transformer-Based Framework for Defect Detection in Transmission Lines from UAV Imagery [12.48571944931548]
TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。
このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールで詳細保存可能なダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスにより、小さくて難しいオブジェクトのローカライゼーションが向上する。
論文 参考訳(メタデータ) (2025-09-07T12:36:33Z) - ResFlow: Fine-tuning Residual Optical Flow for Event-based High Temporal Resolution Motion Estimation [50.80115710105251]
イベントカメラは、高時間分解能(HTR)モーション推定に重要な可能性を秘めている。
イベントデータを用いてHTR光流を推定するための残差に基づくパラダイムを提案する。
論文 参考訳(メタデータ) (2024-12-12T09:35:47Z) - Single-Trajectory Distributionally Robust Reinforcement Learning [21.955807398493334]
本研究では,分散ロバストRL (DRRL) を提案する。
既存のDRRLアルゴリズムはモデルベースか、1つのサンプル軌道から学習できないかのいずれかである。
単一軌道を用いた分散ロバストQ-ラーニング(DRQ)と呼ばれる,完全モデルフリーなDRRLアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-01-27T14:08:09Z) - Causal Balancing for Domain Generalization [95.97046583437145]
そこで本研究では,観察されたトレーニング分布の領域特異的なスプリアス相関を低減するために,バランスの取れたミニバッチサンプリング戦略を提案する。
本研究では, 突発性源の同定可能性を保証するとともに, バランスの取れた, 突発性のない分布から, 提案手法が有効にサンプリング可能であることを示す。
論文 参考訳(メタデータ) (2022-06-10T17:59:11Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Collaborative Training between Region Proposal Localization and
Classification for Domain Adaptive Object Detection [121.28769542994664]
オブジェクト検出のためのドメイン適応は、ラベル付きデータセットからラベル付きデータセットへの検出を適応させようとする。
本稿では,地域提案ネットワーク (RPN) と地域提案分類器 (RPC) が,大きなドメインギャップに直面した場合の転送可能性が大きく異なることを初めて明らかにする。
論文 参考訳(メタデータ) (2020-09-17T07:39:52Z) - Log-Likelihood Ratio Minimizing Flows: Towards Robust and Quantifiable
Neural Distribution Alignment [52.02794488304448]
そこで本研究では,対数様比統計量と正規化フローに基づく新しい分布アライメント手法を提案する。
入力領域の局所構造を保存する領域アライメントにおいて,結果の最小化を実験的に検証する。
論文 参考訳(メタデータ) (2020-03-26T22:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。