論文の概要: Anomalies by Synthesis: Anomaly Detection using Generative Diffusion Models for Off-Road Navigation
- arxiv url: http://arxiv.org/abs/2505.22805v1
- Date: Wed, 28 May 2025 19:26:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.501522
- Title: Anomalies by Synthesis: Anomaly Detection using Generative Diffusion Models for Off-Road Navigation
- Title(参考訳): 合成による異常:オフロードナビゲーションのための生成拡散モデルを用いた異常検出
- Authors: Siddharth Ancha, Sunshine Jiang, Travis Manderson, Laura Brandt, Yilun Du, Philip R. Osteen, Nicholas Roy,
- Abstract要約: 画素ワイド異常検出のための解析・合成手法を提案する。
拡散モデルによりどの画像セグメントが修正されたかを分析するために,異常検出を定式化する。
私たちの編集技術は純粋にテスト時間であり、既存の基盤に統合することができます。
- 参考スコア(独自算出の注目度): 38.106905905633305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In order to navigate safely and reliably in off-road and unstructured environments, robots must detect anomalies that are out-of-distribution (OOD) with respect to the training data. We present an analysis-by-synthesis approach for pixel-wise anomaly detection without making any assumptions about the nature of OOD data. Given an input image, we use a generative diffusion model to synthesize an edited image that removes anomalies while keeping the remaining image unchanged. Then, we formulate anomaly detection as analyzing which image segments were modified by the diffusion model. We propose a novel inference approach for guided diffusion by analyzing the ideal guidance gradient and deriving a principled approximation that bootstraps the diffusion model to predict guidance gradients. Our editing technique is purely test-time that can be integrated into existing workflows without the need for retraining or fine-tuning. Finally, we use a combination of vision-language foundation models to compare pixels in a learned feature space and detect semantically meaningful edits, enabling accurate anomaly detection for off-road navigation. Project website: https://siddancha.github.io/anomalies-by-diffusion-synthesis/
- Abstract(参考訳): オフロードおよび非構造環境において安全かつ確実にナビゲートするためには、トレーニングデータに関して、アウト・オブ・ディストリビューション(OOD)である異常を検出する必要がある。
OODデータの性質を仮定することなく画素ワイド異常検出のための解析・合成手法を提案する。
入力画像が与えられた場合、生成拡散モデルを用いて、残像を一定に保ちながら異常を除去する編集画像を合成する。
次に,拡散モデルによりどの画像セグメントが修正されたかを分析するために,異常検出を定式化する。
理想的な誘導勾配を解析し、誘導勾配を予測するために拡散モデルをブートストラップする原理的近似を導出することにより、誘導拡散の新しい推論手法を提案する。
私たちの編集技術は純粋にテスト時間であり、トレーニングや微調整を必要とせずに既存のワークフローに統合できます。
最後に、視覚言語基礎モデルを組み合わせて学習した特徴空間の画素を比較し、意味的に意味のある編集を検知し、オフロードナビゲーションの正確な異常検出を可能にする。
プロジェクトウェブサイト:https://siddancha.github.io/anomalies-by-diffusion- synthesis/
関連論文リスト
- One-for-More: Continual Diffusion Model for Anomaly Detection [61.12622458367425]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。
われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。
本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-02-27T07:47:27Z) - Projection Regret: Reducing Background Bias for Novelty Detection via
Diffusion Models [72.07462371883501]
本研究では,非意味情報のバイアスを緩和する効率的な新規性検出手法であるemphProjection Regret(PR)を提案する。
PRは、テスト画像とその拡散ベースの投影の間の知覚距離を計算し、異常を検出する。
拡張実験により、PRは生成モデルに基づく新規性検出手法の先行技術よりも有意なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-12-05T09:44:47Z) - Learning a Cross-modality Anomaly Detector for Remote Sensing Imagery [21.444315419064882]
リモートセンシング異常検知器は、地球観測の潜在的な標的として、背景から逸脱する物体を見つけることができる。
現在の異常検出器は特定の背景分布を学習することを目的としており、訓練されたモデルは見えない画像に転送することはできない。
本研究では,異なる背景分布から一貫した偏差距離への学習目標変換を利用する。
論文 参考訳(メタデータ) (2023-10-11T14:07:05Z) - SatDM: Synthesizing Realistic Satellite Image with Semantic Layout
Conditioning using Diffusion Models [0.0]
Denoising Diffusion Probabilistic Models (DDPM) は意味的レイアウトから現実的なイメージを合成する上で大きな可能性を証明している。
本稿では,セマンティックマップを用いて高品質で多様な衛星画像を生成する条件付きDDPMモデルを提案する。
提案モデルの有効性は,本研究の文脈内で導入した詳細なラベル付きデータセットを用いて検証する。
論文 参考訳(メタデータ) (2023-09-28T19:39:13Z) - DIRE for Diffusion-Generated Image Detection [128.95822613047298]
拡散再構成誤り(DIRE)という新しい表現を提案する。
DIREは、予め訓練された拡散モデルにより、入力画像とその再構成画像間の誤差を測定する。
DIREは生成されたイメージと実際のイメージを区別するためのブリッジとして機能する、というヒントを提供する。
論文 参考訳(メタデータ) (2023-03-16T13:15:03Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Fast Unsupervised Brain Anomaly Detection and Segmentation with
Diffusion Models [1.6352599467675781]
脳画像における異常検出とセグメント分割のための拡散モデルに基づく手法を提案する。
拡散モデルは,2次元CTおよびMRIデータを用いた一連の実験において,自己回帰的アプローチと比較して競争性能が向上する。
論文 参考訳(メタデータ) (2022-06-07T17:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。