Fugu-MT 論文翻訳(概要): View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis

論文の概要: View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis

arxiv url: http://arxiv.org/abs/2406.18012v3
Date: Mon, 19 May 2025 18:23:14 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-21 14:49:51.144038
Title: View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis
Title（参考訳）: 適応的なビュー合成を用いた多目的シーンにおけるビュー不変の画素異常検出
Authors: Subin Varghese, Vedhus Hoskere,
Abstract要約: 我々は、教師なし、画素ワイドな異常位置検出のタスクとして、シーン異常検出(Scene Anomaly Detection, Scene AD)を導入し、フォーマル化する。 ToyCityは,最初のマルチオブジェクト・マルチビューリアルタイム画像データセットである。実験の結果,OmniADは拡張ビューで使用すると,逆蒸留よりも64.33%の画素幅(F_1)のスコアが増大することがわかった。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The built environment, encompassing critical infrastructure such as bridges and buildings, requires diligent monitoring of unexpected anomalies or deviations from a normal state in captured imagery. Anomaly detection methods could aid in automating this task; however, deploying anomaly detection effectively in such environments presents significant challenges that have not been evaluated before. These challenges include camera viewpoints that vary, the presence of multiple objects within a scene, and the absence of labeled anomaly data for training. To address these comprehensively, we introduce and formalize Scene Anomaly Detection (Scene AD) as the task of unsupervised, pixel-wise anomaly localization under these specific real-world conditions. Evaluating progress in Scene AD required the development of ToyCity, the first multi-object, multi-view real-image dataset, for unsupervised anomaly detection. Our initial evaluations using ToyCity revealed that established anomaly detection baselines struggle to achieve robust pixel-level localization. To address this, two data augmentation strategies were created to generate additional synthetic images of non-anomalous regions to enhance generalizability. However, the addition of these synthetic images alone only provided minor improvements. Thus, OmniAD, a refinement of the Reverse Distillation methodology, was created to establish a stronger baseline. Our experiments demonstrate that OmniAD, when used with augmented views, yields a 64.33\% increase in pixel-wise $F_1$ score over Reverse Distillation with no augmentation. Collectively, this work offers the Scene AD task definition, the ToyCity benchmark, the view synthesis augmentation approaches, and the OmniAD method. Project Page: https://drags99.github.io/OmniAD/
Abstract（参考訳）: 橋や建物などの重要なインフラを含む構築された環境は、撮像された画像の通常の状態からの予期せぬ異常や逸脱を厳格に監視する必要がある。異常検出手法は、このタスクの自動化に役立つが、そのような環境に効果的に異常検出をデプロイすることは、これまで評価されていない重要な課題である。これらの課題には、異なるカメラ視点、シーン内の複数のオブジェクトの存在、トレーニングのためのラベル付き異常データがないことが含まれる。これらに包括的に対処するために,実世界の特定の条件下での,教師なし,画素ワイドな局所化のタスクとして,シーン異常検出(Scene Anomaly Detection, Scene AD)を導入し,形式化する。 Scene ADの進歩を評価するには、教師なしの異常検出のための最初のマルチオブジェクト・マルチビューリアルタイムデータセットであるToyCityの開発が必要だった。 ToyCity を用いた初期評価の結果,確立された異常検出ベースラインは,画素レベルのロバストなローカライゼーションの実現に苦慮していることが明らかとなった。これを解決するために、2つのデータ拡張戦略が作成され、非アノマラス領域の合成画像が生成され、一般化性が向上した。しかし、これらの合成画像の追加だけではわずかな改善しか得られなかった。したがって、逆蒸留法の改良であるOmniADは、より強力なベースラインを確立するために作られた。実験の結果,OmniADは拡張ビューで使用すると,逆蒸留よりも64.33倍のピクセル長が増加することがわかった。まとめると、この作業はScene ADタスク定義、ToyCityベンチマーク、ビュー合成拡張アプローチ、OmniADメソッドを提供する。 Project Page: https://drags99.github.io/OmniAD/

関連論文リスト

Track Any Anomalous Object: A Granular Video Anomaly Detection Pipeline [63.96226274616927]
Track Any Anomalous Object (TAO)と呼ばれる新しいフレームワークでは、詳細なビデオ異常検出パイプラインが導入されている。各画素に異常スコアを割り当てる手法とは異なり、我々の手法は問題から異常オブジェクトの画素レベルの追跡に変換する。実験の結果、TAOは新しいベンチマークを精度と堅牢性で設定した。
論文参考訳（メタデータ） (2025-06-05T15:49:39Z)
Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.01456182499486]
textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。 textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文参考訳（メタデータ） (2025-04-16T09:57:23Z)
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文参考訳（メタデータ） (2025-04-15T10:42:25Z)
A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文参考訳（メタデータ） (2025-03-28T10:31:01Z)
BOOTPLACE: Bootstrapped Object Placement with Detection Transformers [23.300369070771836]
本稿では,オブジェクト配置を位置検出問題として定式化する新しいパラダイムであるBOOTPLACEを紹介する。確立されたベンチマークの実験結果は、BOOTPLACEのオブジェクト再配置における優れた性能を示している。
論文参考訳（メタデータ） (2025-03-27T21:21:20Z)
AnomalyCD: A benchmark for Earth anomaly change detection with high-resolution and time-series observations [12.35831157851407]
AnomalyCD技術は、過去の正常な変化パターンから学習することで、異常な変化を特定することを学ぶ。 AnomalyCDMは効率を高めるための2段階のワークフローとして設計されており、見えない画像を直接処理することができる。
論文参考訳（メタデータ） (2024-09-09T14:47:57Z)
UMAD: University of Macau Anomaly Detection Benchmark Dataset [26.25955201927986]
本稿では,ロボットパトロールシナリオにおける参照による異常検出のための最初のベンチマークデータセットを紹介する。提案するベンチマークデータセットは,ロボットの正確な位置推定に基づいて,各クエリ画像が対応する参照を見つけることができるよう精査されている。提案するベンチマークデータセットに加えて,このデータセットに基づいてADrのベースラインモデルを評価する。
論文参考訳（メタデータ） (2024-08-22T16:32:19Z)
Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文参考訳（メタデータ） (2024-08-12T03:31:29Z)
Towards Open-World Object-based Anomaly Detection via Self-Supervised Outlier Synthesis [15.748043194987075]
この研究は、オープンワールドオブジェクト検出器とOoD検出器を仮想外周で活用することでギャップを埋めることを目的としている。提案手法では,オブジェクト検出アーキテクチャ全体を拡張して,クラスラベルに依存することなく,異常に認識された特徴表現を学習する。提案手法は,オブジェクトレベルの異常検出における最先端性能を確立し,自然画像の平均リコールスコアを5.4%以上向上させる。
論文参考訳（メタデータ） (2024-07-22T16:16:38Z)
GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文参考訳（メタデータ） (2024-07-17T09:27:41Z)
ATAC-Net: Zoomed view works better for Anomaly Detection [1.024113475677323]
ATAC-Netは、既知の最小限の事前異常から異常を検出する訓練を行うフレームワークである。我々は、その優位性を、同等の設定で現在の最先端技術と比較する。
論文参考訳（メタデータ） (2024-06-20T15:18:32Z)
RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection [4.231702796492545]
本研究では,自由なビュー,不均一な照度,ぼやけたコレクションを備えたロバスト異常検出データセットを提案する。 RADは、ワーキングプラットフォーム上の異物を異常として識別することを目的としている。 RADを用いた非教師ありゼロショット法11点の評価と解析を行った。
論文参考訳（メタデータ） (2024-06-11T11:39:44Z)
Anomaly Detection by Context Contrasting [57.695202846009714]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。近年の自己教師型学習の進歩は、この点において大きな可能性を秘めている。我々はコンテキスト拡張を通じて学習するCon$を提案する。
論文参考訳（メタデータ） (2024-05-29T07:59:06Z)
DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。 MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-12-11T18:38:28Z)
Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文参考訳（メタデータ） (2023-11-27T13:14:06Z)
That's BAD: Blind Anomaly Detection by Implicit Local Feature Clustering [28.296651124677556]
ブラインド異常検出(BAD)の設定は、局所的な異常検出問題に変換することができる。画像および画素レベルの異常を正確に検出できるPatchClusterという新しい手法を提案する。実験結果から、PatchClusterは通常のデータを知ることなく、有望なパフォーマンスを示すことがわかった。
論文参考訳（メタデータ） (2023-07-06T18:17:43Z)
Unsupervised Visual Defect Detection with Score-Based Generative Model [17.610722842950555]
我々は、教師なしの視覚的欠陥検出とローカライゼーションタスクに焦点をあてる。近年のスコアベース生成モデルに基づく新しいフレームワークを提案する。提案手法を複数のデータセット上で評価し,その有効性を実証する。
論文参考訳（メタデータ） (2022-11-29T11:06:29Z)
Self-Calibrating Anomaly and Change Detection for Autonomous Inspection Robots [0.07366405857677225]
視覚異常または変化検出アルゴリズムは、参照画像やデータセットとは異なる画像の領域を特定する。本研究では,事前の未知環境における異常や変化を検出するための総合的なディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2022-08-26T09:52:12Z)
Self-Supervised Predictive Convolutional Attentive Block for Anomaly Detection [97.93062818228015]
本稿では,再建に基づく機能を,新たな自己監督型予測アーキテクチャビルディングブロックに統合することを提案する。我々のブロックは、受容領域におけるマスク領域に対する再構成誤差を最小限に抑える損失を備える。画像やビデオの異常検出のための最先端フレームワークに組み込むことで,ブロックの汎用性を実証する。
論文参考訳（メタデータ） (2021-11-17T13:30:31Z)
CutPaste: Self-Supervised Learning for Anomaly Detection and Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。 MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文参考訳（メタデータ） (2021-04-08T19:04:55Z)
Unsupervised Two-Stage Anomaly Detection [18.045265572566276]
単一の画像からの異常検出は、異常データが常に稀で、予測不能な型を持つ可能性があるため、難しい。本研究では,高忠実かつ異常のない再構成を生成する2段階アプローチを提案する。提案手法は,4つの異常検出データセットの最先端性能を上回っている。
論文参考訳（メタデータ） (2021-03-22T08:57:27Z)
A Background-Agnostic Framework with Adversarial Training for Abnormal Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文参考訳（メタデータ） (2020-08-27T18:39:24Z)
OIAD: One-for-all Image Anomaly Detection with Disentanglement Learning [23.48763375455514]
クリーンサンプルのみを用いたアンタングル学習に基づく一対一画像異常検出システムを提案する。 3つのデータセットを用いて実験したところ、OIADは90%以上の異常を検出できる一方で、誤報率も低く抑えられることがわかった。
論文参考訳（メタデータ） (2020-01-18T09:57:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。