論文の概要: Multi-Flow: Multi-View-Enriched Normalizing Flows for Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2504.03306v1
- Date: Fri, 04 Apr 2025 09:32:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 17:59:40.385733
- Title: Multi-Flow: Multi-View-Enriched Normalizing Flows for Industrial Anomaly Detection
- Title(参考訳): マルチフロー:産業異常検出のためのマルチビュー拡張正規化フロー
- Authors: Mathis Kruse, Bodo Rosenhahn,
- Abstract要約: 本稿では,新しいマルチビュー異常検出手法であるMulti-Flowを提案する。
異なるビューにまたがって情報を融合させることで、正確な推定精度を高める新しいマルチビューアーキテクチャを利用する。
実世界のマルチビューデータセットであるReal-IAD上で実証的に検証し,新たな最先端技術に到達した。
- 参考スコア(独自算出の注目度): 20.499874396491347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With more well-performing anomaly detection methods proposed, many of the single-view tasks have been solved to a relatively good degree. However, real-world production scenarios often involve complex industrial products, whose properties may not be fully captured by one single image. While normalizing flow based approaches already work well in single-camera scenarios, they currently do not make use of the priors in multi-view data. We aim to bridge this gap by using these flow-based models as a strong foundation and propose Multi-Flow, a novel multi-view anomaly detection method. Multi-Flow makes use of a novel multi-view architecture, whose exact likelihood estimation is enhanced by fusing information across different views. For this, we propose a new cross-view message-passing scheme, letting information flow between neighboring views. We empirically validate it on the real-world multi-view data set Real-IAD and reach a new state-of-the-art, surpassing current baselines in both image-wise and sample-wise anomaly detection tasks.
- Abstract(参考訳): より優れた異常検出法が提案され、多くの単一ビュータスクが比較的良好な程度に解決された。
しかし、実世界の生産シナリオには複雑な工業製品が伴うことが多く、その特性は単一の画像で完全には捉えられない。
フローベースのアプローチの正規化は、シングルカメラシナリオですでにうまく機能しているが、現時点では、マルチビューデータに先例を使用していない。
我々は,これらのフローベースモデルを強力な基盤として利用することで,このギャップを埋めることを目指しており,新しい多視点異常検出手法であるMulti-Flowを提案する。
Multi-Flowは、異なるビューにまたがって情報を融合することによって、正確な推定精度を高める新しいマルチビューアーキテクチャを利用している。
そこで本研究では,近隣のビュー間の情報の流れを可視化するクロスビューメッセージパッシング手法を提案する。
実世界のマルチビューデータセットであるReal-IAD上で実証的に検証し、画像とサンプルの異常検出の両タスクにおいて、現在のベースラインを超え、新たな最先端に到達した。
関連論文リスト
- Learning Multi-view Multi-class Anomaly Detection [10.199404082194947]
MVMCAD(Multi-View Multi-Class Anomaly Detection Model)を導入し、複数のビューからの情報を統合して異常を正確に識別する。
具体的には、凍結エンコーダの前にプリエンコーダの事前拡張機構を追加する半凍結エンコーダを提案する。
AAM(Anomaly Amplification Module)は、グローバルトークンのインタラクションをモデル化し、通常のリージョンを抑圧する。
論文 参考訳(メタデータ) (2025-04-30T03:59:58Z) - Uncertainty-Aware Global-View Reconstruction for Multi-View Multi-Label Feature Selection [4.176139684578661]
グローバルビュー再構築の観点から構築した統一モデルを提案する。
信頼性を高めるため,再建過程におけるサンプルの不確かさの認識を取り入れた。
実験により,マルチビューデータセットにおける提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2025-03-18T08:35:39Z) - Multi-View Industrial Anomaly Detection with Epipolar Constrained Cross-View Fusion [15.819291772583393]
横方向核融合を導くために, エピポーラ幾何学制約付アテンションモジュールを導入する。
クロスビューアテンションの可能性をさらに高めるため,メモリバンクによる異常検出に触発された事前学習戦略を提案する。
我々のフレームワークは、最先端のマルチビュー異常検出データセットにおいて、既存の手法よりも優れていることを実証する。
論文 参考訳(メタデータ) (2025-03-14T05:02:54Z) - Robust Multi-View Learning via Representation Fusion of Sample-Level Attention and Alignment of Simulated Perturbation [61.64052577026623]
実世界のマルチビューデータセットは、しばしば不均一で不完全である。
本稿では,表現融合とアライメントを同時に行う新しいロバストMVL法(RML)を提案する。
実験では、教師なしマルチビュークラスタリング、ノイズラベル分類、およびクロスモーダルハッシュ検索のためのプラグ・アンド・プレイモジュールとして採用する。
論文 参考訳(メタデータ) (2025-03-06T07:01:08Z) - A Global Depth-Range-Free Multi-View Stereo Transformer Network with Pose Embedding [76.44979557843367]
本稿では,事前の深度範囲を排除した新しい多視点ステレオ(MVS)フレームワークを提案する。
長距離コンテキスト情報を集約するMDA(Multi-view Disparity Attention)モジュールを導入する。
ソース画像のエピポーラ線上のサンプリング点に対応する電流画素の品質を明示的に推定する。
論文 参考訳(メタデータ) (2024-11-04T08:50:16Z) - GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - Two-level Data Augmentation for Calibrated Multi-view Detection [51.5746691103591]
ビュー間のアライメントを保った新しいマルチビューデータ拡張パイプラインを導入する。
また,シーンレベルで直接適用された第2レベルの拡張を提案する。
単純なマルチビュー検出モデルと組み合わせることで、2レベル拡張パイプラインは既存のベースラインすべてより優れています。
論文 参考訳(メタデータ) (2022-10-19T17:55:13Z) - TSK Fuzzy System Towards Few Labeled Incomplete Multi-View Data
Classification [24.01191516774655]
これらの課題に対処するために,トランスダクティブ半教師付きマルチビューTSKファジィシステムモデリング法(SSIMV_TSK)を提案する。
提案手法は,未知のビュー計算,ラベルなしデータの擬似ラベル学習,ファジィシステムモデリングをひとつのプロセスに統合し,解釈可能なファジィルールを持つモデルを生成する。
実データを用いた実験の結果,提案手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-08T11:41:06Z) - Exploring Data Augmentation for Multi-Modality 3D Object Detection [82.9988604088494]
ポイントクラウドとイメージに基づくマルチモダリティメソッドは、ポイントクラウドのみを使用するアプローチよりも、わずかに良いか、時には悪いだけである。
トランスフォーメーションフローと呼ばれるパイプラインを提案し、トランスフォーメーションのリバースとリプレイによってシングルモードとマルチモードのデータ拡張のギャップを埋める。
また,本手法は第3回nuScenes検出チャレンジでPKL賞を受賞した。
論文 参考訳(メタデータ) (2020-12-23T15:23:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。