論文の概要: Multi-Flow: Multi-View-Enriched Normalizing Flows for Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2504.03306v1
- Date: Fri, 04 Apr 2025 09:32:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-07 14:49:02.328072
- Title: Multi-Flow: Multi-View-Enriched Normalizing Flows for Industrial Anomaly Detection
- Title(参考訳): マルチフロー:産業異常検出のためのマルチビュー拡張正規化フロー
- Authors: Mathis Kruse, Bodo Rosenhahn,
- Abstract要約: 本稿では,新しいマルチビュー異常検出手法であるMulti-Flowを提案する。
異なるビューにまたがって情報を融合させることで、正確な推定精度を高める新しいマルチビューアーキテクチャを利用する。
実世界のマルチビューデータセットであるReal-IAD上で実証的に検証し,新たな最先端技術に到達した。
- 参考スコア(独自算出の注目度): 20.499874396491347
- License:
- Abstract: With more well-performing anomaly detection methods proposed, many of the single-view tasks have been solved to a relatively good degree. However, real-world production scenarios often involve complex industrial products, whose properties may not be fully captured by one single image. While normalizing flow based approaches already work well in single-camera scenarios, they currently do not make use of the priors in multi-view data. We aim to bridge this gap by using these flow-based models as a strong foundation and propose Multi-Flow, a novel multi-view anomaly detection method. Multi-Flow makes use of a novel multi-view architecture, whose exact likelihood estimation is enhanced by fusing information across different views. For this, we propose a new cross-view message-passing scheme, letting information flow between neighboring views. We empirically validate it on the real-world multi-view data set Real-IAD and reach a new state-of-the-art, surpassing current baselines in both image-wise and sample-wise anomaly detection tasks.
- Abstract(参考訳): より優れた異常検出法が提案され、多くの単一ビュータスクが比較的良好な程度に解決された。
しかし、実世界の生産シナリオには複雑な工業製品が伴うことが多く、その特性は単一の画像で完全には捉えられない。
フローベースのアプローチの正規化は、シングルカメラシナリオですでにうまく機能しているが、現時点では、マルチビューデータに先例を使用していない。
我々は,これらのフローベースモデルを強力な基盤として利用することで,このギャップを埋めることを目指しており,新しい多視点異常検出手法であるMulti-Flowを提案する。
Multi-Flowは、異なるビューにまたがって情報を融合することによって、正確な推定精度を高める新しいマルチビューアーキテクチャを利用している。
そこで本研究では,近隣のビュー間の情報の流れを可視化するクロスビューメッセージパッシング手法を提案する。
実世界のマルチビューデータセットであるReal-IAD上で実証的に検証し、画像とサンプルの異常検出の両タスクにおいて、現在のベースラインを超え、新たな最先端に到達した。
関連論文リスト
- A Global Depth-Range-Free Multi-View Stereo Transformer Network with Pose Embedding [76.44979557843367]
本稿では,事前の深度範囲を排除した新しい多視点ステレオ(MVS)フレームワークを提案する。
長距離コンテキスト情報を集約するMDA(Multi-view Disparity Attention)モジュールを導入する。
ソース画像のエピポーラ線上のサンプリング点に対応する電流画素の品質を明示的に推定する。
論文 参考訳(メタデータ) (2024-11-04T08:50:16Z) - GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - Divide and Conquer: High-Resolution Industrial Anomaly Detection via Memory Efficient Tiled Ensemble [0.14999444543328289]
産業異常検出はコンピュータビジョンにおける重要な課題である。
多くの実世界のデータセットにおける異常領域の小さなサイズは、高解像度で画像を処理する必要がある。
入力画像をタイルのグリッドに分割し,各タイル位置の専用モデルをトレーニングすることにより,メモリ消費を低減するタイルアンサンブル方式を提案する。
論文 参考訳(メタデータ) (2024-03-07T22:39:02Z) - Credible Remote Sensing Scene Classification Using Evidential Fusion on
Aerial-Ground Dual-view Images [6.817740582240199]
マルチビュー(マルチソース、マルチモーダル、マルチパースペクティブなど)データはリモートセンシングタスクで頻繁に使用される。
データ品質の問題はさらに明確になり、マルチビューデータの潜在的なメリットが制限される。
深層学習は空中二視点リモートセンシングシーン分類の課題に導入される。
論文 参考訳(メタデータ) (2023-01-02T12:27:55Z) - Two-level Data Augmentation for Calibrated Multi-view Detection [51.5746691103591]
ビュー間のアライメントを保った新しいマルチビューデータ拡張パイプラインを導入する。
また,シーンレベルで直接適用された第2レベルの拡張を提案する。
単純なマルチビュー検出モデルと組み合わせることで、2レベル拡張パイプラインは既存のベースラインすべてより優れています。
論文 参考訳(メタデータ) (2022-10-19T17:55:13Z) - TSK Fuzzy System Towards Few Labeled Incomplete Multi-View Data
Classification [24.01191516774655]
これらの課題に対処するために,トランスダクティブ半教師付きマルチビューTSKファジィシステムモデリング法(SSIMV_TSK)を提案する。
提案手法は,未知のビュー計算,ラベルなしデータの擬似ラベル学習,ファジィシステムモデリングをひとつのプロセスに統合し,解釈可能なファジィルールを持つモデルを生成する。
実データを用いた実験の結果,提案手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-08T11:41:06Z) - Exploring Data Augmentation for Multi-Modality 3D Object Detection [82.9988604088494]
ポイントクラウドとイメージに基づくマルチモダリティメソッドは、ポイントクラウドのみを使用するアプローチよりも、わずかに良いか、時には悪いだけである。
トランスフォーメーションフローと呼ばれるパイプラインを提案し、トランスフォーメーションのリバースとリプレイによってシングルモードとマルチモードのデータ拡張のギャップを埋める。
また,本手法は第3回nuScenes検出チャレンジでPKL賞を受賞した。
論文 参考訳(メタデータ) (2020-12-23T15:23:16Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。