論文の概要: Semantic-Deviation-Anchored Multi-Branch Fusion for Unsupervised Anomaly Detection and Localization in Unstructured Conveyor-Belt Coal Scenes
- arxiv url: http://arxiv.org/abs/2602.07694v1
- Date: Sat, 07 Feb 2026 20:36:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.761139
- Title: Semantic-Deviation-Anchored Multi-Branch Fusion for Unsupervised Anomaly Detection and Localization in Unstructured Conveyor-Belt Coal Scenes
- Title(参考訳): セマンティック・デビテーション・アンコレート多枝融合による非構造コンベヤ・ベルト石炭シーンの異常検出と位置推定
- Authors: Wenping Jin, Yuyang Tang, Li Zhu,
- Abstract要約: textbfCoalADは、石炭ストリームシーンにおける画素レベルのローカライゼーションによる教師なし異物異常検出のためのベンチマークである。
本稿では,3つの視点から補完的異常証拠を抽出・融合する補完的共同認識フレームワークを提案する。
CoalADの実験では、評価画像レベルと画素レベルのメトリクスで、我々の手法が広く使用されているベースラインよりも優れていることが示された。
- 参考スコア(独自算出の注目度): 6.184948083111668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable foreign-object anomaly detection and pixel-level localization in conveyor-belt coal scenes are essential for safe and intelligent mining operations. This task is particularly challenging due to the highly unstructured environment: coal and gangue are randomly piled, backgrounds are complex and variable, and foreign objects often exhibit low contrast, deformation, occlusion, resulting in coupling with their surroundings. These characteristics weaken the stability and regularity assumptions that many anomaly detection methods rely on in structured industrial settings, leading to notable performance degradation. To support evaluation and comparison in this setting, we construct \textbf{CoalAD}, a benchmark for unsupervised foreign-object anomaly detection with pixel-level localization in coal-stream scenes. We further propose a complementary-cue collaborative perception framework that extracts and fuses complementary anomaly evidence from three perspectives: object-level semantic composition modeling, semantic-attribution-based global deviation analysis, and fine-grained texture matching. The fused outputs provide robust image-level anomaly scoring and accurate pixel-level localization. Experiments on CoalAD demonstrate that our method outperforms widely used baselines across the evaluated image-level and pixel-level metrics, and ablation studies validate the contribution of each component. The code is available at https://github.com/xjpp2016/USAD.
- Abstract(参考訳): コンベアベルト石炭の現場での信頼性の高い異物異常検出とピクセルレベルの局所化は、安全かつインテリジェントな鉱業運営に不可欠である。
石炭とガンゲはランダムに積み重ねられ、背景は複雑で変動し、異物はしばしば低コントラスト、変形、閉塞を示し、周囲と結合する。
これらの特徴は、多くの異常検出法が構造された工業環境に依存しているという安定性と規則性の仮定を弱め、顕著な性能劣化をもたらす。
この環境での評価と比較を支援するために,石炭ストリームシーンにおける画素レベルの局所化を用いた教師なし異物異常検出のベンチマークであるtextbf{CoalAD} を構築した。
さらに, オブジェクトレベルの意味合成モデリング, 意味属性に基づくグローバルな偏差解析, きめ細かいテクスチャマッチングという3つの視点から, 相補的異常証拠を抽出・融合する補完的共同認識フレームワークを提案する。
融合出力は、堅牢な画像レベルの異常スコアと正確なピクセルレベルのローカライゼーションを提供する。
CoalAD実験により, 評価画像レベルおよび画素レベルの指標において, 提案手法が広く用いられているベースラインよりも優れており, アブレーションによる各成分の寄与が検証された。
コードはhttps://github.com/xjpp2016/USAD.comで公開されている。
関連論文リスト
- UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。
既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。
高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文 参考訳(メタデータ) (2025-12-15T02:59:16Z) - CogStereo: Neural Stereo Matching with Implicit Spatial Cognition Embedding [5.663297699303346]
CogStereoは、データセット固有の前提に頼らずに、挑戦的な領域に対処する新しいフレームワークである。
CogStereoは、単眼深度特徴を先行として使用することにより、暗黙の空間認識を洗練プロセスに組み込む。
CogStereoは、画素ワイド不確実性と認識誘導特徴を組み合わせた二重条件改善機構を用いて、ミスマッチの一貫したグローバルな補正を行う。
論文 参考訳(メタデータ) (2025-10-25T02:09:04Z) - OoDDINO:A Multi-level Framework for Anomaly Segmentation on Complex Road Scenes [3.0743391441996684]
異常セグメンテーションは、画像内の異常なオブジェクトを識別することを目的としている。
既存のピクセルワイズ手法は、通常、個々の異常スコアを割り当て、グローバルなしきい値戦略を用いて異常を分割する。
OoDDINOは,これらの制約に対処するために設計された,新しいマルチレベル・アノマライ・セグメンテーション・フレームワークである。
論文 参考訳(メタデータ) (2025-07-02T08:15:11Z) - Noise Fusion-based Distillation Learning for Anomaly Detection in Complex Industrial Environments [27.72114466968709]
自動化工業製造における異常検出と局所化は、生産効率と製品品質を大幅に向上させる。
既存の方法では、事前に定義された撮像環境の欠陥を検出することができる。
本稿では,産業環境における異常検出と局所化のための新しい手法を提案する。
HetNetは、ローカル変更に関する限られた情報を使用して、通常のパターンの特徴をモデル化することを学ぶことができる。
論文 参考訳(メタデータ) (2025-06-19T06:08:47Z) - Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.01456182499486]
textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。
textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文 参考訳(メタデータ) (2025-04-16T09:57:23Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis [0.0]
我々は、教師なし、画素ワイドな異常位置検出のタスクとして、シーン異常検出(Scene Anomaly Detection, Scene AD)を導入し、フォーマル化する。
ToyCityは,最初のマルチオブジェクト・マルチビューリアルタイム画像データセットである。
実験の結果,OmniADは拡張ビューで使用すると,逆蒸留よりも64.33%の画素幅(F_1)のスコアが増大することがわかった。
論文 参考訳(メタデータ) (2024-06-26T01:54:10Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - PAIF: Perception-Aware Infrared-Visible Image Fusion for Attack-Tolerant
Semantic Segmentation [50.556961575275345]
対向シーンにおけるセグメンテーションの堅牢性を促進するための認識認識型融合フレームワークを提案する。
我々は,先進の競争相手に比べて15.3% mIOUの利得で,ロバスト性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2023-08-08T01:55:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。