論文の概要: RoBiS: Robust Binary Segmentation for High-Resolution Industrial Images
- arxiv url: http://arxiv.org/abs/2505.21152v1
- Date: Tue, 27 May 2025 13:04:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.659577
- Title: RoBiS: Robust Binary Segmentation for High-Resolution Industrial Images
- Title(参考訳): RoBiS:高解像度産業画像のためのロバストバイナリセグメンテーション
- Authors: Xurui Li, Zhonesheng Jiang, Tingxuan Ai, Yu Zhou,
- Abstract要約: 現実シナリオにおける教師なし異常検出は重要な課題である。
現在の方法はMVTec AD 2ベンチマークで大幅に性能が低下している。
3つのコアモジュールからなる堅牢なフレームワークRoBiSを提案する。
- 参考スコア(独自算出の注目度): 3.226330965024265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robust unsupervised anomaly detection (AD) in real-world scenarios is an important task. Current methods exhibit severe performance degradation on the MVTec AD 2 benchmark due to its complex real-world challenges. To solve this problem, we propose a robust framework RoBiS, which consists of three core modules: (1) Swin-Cropping, a high-resolution image pre-processing strategy to preserve the information of small anomalies through overlapping window cropping. (2) The data augmentation of noise addition and lighting simulation is carried out on the training data to improve the robustness of AD model. We use INP-Former as our baseline, which could generate better results on the various sub-images. (3) The traditional statistical-based binarization strategy (mean+3std) is combined with our previous work, MEBin (published in CVPR2025), for joint adaptive binarization. Then, SAM is further employed to refine the segmentation results. Compared with some methods reported by the MVTec AD 2, our RoBiS achieves a 29.2% SegF1 improvement (from 21.8% to 51.00%) on Test_private and 29.82% SegF1 gains (from 16.7% to 46.52%) on Test_private_mixed. Code is available at https://github.com/xrli-U/RoBiS.
- Abstract(参考訳): 現実シナリオにおけるロバストな教師なし異常検出(AD)は重要な課題である。
現在の方法では、MVTec AD 2ベンチマークで、複雑な実世界の課題のために大幅に性能が低下している。
この問題を解決するために,(1)スウィンクロップ(Swin-Cropping)という,小さな異常情報を重なり合うウィンドウトリミングによって保存する高解像度画像前処理戦略の3つのコアモジュールからなるロビSを提案する。
2)ADモデルのロバスト性を向上させるため,トレーニングデータに雑音付加と照明シミュレーションのデータ強化を行う。
InP-Formerをベースラインとして使用しています。
3) 従来の統計に基づく二項化戦略 (平均+3std) と, 共同適応二項化のためのMEBin (CVPR2025) を併用した。
そして、さらにSAMを使用してセグメンテーション結果を洗練する。
MVTec AD 2で報告されたいくつかの手法と比較して、我々のRoBiSはTest_privateで29.2%(21.8%から51.00%)、Test_private_mixedで29.82%(16.7%から46.52%)の改善を実現している。
コードはhttps://github.com/xrli-U/RoBiS.comで入手できる。
関連論文リスト
- SuperAD: A Training-free Anomaly Classification and Segmentation Method for CVPR 2025 VAND 3.0 Workshop Challenge Track 1: Adapt & Detect [17.160007050126403]
SuperADと命名されたDINOv2モデルを用いて特徴抽出に基づく完全トレーニング不要な異常検出とセグメンテーション手法を提案する。
本手法は,MVTec AD 2データセットの両テストセットの競合性を実現する。
論文 参考訳(メタデータ) (2025-05-26T09:29:27Z) - Evaluating and Enhancing Segmentation Model Robustness with Metamorphic Testing [10.564949684320727]
SegRMTは、遺伝的アルゴリズムを利用して空間変換とスペクトル変換のシーケンスを最適化するテスト手法である。
実験の結果、SegRMTはDeepLabV3のmIoU(Intersection over Union)を6.4%に削減した。
敵の訓練に使用する場合、SegRMTはモデルのパフォーマンスを向上し、mIoUの改善を最大73%向上させる。
論文 参考訳(メタデータ) (2025-04-03T07:15:45Z) - Foundation Models for Structural Health Monitoring [17.37816294594306]
本稿では,トランスフォーマーニューラルネットワークをMasked Auto-Encoderアーキテクチャを用いて,構造的健康モニタリングのための基礎モデルとして初めて利用することを提案する。
自己教師付き事前学習を通じて、複数の大規模データセットから一般化可能な表現を学習する能力を実証する。
本研究は,3つの運用用インダクトのデータを用いた基礎モデルの有効性を示す。
論文 参考訳(メタデータ) (2024-04-03T13:32:44Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation
via Point-Guided Mask Representation [61.027468209465354]
本稿では,ポイントラベル付き弱半教師付きインスタンスセグメンテーション(WSSIS)という新しい学習手法を提案する。
本稿では、予算に優しいポイントラベルを強力な弱監督源として効果的に活用できるWSSISの手法を提案する。
我々はCOCOとBDD100Kデータセットの広範な実験を行い、提案手法は完全な教師付きモデルのデータセットに匹敵する有望な結果を得る。
論文 参考訳(メタデータ) (2023-03-27T10:11:22Z) - Modality-Aware Triplet Hard Mining for Zero-shot Sketch-Based Image
Retrieval [51.42470171051007]
本稿では,ZES-SBIR(Zero-Shot Sketch-Based Image Retrieval)問題に,クロスモダリティメトリック学習の観点から取り組む。
DMLにおける2つの基本的な学習手法、例えば分類訓練とペアトレーニングを組み合わせることで、ZS-SBIRの強力なベースラインを構築した。
モータリティ・アウェア・トリプルト・ハード・マイニング(MATHM)は3種類のペア・ラーニングによってベースラインを向上することを示す。
論文 参考訳(メタデータ) (2021-12-15T08:36:44Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Boosting Randomized Smoothing with Variance Reduced Classifiers [4.110108749051657]
ランダム化平滑化(Randomized Smoothing, RS)のベースモデルとして, アンサンブルが特に適した選択である理由を考察する。
我々は、この選択を実証的に確認し、複数の設定でアート結果の状態を取得する。
論文 参考訳(メタデータ) (2021-06-13T08:40:27Z) - ADAHESSIAN: An Adaptive Second Order Optimizer for Machine Learning [91.13797346047984]
本稿では,2次最適化アルゴリズムであるADAHESSIANを紹介する。
ADAHESSIANは、他の適応最適化手法と比較して、新しい最先端の成果を大きなマージンで達成することを示す。
論文 参考訳(メタデータ) (2020-06-01T05:00:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。