論文の概要: Segment Any Anomaly without Training via Hybrid Prompt Regularization
- arxiv url: http://arxiv.org/abs/2305.10724v1
- Date: Thu, 18 May 2023 05:52:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 16:40:59.149804
- Title: Segment Any Anomaly without Training via Hybrid Prompt Regularization
- Title(参考訳): ハイブリッドプロンプト規則化によるトレーニング不要のセグメント
- Authors: Yunkang Cao, Xiaohao Xu, Chen Sun, Yuqi Cheng, Zongwei Du, Liang Gao,
Weiming Shen
- Abstract要約: ハイブリットプロンプト正規化を伴うゼロショット異常セグメンテーションのための新しいフレームワーク、すなわちセグメンツ・アノマリー+(SAA+)を提案する。
提案したSAA+モデルは,VasA,MVTec-AD,MTD,KSDD2など,いくつかの異常セグメンテーションベンチマークにおける最先端性能を実現する。
- 参考スコア(独自算出の注目度): 15.38935129648466
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We present a novel framework, i.e., Segment Any Anomaly + (SAA+), for
zero-shot anomaly segmentation with hybrid prompt regularization to improve the
adaptability of modern foundation models. Existing anomaly segmentation models
typically rely on domain-specific fine-tuning, limiting their generalization
across countless anomaly patterns. In this work, inspired by the great
zero-shot generalization ability of foundation models like Segment Anything, we
first explore their assembly to leverage diverse multi-modal prior knowledge
for anomaly localization. For non-parameter foundation model adaptation to
anomaly segmentation, we further introduce hybrid prompts derived from domain
expert knowledge and target image context as regularization. Our proposed SAA+
model achieves state-of-the-art performance on several anomaly segmentation
benchmarks, including VisA, MVTec-AD, MTD, and KSDD2, in the zero-shot setting.
We will release the code at
\href{https://github.com/caoyunkang/Segment-Any-Anomaly}{https://github.com/caoyunkang/Segment-Any-Anomaly}.
- Abstract(参考訳): 現代基礎モデルの適応性を向上させるために,ハイブリッドプロンプト正規化によるゼロショット異常分割のための新しいフレームワーク,すなわちセグメンツ・アノマリー+(SAA+)を提案する。
既存の異常セグメンテーションモデルは通常、ドメイン固有の微調整に依存し、無数の異常パターンの一般化を制限する。
本研究は,segment anythingのような基礎モデルの大きなゼロショット一般化能力に着想を得て,まずそれらの集合を探索し,異常局在に多様なマルチモーダル事前知識を活用した。
異常セグメンテーションへの非パラメータ基礎モデルの適用については、ドメインエキスパートの知識とターゲット画像コンテキストを正規化したハイブリッドプロンプトを導入する。
提案したSAA+モデルは,ゼロショット設定において,VasA,MVTec-AD,MTD,KSDD2を含むいくつかの異常セグメンテーションベンチマークの最先端性能を実現する。
コードは \href{https://github.com/caoyunkang/segment-any-anomaly}{https://github.com/caoyunkang/segment-any-anomaly} でリリースします。
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - The Non-Local Model Merging Problem: Permutation Symmetries and Variance Collapse [25.002218722102505]
モデルマージは、特定のタスクでトレーニングされた複数のエキスパートモデルの重みを、単一のマルチタスクモデルに効率的に結合することを目的としている。
この研究は、"非ローカル"マージのより困難なシナリオを探求する。
標準的なマージ技術は、この非局所的な環境で効果的に一般化できないことが多い。
本稿では,タスク毎のマージモデルの出力アクティベーションを再スケール・シフトするマルチタスク手法を提案する。
論文 参考訳(メタデータ) (2024-10-16T17:41:59Z) - Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.5901368256326]
医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。
DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-19T07:28:33Z) - Collaborating Foundation Models for Domain Generalized Semantic Segmentation [23.359941294938142]
ドメイン一般化セマンティック(DGSS)は、ラベル付きソースドメイン上でモデルをトレーニングする。
我々はDGSSにアプローチし、CLOUDS(Domain Generalized Semantic)のためのCoLlaborative FOUndationモデルの組立を提案する。
論文 参考訳(メタデータ) (2023-12-15T13:43:24Z) - UGainS: Uncertainty Guided Anomaly Instance Segmentation [80.12253291709673]
道路上の1つの予期せぬ物体が事故を引き起こしたり、怪我を負うことがある。
現在のアプローチでは、各ピクセルに異常スコアを割り当てることで、異常セグメンテーションに取り組む。
本稿では, 高精度な異常マスクを生成する手法を提案する。
論文 参考訳(メタデータ) (2023-08-03T20:55:37Z) - 2nd Place Winning Solution for the CVPR2023 Visual Anomaly and Novelty
Detection Challenge: Multimodal Prompting for Data-centric Anomaly Detection [10.682758791557436]
本稿では,CVPR2023 Visual Anomaly and Novelty Detection (VAND) の課題に対して,Segment Any Anomaly チームが勝利したソリューションを紹介した。
マルチモーダルプロンプトを用いたゼロショット異常セグメンテーションのための新しいフレームワーク、すなわちセグメンツ・アノマリー + (SAA$+$) を提案する。
CVPR2023 VANで勝利したソリューションのコードを公開します。
論文 参考訳(メタデータ) (2023-06-15T11:49:44Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - Posterior Differential Regularization with f-divergence for Improving
Model Robustness [95.05725916287376]
クリーン入力とノイズ入力のモデル後部差を規則化する手法に着目する。
後微分正則化を$f$-divergencesの族に一般化する。
実験の結果, 後方微分を$f$-divergenceで正規化することで, モデルロバスト性の向上が期待できることがわかった。
論文 参考訳(メタデータ) (2020-10-23T19:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。