論文の概要: Hypergraph-Enhanced Training-Free and Language-Free Few-Shot Anomaly Detection
- arxiv url: http://arxiv.org/abs/2605.10628v1
- Date: Mon, 11 May 2026 14:20:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.888228
- Title: Hypergraph-Enhanced Training-Free and Language-Free Few-Shot Anomaly Detection
- Title(参考訳): Hypergraph-Enhanced Training-Free and Language-free Few-Shot Anomaly Detection
- Authors: Guohuan Xie, Xin He, Dingying Fan, Siqi Li, Yun Liu,
- Abstract要約: FSAD (Few-shot Anomaly Detection) は大きな進歩を遂げているが、既存の手法は依然として重大な課題に直面している。
トレーニングフリーで、言語フリーで、ドメイン間で堅牢な新しいFSADフレームワークであるHyperFSADを紹介します。
厳格なトレーニングフリーと言語フリーの設定の下で、HyperFSADは6つのデータセットで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 12.830809328012164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot anomaly detection (FSAD) has made significant strides, yet existing methods still face critical challenges: (i) dependence on task- or dataset-specific training/fine-tuning, (ii) reliance on language supervision or carefully hand-crafted prompts, and (iii) limited robustness across domains. In this paper, we introduce HyperFSAD, a novel FSAD framework that is training-free, language-free, and robust across domains, offering a powerful solution to these challenges. Built upon DINOv3 and a hypergraph-based inference mechanism, our approach performs inference without any task-specific optimization or text prompts, while remaining competitive. Specifically, we replace sensitive nearest-neighbor / top-$n$ matching with \textbf{Sparse Hyper Matching}: \textit{sparsemax} first selects the most relevant support patches, which are then aggregated into a \textit{hyperedge} as compact normal evidence to suppress background noise and distractors. We further introduce \textbf{Dual-Branch Image Scoring}, which fuses \emph{spatial anomaly evidence} from the patch-grid anomaly map with \emph{global semantic deviation} captured by support-aware CLS matching, yielding a robust image-level anomaly score in a strictly visual manner. Notably, all components of HyperFSAD are purely visual, eliminating the need for labor-intensive hand-crafted text prompts. Under the stringent training-free and language-free setting, HyperFSAD achieves state-of-the-art performance across six datasets spanning four industrial datasets (MVTecAD, VisA, MPDD, BTAD) and two medical datasets (RESC, BraTS).
- Abstract(参考訳): FSAD (Few-shot Anomaly Detection) は大きな進歩を遂げているが、既存の手法はまだ重要な課題に直面している。
(i)タスクやデータセット固有のトレーニング/ファインチューニングへの依存
二 言語監督又は慎重に手作りのプロンプトに依存して、
(三)ドメイン間の堅牢性に制限がある。
本稿では,トレーニングフリーで,言語フリーで,ドメイン間で堅牢な新しいFSADフレームワークであるHyperFSADを紹介し,これらの課題に対する強力な解決策を提供する。
DINOv3とハイパーグラフベースの推論機構を基盤として,タスク固有の最適化やテキストプロンプトを使わずに推論を行う。
具体的には、まず最も関連性の高いサポートパッチを選択し、その後、バックグラウンドノイズや障害を抑えるためのコンパクトな正規証拠として \textit{hyperedge} に集約する。
さらに, パッチグリッドの異常マップから, サポート対応のCLSマッチングで取得した \emph{global semantic deviation} を融合し, 厳密に視覚的に頑健な画像レベルの異常スコアを得る, \textbf{Dual-Branch Image Scoring} を導入する。
特に、HyperFSADのすべてのコンポーネントは純粋に視覚的であり、労働集約的な手作りのテキストプロンプトは不要である。
厳格なトレーニングフリーで言語フリーな設定の下で、HyperFSADは、4つの産業データセット(MVTecAD、VisA、MPDD、BTAD)と2つの医療データセット(RESC、BraTS)にまたがる6つのデータセットにわたる最先端のパフォーマンスを達成する。
関連論文リスト
- Generative Data Transformation: From Mixed to Unified Data [57.84692191369066]
textscTaesarはtextbftarget-textbfal textbfregenerationのためのEmphdata中心のフレームワークである。
ドメイン間のコンテキストを対象のシーケンスにエンコードすることで、複雑な融合アーキテクチャを使わずに、標準的なモデルで複雑な依存関係を学習することができる。
論文 参考訳(メタデータ) (2026-02-26T08:30:09Z) - AdaSpot: Spend Resolution Where It Matters for Precise Event Spotting [59.31340724915079]
イベントスポッティングは、スポーツ分析、ロボティクス、自律システムにおけるアプリケーションにとって重要なタスクである。
bfAdaSpotは厳格な評価基準の下で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-25T16:24:48Z) - Hyper-KGGen: A Skill-Driven Knowledge Extractor for High-Quality Knowledge Hypergraph Generation [63.4604143884703]
Hyper-KGGenは、スキル進化プロセスとして抽出を再構築する、スキル駆動のフレームワークである。
ドメインの専門知識をGlobal Skill Libraryに積極的に蒸留する、テキストタプティブなスキル獲得モジュールが組み込まれている。
文書レベルの知識ハイパーグラフ抽出のための厳密な注釈付きベンチマークである textbfHyperDocRED を提案する。
論文 参考訳(メタデータ) (2026-02-23T06:32:00Z) - DE3S: Dual-Enhanced Soft-Sparse-Shape Learning for Medical Early Time-Series Classification [11.539700200482853]
ETSCは敗血症などの時間に敏感な医療応用において重要である。
正確さとイヤーラインの間には、本質的にトレードオフがある。
我々はこれらの課題を克服するためのフレームワークである textbfDE3S を提案する。
論文 参考訳(メタデータ) (2025-10-14T07:10:05Z) - Constrained Prompt Enhancement for Improving Zero-Shot Generalization of Vision-Language Models [57.357091028792325]
ウェブスケールのデータに基づいて事前訓練された視覚言語モデル(VLM)は、ゼロショットの一般化を約束するが、しばしば意味的ミスアライメントに悩まされる。
視覚・テクストアライメントを改善するために,制約付きプロンプトエンハンスメント(CPE)法を提案する。
提案手法はTGSSG(Topology-Guided Synonymous Semantic Generation)とCADRS(Calegory-Agnostic Discriminative Region Selection)の2つの重要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2025-08-24T15:45:22Z) - Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation [9.862714096455175]
我々は、textbfMultimodal textbfStepwise textbfDecomposition Chain of Thought (MSD-CoT) を介して textbfRegion-constrained textbfDual-stream textbfVisual textbfPrompting (RDVP) を相乗化する新しいトレーニングフリーなテスト時間適応フレームワークを提案する。
RDVPは、前景と背景点の視覚的プロンプトを視覚的および独立的にサンプリングする空間的制約を注入し、意味的相違を効果的に緩和する
論文 参考訳(メタデータ) (2025-06-07T14:50:26Z) - Towards Effective, Efficient and Unsupervised Social Event Detection in the Hyperbolic Space [54.936897625837474]
この記事では、教師なしフレームワークHyperSED(Hyperbolic SED)を紹介します。
具体的には、まずソーシャルメッセージをセマンティックベースのメッセージアンカーにモデル化し、次にアンカーグラフの構造を利用する。
公開データセットの実験では、HyperSEDの競合性能と、大幅な効率向上が示されている。
論文 参考訳(メタデータ) (2024-12-14T06:55:27Z) - TS-HTFA: Advancing Time Series Forecasting via Hierarchical Text-Free Alignment with Large Language Models [14.411646409316624]
時系列予測の新しい手法である textbfHierarchical textbfText-textbfFree textbfAlignment (textbfTS-HTFA) を導入する。
我々は、QR分解語埋め込みと学習可能なプロンプトに基づいて、ペア化されたテキストデータを適応的な仮想テキストに置き換える。
複数の時系列ベンチマークの実験は、HTFAが最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2024-09-23T12:57:24Z) - Coupling Global Context and Local Contents for Weakly-Supervised
Semantic Segmentation [54.419401869108846]
Weakly Supervised Semantic (WSSS)モデルを提案する。
グローバルなオブジェクトコンテキストを異なる粒度空間でキャプチャするために,フレキシブルなコンテキストアグリゲーションモジュールを提案する。
局所的な細粒度を集約するために、ボトムアップパラメータ学習可能な方法で意味的に一貫した特徴融合モジュールを提案する。
論文 参考訳(メタデータ) (2023-04-18T15:29:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。