論文の概要: Hard to See, Hard to Label: Generative and Symbolic Acquisition for Subtle Visual Phenomena
- arxiv url: http://arxiv.org/abs/2604.22990v2
- Date: Tue, 28 Apr 2026 02:24:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 14:06:43.825778
- Title: Hard to See, Hard to Label: Generative and Symbolic Acquisition for Subtle Visual Phenomena
- Title(参考訳): 分かりづらい、ラベル付けが難しい:サブトル視覚現象の創発的・象徴的獲得
- Authors: Renjith Prasad, Rishabh Sharma, Andrew E. Shao, Annmary Justine Koomthanam, Shreyas Kulkarni, Suparna Bhattacharya, Martin Foltin, Amit Sheth, David Orozco, Matthew Quinn, Brian Sammuli,
- Abstract要約: 本稿では,拡散に基づく難易度信号と階層的セマンティックカバレッジを結合したオブジェクト検出のための能動的学習フレームワークを提案する。
視覚的困難とセマンティックカバレッジのバランスをとることで、GSALは不確実性のみの選択によってしばしば見逃される微妙で稀なターゲットの検索を改善する。
- 参考スコア(独自算出の注目度): 3.9275663040435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Subtle visual anomalies such as hairline cracks, sub-millimeter voids, and low-contrast inclusions are structurally atypical yet visually ambiguous, making them both difficult to annotate and easy to overlook during active learning. Standard acquisition heuristics based on discriminative uncertainty or feature diversity often overselect dominant patterns while underexploring sparse yet important regions of the data space. This failure mode is especially severe in industrial defect inspection, where anomalies may be both low-prevalence and difficult to distinguish from surrounding structure. To resolve this, we propose GSAL, an active learning framework for object detection that combines a diffusion-based difficulty signal with a hierarchical semantic coverage prior. The diffusion component scores images and proposals using reconstruction discrepancy and denoising variability, prioritizing visually atypical or ambiguous examples. However, diffusion alone does not prevent acquisition from repeatedly favoring hard samples within dominant semantic modes. The semantic component therefore organizes candidate samples in a three-level concept graph and promotes coverage of underrepresented semantic regions while providing interpretable acquisition rationales. By balancing visual difficulty with semantic coverage, GSAL improves retrieval of subtle and rare targets that are often missed by uncertainty-only selection. Experiments on a proprietary thin-film defect, Pascal VOC and MS COCO dataset show consistent gains in label efficiency and rare-class retrieval over uncertainty-, diversity-, and hybrid-based baselines
- Abstract(参考訳): ヘアライン・クラック、サブミリ・ヴォイド、低コントラスト・インクルージョンといったサブセットの視覚異常は、構造的に非典型的であるが、視覚的に曖昧である。
差別的不確実性や特徴の多様性に基づく標準的な買収ヒューリスティックスは、しばしばデータ空間の希少かつ重要な領域を探索しながら、支配的なパターンを過剰に選択する。
この異常モードは特に工業欠陥検査において深刻であり、異常は低頻度であり、周囲の構造と区別することが困難である。
これを解決するために,拡散に基づく難易度信号と階層的セマンティックカバレッジを結合したオブジェクト検出のための能動的学習フレームワークであるGSALを提案する。
拡散成分は、視覚的に非典型的または曖昧な例を優先して、再構成の相違と変分性を利用して画像と提案をスコアする。
しかし拡散だけでは、支配的なセマンティックモード内でのハードサンプルの取得が繰り返し行われるのを防げない。
したがって、セマンティックコンポーネントは、3レベルの概念グラフに候補サンプルを整理し、解釈可能な獲得合理性を提供しながら、表現されていないセマンティック領域のカバレッジを促進する。
視覚的困難とセマンティックカバレッジのバランスをとることで、GSALは不確実性のみの選択によってしばしば見逃される微妙で稀なターゲットの検索を改善する。
プロプライエタリな薄膜欠陥、パスカルVOCおよびMS COCOデータセットの実験は、不確実性、多様性、およびハイブリッドベースラインに対するラベル効率とレアクラスの検索において一貫した増加を示す
関連論文リスト
- Domain-Aware Hierarchical Contrastive Learning for Semi-Supervised Generalization Fault Diagnosis [49.89578655034085]
本稿では,障害診断のためのドメイン認識型階層的コントラスト学習(DAHCL)という統合フレームワークを提案する。
DAHCLは、ソースドメインの幾何学的特徴を捉え、異種ソースドメイン間の擬似ラベル予測を校正する。
また,動的信頼層化とファジィコントラスト監視を組み合わせた階層型コントラスト学習モジュールを開発した。
論文 参考訳(メタデータ) (2026-04-22T08:41:27Z) - Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination [60.197429875410286]
大規模言語モデルにおける視覚と幻覚の対立的脆弱性は、伝統的に別の問題と見なされている。
損失誘起状態下でのニューラル不確実性原理(NUP)の定式化により, ほぼバウンド状態においては, さらなる圧縮は感度分散の増大を伴うことが判明した。
視覚では、高度に結合したコンポーネントをマスキングすることで、コストのかかる敵の訓練なしに堅牢性を向上させる。
言語では、任意の応答トークンを生成する前に、同じプレフィルステージプローブが幻覚リスクを検出する。
論文 参考訳(メタデータ) (2026-03-20T02:07:10Z) - Multi-Cue Anomaly Detection and Localization under Data Contamination [0.6703429330486276]
本稿では,適応的偏差学習パラダイムに限定的な異常監視を組み込んだ頑健な異常検出フレームワークを提案する。
本フレームワークは, 各種データ汚染下での強い検出・局所化性能, 解釈可能性, 堅牢性を実現する。
論文 参考訳(メタデータ) (2026-01-30T12:34:13Z) - Contrastive Representation Modeling for Anomaly Detection [0.21427777919040417]
本研究では,学習中の正と負の関係を再定義し,これらの特性を明示的な異常ラベルを必要とせずに促進する構造的コントラスト目的を提案する。
本フレームワークは, 産業環境における局所的異常の検出を改善するために, パッチベースの学習評価戦略を用いて拡張する。
論文 参考訳(メタデータ) (2025-01-09T10:33:16Z) - DiffGAD: A Diffusion-based Unsupervised Graph Anomaly Detector [17.191834562399293]
拡散型グラフ異常検出器(DiffGAD)を提案する。
DiffGADの核心は、未熟な宇宙学習のパラダイムであり、それを差別的コンテンツで導くことによって、その習熟度を高めるために細心の注意を払って設計されている。
6つの実世界および大規模データセットを用いて実施したDiffGADの総合評価により,その異常な性能が示された。
論文 参考訳(メタデータ) (2024-10-09T05:02:56Z) - Don't Miss Out on Novelty: Importance of Novel Features for Deep Anomaly
Detection [64.21963650519312]
異常検出(AD)は、正規性の学習モデルに適合しない観察を識別する重要なタスクである。
本稿では, 入力空間における説明不能な観測として, 説明可能性を用いた新しいAD手法を提案する。
当社のアプローチでは,複数のベンチマークにまたがる新たな最先端性を確立し,さまざまな異常な型を扱う。
論文 参考訳(メタデータ) (2023-10-01T21:24:05Z) - Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions
Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。
wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。
新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文 参考訳(メタデータ) (2020-12-08T02:26:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。