論文の概要: EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection
- arxiv url: http://arxiv.org/abs/2603.11521v1
- Date: Thu, 12 Mar 2026 04:10:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.859893
- Title: EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection
- Title(参考訳): EReCu:非教師付きカモフラージュ検出のためのマルチキュー学習による擬似ラベル進化融合と微細化
- Authors: Shuo Jiang, Gaojia Zhang, Min Tan, Yufei Yin, Gang Pan,
- Abstract要約: 非教師付きカモフラーゲ型物体検出(UCOD)は、対象物とその周囲の固有の類似性が高いため、依然として困難な課題である。
擬似ラベルの信頼性と特徴の忠実度を両立させる統一UCODフレームワークを提案する。
提案手法は,高精細感,堅牢な境界アライメント,高次一般化を特徴とする最先端性能を実現する。
- 参考スコア(独自算出の注目度): 20.892452296357813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised Camouflaged Object Detection (UCOD) remains a challenging task due to the high intrinsic similarity between target objects and their surroundings, as well as the reliance on noisy pseudo-labels that hinder fine-grained texture learning. While existing refinement strategies aim to alleviate label noise, they often overlook intrinsic perceptual cues, leading to boundary overflow and structural ambiguity. In contrast, learning without pseudo-label guidance yields coarse features with significant detail loss. To address these issues, we propose a unified UCOD framework that enhances both the reliability of pseudo-labels and the fidelity of features. Our approach introduces the Multi-Cue Native Perception module, which extracts intrinsic visual priors by integrating low-level texture cues with mid-level semantics, enabling precise alignment between masks and native object information. Additionally, Pseudo-Label Evolution Fusion intelligently refines labels through teacher-student interaction and utilizes depthwise separable convolution for efficient semantic denoising. It also incorporates Spectral Tensor Attention Fusion to effectively balance semantic and structural information through compact spectral aggregation across multi-layer attention maps. Finally, Local Pseudo-Label Refinement plays a pivotal role in local detail optimization by leveraging attention diversity to restore fine textures and enhance boundary fidelity. Extensive experiments on multiple UCOD datasets demonstrate that our method achieves state-of-the-art performance, characterized by superior detail perception, robust boundary alignment, and strong generalization under complex camouflage scenarios.
- Abstract(参考訳): 教師なしカモフラーゲ型物体検出(UCOD)は、対象物とその周囲の内在的類似性が高く、きめ細かいテクスチャ学習を妨げるうるさい擬似ラベルに依存しているため、依然として困難な課題である。
既存の洗練戦略はラベルノイズを軽減することを目的としているが、内在的な知覚的手がかりを見落とし、境界オーバーフローと構造的曖昧さをもたらすことが多い。
対照的に、擬似ラベルガイダンスを使わずに学習すると、粗い特徴が顕著に失われる。
これらの課題に対処するために,疑似ラベルの信頼性と特徴の忠実度を両立させる統一UCODフレームワークを提案する。
このモジュールは,低レベルのテクスチャキューと中レベルのセマンティクスを統合し,マスクとネイティブオブジェクト情報の正確なアライメントを可能にする。
さらに、Pseudo-Label Evolution Fusionは、教師と学生の交流を通じてラベルをインテリジェントに洗練し、深く分離可能な畳み込みを利用して効率的なセマンティック・デノイングを行う。
また、スペクトルテンソル注意融合(Spectral Tensor Attention Fusion)を導入し、多層アテンションマップ間のコンパクトなスペクトルアグリゲーションを通じて意味と構造情報を効果的にバランスさせる。
最後に,局所擬似ラベルリファインメントは,微視的テクスチャの復元と境界忠実度の向上に注目の多様性を活用することにより,局所的詳細最適化において重要な役割を担っている。
複数のUCODデータセットに対する大規模な実験により, 複雑なカモフラージュシナリオ下での高精細感, 堅牢な境界アライメント, 強い一般化を特徴とする最先端の性能が得られた。
関連論文リスト
- Multi-label Classification with Panoptic Context Aggregation Networks [61.82285737410154]
本稿では,多次幾何学的文脈を階層的に統合する新しいアプローチであるDeep Panoptic Context Aggregation Network(PanCAN)を紹介する。
PanCANは、ランダムウォークとアテンションメカニズムを組み合わせることで、各スケールで複数階の近傍関係を学習する。
NUS-WIDE、PASCAL VOC、2007、MS-COCOベンチマークの実験は、PanCANが一貫して競争結果を達成することを示した。
論文 参考訳(メタデータ) (2025-12-29T14:16:21Z) - Graph-Based Uncertainty Modeling and Multimodal Fusion for Salient Object Detection [12.743278093269325]
動的不確実性伝播とマルチモーダル協調推論ネットワーク(DUP-MCRNet)を提案する。
DUGCは空間意味距離に基づいて構築されたスパースグラフを通じて層間の不確実性を伝播するように設計されている。
MCFは学習可能なモダリティゲーティングウェイトを使用して、RGB、深さ、エッジの特徴の注意マップを重み付けする。
論文 参考訳(メタデータ) (2025-08-28T04:31:48Z) - SeFENet: Robust Deep Homography Estimation via Semantic-Driven Feature Enhancement [14.1936051404987]
厳しい環境で撮影された画像は、しばしばぼやけた細部、コントラストの低減、色歪みを示す。
本稿では,SeFENetと呼ばれる,ロバストなホモグラフィ推定のための意味駆動型機能拡張ネットワークを提案する。
SeFENetはSOTA法を著しく上回り,大規模データセット上での点一致誤差を少なくとも41%低減することを示した。
論文 参考訳(メタデータ) (2024-12-09T10:04:14Z) - Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - An Information Compensation Framework for Zero-Shot Skeleton-based Action Recognition [49.45660055499103]
ゼロショットの人間の骨格に基づく行動認識は、トレーニング中に見られるカテゴリ外の行動を認識するモデルを構築することを目的としている。
従来の研究では、シーケンスの視覚的空間分布と意味的空間分布の整合性に焦点が当てられていた。
強固で頑健な表現を得るために,新たな損失関数サンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-06-02T06:53:01Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Progressive Learning with Cross-Window Consistency for Semi-Supervised
Semantic Segmentation [40.00721341952556]
クロスウィンドウ一貫性(CWC)は、ラベルのないデータから補助的な監視を包括的に抽出するのに役立つ。
我々は,大規模ラベルなしデータから弱い制約を抽出し,深層ネットワークを最適化する,新しいCWC駆動のプログレッシブラーニングフレームワークを提案する。
さらに,高一貫性で信頼性の高い擬似ラベルを提供する動的擬似ラベルメモリバンク(DPM)を提案する。
論文 参考訳(メタデータ) (2022-11-22T17:31:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。