論文の概要: Assisted Refinement Network Based on Channel Information Interaction for Camouflaged and Salient Object Detection
- arxiv url: http://arxiv.org/abs/2512.11369v1
- Date: Fri, 12 Dec 2025 08:29:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.703737
- Title: Assisted Refinement Network Based on Channel Information Interaction for Camouflaged and Salient Object Detection
- Title(参考訳): カモフラージュ・サージェント物体検出のためのチャネル情報インタラクションに基づく補修網
- Authors: Kuan Wang, Yanjun Qin, Mengge Lu, Liejun Wang, Xiaoming Tao,
- Abstract要約: Camouflaged Object Detection (COD) はコンピュータビジョンにおいて重要な課題であり、視覚的にその背景と高度に統合されたオブジェクトを識別し、セグメンテーションすることを目的としている。
現在の主流手法は、層間機能融合を進展させたが、デコード段階では2つの重要な問題が続いている。
1つ目は、同層機能内のチャンネル間の情報相互作用が不十分であり、特徴表現性を制限することである。
2つ目は、効果的にコモデル境界と領域情報を共有できないことであり、完全な領域と鋭いオブジェクトの境界を正確に再構築することは困難である。
- 参考スコア(独自算出の注目度): 30.393796834241794
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Camouflaged Object Detection (COD) stands as a significant challenge in computer vision, dedicated to identifying and segmenting objects visually highly integrated with their backgrounds. Current mainstream methods have made progress in cross-layer feature fusion, but two critical issues persist during the decoding stage. The first is insufficient cross-channel information interaction within the same-layer features, limiting feature expressiveness. The second is the inability to effectively co-model boundary and region information, making it difficult to accurately reconstruct complete regions and sharp boundaries of objects. To address the first issue, we propose the Channel Information Interaction Module (CIIM), which introduces a horizontal-vertical integration mechanism in the channel dimension. This module performs feature reorganization and interaction across channels to effectively capture complementary cross-channel information. To address the second issue, we construct a collaborative decoding architecture guided by prior knowledge. This architecture generates boundary priors and object localization maps through Boundary Extraction (BE) and Region Extraction (RE) modules, then employs hybrid attention to collaboratively calibrate decoded features, effectively overcoming semantic ambiguity and imprecise boundaries. Additionally, the Multi-scale Enhancement (MSE) module enriches contextual feature representations. Extensive experiments on four COD benchmark datasets validate the effectiveness and state-of-the-art performance of the proposed model. We further transferred our model to the Salient Object Detection (SOD) task and demonstrated its adaptability across downstream tasks, including polyp segmentation, transparent object detection, and industrial and road defect detection. Code and experimental results are publicly available at: https://github.com/akuan1234/ARNet-v2.
- Abstract(参考訳): Camouflaged Object Detection (COD) はコンピュータビジョンにおいて重要な課題であり、視覚的にその背景と高度に統合されたオブジェクトを識別し、セグメンテーションすることを目的としている。
現在の主流手法は、層間機能融合を進展させたが、デコード段階では2つの重要な問題が続いている。
1つ目は、同層機能内のチャンネル間の情報相互作用が不十分であり、特徴表現性を制限することである。
2つ目は、効果的にコモデル境界と領域情報を共有できないことであり、完全な領域と鋭いオブジェクトの境界を正確に再構築することは困難である。
最初の課題に対処するため,チャネル次元に水平-垂直統合機構を導入するChannel Information Interaction Module (CIIM)を提案する。
このモジュールは、チャンネル間での機能再構成と相互作用を行い、補完的なチャンネル間の情報を効果的に取得する。
2つ目の課題に対処するため、先行知識によってガイドされた協調的復号化アーキテクチャを構築した。
このアーキテクチャは境界抽出(BE)と領域抽出(RE)モジュールを通して境界事前およびオブジェクトローカライゼーションマップを生成し、協調的にデコードされた特徴を校正し、意味的曖昧さと不正確な境界を効果的に克服する。
さらに、マルチスケール拡張(MSE)モジュールはコンテキストの特徴表現を豊かにする。
4つのCODベンチマークデータセットの大規模な実験により、提案モデルの有効性と最先端性能が検証された。
さらに,本手法をSalient Object Detection (SOD) タスクに移行し,ポリプセグメンテーション,透明物体検出,産業的および道路的欠陥検出など,下流タスクへの適応性を実証した。
コードと実験結果は、https://github.com/akuan1234/ARNet-v2.comで公開されている。
関連論文リスト
- CFMD: Dynamic Cross-layer Feature Fusion for Salient Object Detection [7.262250906929891]
クロス層機能ピラミッドネットワーク(CFPN)は,多層機能融合と境界詳細保存において顕著な進歩を遂げている。
これらの課題に対処するために,CFMDという,2つの重要なイノベーションを取り入れた,新しいクロスレイヤ機能ピラミッドネットワークを提案する。
まず,現在最先端のMambaアーキテクチャを組み込んで動的重み分布機構を構築するコンテキスト認識機能集約モジュール(CFLMA)を設計する。
第2に,分解能回復時に空間的詳細を保存する適応動的アップサンプリングユニット(CFLMD)を導入する。
論文 参考訳(メタデータ) (2025-04-02T03:22:36Z) - B2Net: Camouflaged Object Detection via Boundary Aware and Boundary Fusion [10.899493419708651]
得られた境界の精度を高めるために,B2Netという新しいネットワークを提案する。
我々は、より差別的な特徴表現を統合することを目的として、Residual Feature Enhanced Module (RFEM)を提案する。
その後、境界認識モジュール(BAM)を導入し、エッジキューを2回探索する。
最後に,さまざまなスケールの情報をトップダウンで統合するCBFMを設計する。
論文 参考訳(メタデータ) (2024-12-31T13:06:06Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Boundary-semantic collaborative guidance network with dual-stream
feedback mechanism for salient object detection in optical remote sensing
imagery [22.21644705244091]
二重ストリームフィードバック機構を備えた境界意味協調誘導ネットワーク(BSCGNet)を提案する。
BSCGNetは、近年提案されている17の最先端(SOTA)アプローチよりも優れた、挑戦的なシナリオにおいて、明確なアドバンテージを示している。
論文 参考訳(メタデータ) (2023-03-06T03:36:06Z) - Feature Aggregation and Propagation Network for Camouflaged Object
Detection [42.33180748293329]
カモフラージュされたオブジェクト検出(COD)は、環境に埋め込まれたカモフラージュされたオブジェクトを検出し、分離することを目的としている。
いくつかのCOD法が開発されているが, 前景オブジェクトと背景環境との固有の類似性により, 依然として不満足な性能に悩まされている。
カモフラージュされた物体検出のための新しい特徴集約・伝播ネットワーク(FAP-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T05:54:28Z) - Saliency Detection via Global Context Enhanced Feature Fusion and Edge
Weighted Loss [6.112591965159383]
本研究では,コンテキスト融合デコーダネットワーク(CFDN)と近縁重み付き損失(NEWLoss)関数を提案する。
CFDNは、グローバルコンテキスト情報を統合し、不要な空間情報の影響を抑えることにより、正確な唾液マップを作成する。
NewLossは、オブジェクト境界上の重み写像を生成することによって、追加モジュールなしで曖昧な境界の学習を加速する。
論文 参考訳(メタデータ) (2021-10-13T08:04:55Z) - Full-Duplex Strategy for Video Object Segmentation [141.43983376262815]
Full- Strategy Network (FSNet)はビデオオブジェクトセグメンテーション(VOS)のための新しいフレームワークである
我々のFSNetは、融合復号ステージの前に、クロスモーダルな機能パス(すなわち、送信と受信)を同時に実行します。
我々のFSNetは、VOSとビデオの有能なオブジェクト検出タスクの両方において、他の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-06T14:50:50Z) - RGB-D Salient Object Detection with Cross-Modality Modulation and
Selection [126.4462739820643]
本稿では, RGB-D Salient Object Detection (SOD) において, モジュール間相補性を段階的に統合し, 改良する有効な方法を提案する。
提案するネットワークは,1)RGB画像とそれに対応する深度マップからの補完情報を効果的に統合する方法,および2)より精度の高い特徴を適応的に選択する方法の2つの課題を主に解決する。
論文 参考訳(メタデータ) (2020-07-14T14:22:50Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。