論文の概要: A Revisit to the Decoder for Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2503.14035v1
- Date: Tue, 18 Mar 2025 08:51:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:15:55.685852
- Title: A Revisit to the Decoder for Camouflaged Object Detection
- Title(参考訳): カモフラージュ物体検出のためのデコーダの再検討
- Authors: Seung Woo Ko, Joopyo Hong, Suyoung Kim, Seungjai Bang, Sungzoon Cho, Nojun Kwak, Hyung-Sin Kim, Joonseok Lee,
- Abstract要約: カモフラージュされたオブジェクト検出(COD)は、背景に隠されたカモフラージュされたオブジェクトのきめ細かいセグメンテーションマップを作成することを目的としている。
本稿では,CODにおける一般的なデコード戦略をエンリッチ・デコーダとリタッチ・デコーダで拡張する新しいアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 34.886607866949845
- License:
- Abstract: Camouflaged object detection (COD) aims to generate a fine-grained segmentation map of camouflaged objects hidden in their background. Due to the hidden nature of camouflaged objects, it is essential for the decoder to be tailored to effectively extract proper features of camouflaged objects and extra-carefully generate their complex boundaries. In this paper, we propose a novel architecture that augments the prevalent decoding strategy in COD with Enrich Decoder and Retouch Decoder, which help to generate a fine-grained segmentation map. Specifically, the Enrich Decoder amplifies the channels of features that are important for COD using channel-wise attention. Retouch Decoder further refines the segmentation maps by spatially attending to important pixels, such as the boundary regions. With extensive experiments, we demonstrate that ENTO shows superior performance using various encoders, with the two novel components playing their unique roles that are mutually complementary.
- Abstract(参考訳): カモフラージュされたオブジェクト検出(COD)は、背景に隠されたカモフラージュされたオブジェクトのきめ細かいセグメンテーションマップを作成することを目的としている。
カモフラージュされた物体の隠れた性質のため、デコーダは、カモフラージュされた物体の適切な特徴を効果的に抽出し、その複雑な境界を極端に正確に生成することが不可欠である。
本稿では,COD の一般的なデコード戦略を Enrich Decoder と Retouch Decoder で拡張する新しいアーキテクチャを提案する。
具体的には、エンリッチ・デコーダは、チャネルワイド・アテンションを用いてCODにとって重要な機能のチャネルを増幅する。
Retouch Decoderは、境界領域のような重要なピクセルに空間的に参加することで、セグメンテーションマップをさらに洗練する。
広汎な実験により,ENTOは様々なエンコーダを用いて優れた性能を示し,両コンポーネントは相互に相補的なユニークな役割を担っていることを示した。
関連論文リスト
- SEDS: Semantically Enhanced Dual-Stream Encoder for Sign Language Retrieval [82.51117533271517]
以前はRGBビデオをエンコードするだけで高レベルのセマンティックな特徴が得られていた。
既存のRGBベースの手話検索作業は、エンドツーエンドのトレーニングに埋め込まれた濃密な視覚データによる膨大なメモリコストに悩まされる。
本稿では,Semantically Enhanced Dual-Streamという手話表現フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-23T11:31:11Z) - SPOT: Self-Training with Patch-Order Permutation for Object-Centric Learning with Autoregressive Transformers [13.173384346104802]
教師なしのオブジェクト中心学習は、シーンを解釈可能なオブジェクトエンティティ(スロット)に分解することを目的としている。
Slotベースのオートエンコーダは、このタスクの顕著な方法である。
本研究は,デコーダからエンコーダに優れたスロットベースのアテンションマスクを蒸留する2つの新しい手法を紹介する。
論文 参考訳(メタデータ) (2023-12-01T15:20:58Z) - More complex encoder is not all you need [0.882348769487259]
我々は,強力なデコーダを構築するために,新しいサブピクセル・コンボリューションを組み込んだneU-Net(複雑なエンコーダではないU-Net)を導入する。
我々のモデル設計は、SynapseとACDCの両方のデータセット上で、最先端の手法を上回る優れた結果が得られる。
論文 参考訳(メタデータ) (2023-09-20T08:34:38Z) - Camouflaged Object Detection with Feature Grafting and Distractor Aware [9.791590363932519]
そこで我々は,Camouflaged Object Detectionタスクを処理するために,FDNet(Feature Grafting and Distractor Aware Network)を提案する。
具体的には、CNNとTransformerを使ってマルチスケール画像を並列にエンコードする。
Distractor Aware Moduleは、CODタスクで考えられる2つの障害を明示的にモデル化して、粗いカモフラージュマップを洗練させるように設計されている。
論文 参考訳(メタデータ) (2023-07-08T09:37:08Z) - Referring Camouflaged Object Detection [97.90911862979355]
Ref-COD は、特定のカモフラージュされたオブジェクトを、サルエントターゲットオブジェクトによる参照画像の小さなセットに基づいて分割することを目的としている。
R2C7Kと呼ばれる大規模なデータセットは、実世界のシナリオで64のオブジェクトカテゴリをカバーする7Kイメージで構成されています。
論文 参考訳(メタデータ) (2023-06-13T04:15:37Z) - Towards Complex Backgrounds: A Unified Difference-Aware Decoder for
Binary Segmentation [4.6932442139663015]
本稿では、差分認識デコーダと呼ばれる新しい統合二重分岐デコーダパラダイムを提案する。
差分認識デコーダは、エンコーダによって出力されるマルチレベル特徴を用いて、人間の目を3段階に模倣する。
その結果、差認識デコーダは、他の最先端のバイナリセグメンテーション手法よりも高い精度で実現できることを示した。
論文 参考訳(メタデータ) (2022-10-27T03:45:29Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。