論文の概要: CamoFA: A Learnable Fourier-based Augmentation for Camouflage Segmentation
- arxiv url: http://arxiv.org/abs/2308.15660v2
- Date: Tue, 03 Dec 2024 05:45:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:39:12.743627
- Title: CamoFA: A Learnable Fourier-based Augmentation for Camouflage Segmentation
- Title(参考訳): CamoFA:カモフラージュセグメンテーションのための学習可能なフーリエベース拡張
- Authors: Minh-Quan Le, Minh-Triet Tran, Trung-Nghia Le, Tam V. Nguyen, Thanh-Toan Do,
- Abstract要約: 本稿では,camouflaged object detection (COD) とcamouflaged instance segmentation (CIS) の学習可能な拡張法を提案する。
提案手法は,カモフラーグ型物体検出器とインスタンスセグメンタの性能を大きなマージンで向上させる。
- 参考スコア(独自算出の注目度): 25.557135220449236
- License:
- Abstract: Camouflaged object detection (COD) and camouflaged instance segmentation (CIS) aim to recognize and segment objects that are blended into their surroundings, respectively. While several deep neural network models have been proposed to tackle those tasks, augmentation methods for COD and CIS have not been thoroughly explored. Augmentation strategies can help improve models' performance by increasing the size and diversity of the training data and exposing the model to a wider range of variations in the data. Besides, we aim to automatically learn transformations that help to reveal the underlying structure of camouflaged objects and allow the model to learn to better identify and segment camouflaged objects. To achieve this, we propose a learnable augmentation method in the frequency domain for COD and CIS via the Fourier transform approach, dubbed CamoFA. Our method leverages a conditional generative adversarial network and cross-attention mechanism to generate a reference image and an adaptive hybrid swapping with parameters to mix the low-frequency component of the reference image and the high-frequency component of the input image. This approach aims to make camouflaged objects more visible for detection and segmentation models. Without bells and whistles, our proposed augmentation method boosts the performance of camouflaged object detectors and instance segmenters by large margins.
- Abstract(参考訳): カモフラージュされたオブジェクト検出(COD)とカモフラージュされたインスタンスセグメンテーション(CIS)は、それぞれの周囲に混入したオブジェクトを認識することを目的としている。
これらの課題に対処するために、いくつかのディープニューラルネットワークモデルが提案されているが、CODとCISの強化方法は十分に研究されていない。
拡張戦略は、トレーニングデータのサイズと多様性を高め、より広い範囲のデータにモデルを公開することによって、モデルのパフォーマンスを改善するのに役立つ。
さらに,カモフラージュされたオブジェクトの基盤構造を明らかにする上で有効な変換を自動的に学習し,カモフラージュされたオブジェクトの識別と分割をモデルが学べるようにすることを目的とする。
そこで本研究では,CamoFA と呼ばれるフーリエ変換手法を用いて,COD と CIS の周波数領域における学習可能な拡張手法を提案する。
本手法では,条件付き生成逆数ネットワークとクロスアテンション機構を利用して参照画像を生成し,パラメータと適応ハイブリッドスワップにより参照画像の低周波成分と入力画像の高周波成分を混合する。
このアプローチは、キャモフラージュされたオブジェクトを検出およびセグメンテーションモデルのためにより可視化することを目的としている。
ベルやホイッスルを使わずに,提案手法は,カモフラージュされた物体検出器やインスタンスセグメンタの性能を大きなマージンで向上させる。
関連論文リスト
- Frequency-Guided Spatial Adaptation for Camouflaged Object Detection [34.11591418717486]
我々は,CODタスクのための新しい周波数誘導空間適応法を提案する。
スペクトログラム内の非重なり円内に位置する周波数成分をグループ化して相互作用することにより、異なる周波数成分を動的に強化または弱める。
同時に、被写体と背景を区別するための特徴を強調し、被写体の位置と形状を間接的に示唆する。
論文 参考訳(メタデータ) (2024-09-19T02:53:48Z) - Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - Adaptive Guidance Learning for Camouflaged Object Detection [23.777432551429396]
本稿では,適応型誘導学習ネットワーク「textitAGLNet」を提案する。
広く使用されている3つのCODベンチマークデータセットの実験により,提案手法が大幅な性能向上を実現することが示された。
論文 参考訳(メタデータ) (2024-05-05T06:21:58Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Camouflaged Image Synthesis Is All You Need to Boost Camouflaged
Detection [65.8867003376637]
本研究では,カモフラージュデータの合成フレームワークを提案する。
提案手法では,既存の物体検出モデルのトレーニングに使用可能な,現実的なカモフラージュ画像の生成に生成モデルを用いる。
我々のフレームワークは3つのデータセット上で最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-08-13T06:55:05Z) - CamDiff: Camouflage Image Augmentation via Diffusion Model [83.35960536063857]
CamDiffは、カモフラージュされたシーンで透明なオブジェクトを合成するための新しいアプローチだ。
我々は,潜伏拡散モデルを用いて,カモフラージュされたシーンで有能な物体を合成する。
当社のアプローチでは、フレキシブルな編集と大規模データセットの効率的な生成を低コストで実現している。
論文 参考訳(メタデータ) (2023-04-11T19:37:47Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Feature Aggregation and Propagation Network for Camouflaged Object
Detection [42.33180748293329]
カモフラージュされたオブジェクト検出(COD)は、環境に埋め込まれたカモフラージュされたオブジェクトを検出し、分離することを目的としている。
いくつかのCOD法が開発されているが, 前景オブジェクトと背景環境との固有の類似性により, 依然として不満足な性能に悩まされている。
カモフラージュされた物体検出のための新しい特徴集約・伝播ネットワーク(FAP-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T05:54:28Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。