論文の概要: Boosting Camouflaged Object Detection with Dual-Task Interactive
Transformer
- arxiv url: http://arxiv.org/abs/2205.10579v1
- Date: Sat, 21 May 2022 12:15:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 18:18:55.486245
- Title: Boosting Camouflaged Object Detection with Dual-Task Interactive
Transformer
- Title(参考訳): Dual-Task Interactive Transformer を用いたカモフラージュ物体検出
- Authors: Zhengyi Liu, Zhili Zhang, Wei Wu
- Abstract要約: 既存のメソッドは、まずオブジェクトを見つけ、次に境界を洗練します。
カモフラージュされた物体の発見は、物体と境界の繰り返し探索に依存すると論じる。
カモフラージュされた物体の正確な位置と細かな境界の両方を検出するために,デュアルタスク・インタラクティブ・トランスフォーマーを提案する。
- 参考スコア(独自算出の注目度): 16.359244693056656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camouflaged object detection intends to discover the concealed objects hidden
in the surroundings. Existing methods follow the bio-inspired framework, which
first locates the object and second refines the boundary. We argue that the
discovery of camouflaged objects depends on the recurrent search for the object
and the boundary. The recurrent processing makes the human tired and helpless,
but it is just the advantage of the transformer with global search ability.
Therefore, a dual-task interactive transformer is proposed to detect both
accurate position of the camouflaged object and its detailed boundary. The
boundary feature is considered as Query to improve the camouflaged object
detection, and meanwhile the object feature is considered as Query to improve
the boundary detection. The camouflaged object detection and the boundary
detection are fully interacted by multi-head self-attention. Besides, to obtain
the initial object feature and boundary feature, transformer-based backbones
are adopted to extract the foreground and background. The foreground is just
object, while foreground minus background is considered as boundary. Here, the
boundary feature can be obtained from blurry boundary region of the foreground
and background. Supervised by the object, the background and the boundary
ground truth, the proposed model achieves state-of-the-art performance in
public datasets. https://github.com/liuzywen/COD
- Abstract(参考訳): カモフラージュされた物体検出は、周囲に隠された物体を発見することを目的としている。
既存のメソッドはバイオインスパイアされたフレームワークに従い、最初にオブジェクトを見つけ、次に境界を洗練する。
我々は、カモフラージュされた物体の発見は、物体と境界の繰り返し探索に依存すると主張する。
繰り返し処理することで、人間が疲れて無力になるが、これはグローバル検索能力を備えたトランスフォーマーの利点にすぎない。
そこで,2タスクの対話型変圧器を提案し,迷彩物体の正確な位置と,その詳細な境界を検出する。
境界機能はカモフラージュされたオブジェクト検出を改善するためのクエリと見なされ、一方、オブジェクト機能は境界検出を改善するクエリとみなされる。
カモフラージュされた物体検出と境界検出は、マルチヘッドセルフアテンションによって完全に相互作用する。
また、初期オブジェクト特徴および境界特徴を得るために、トランスフォーマーベースのバックボーンを採用して、前景と背景を抽出する。
前景は単なる対象であり、前景のマイナス背景は境界と見なされている。
ここでは、前景と背景のぼやけた境界領域から境界特徴を得ることができる。
オブジェクト、背景、境界の真理によって監督され、提案モデルはパブリックデータセットで最先端のパフォーマンスを達成する。
https://github.com/liuzywen/COD
関連論文リスト
- Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - Camouflaged Image Synthesis Is All You Need to Boost Camouflaged
Detection [65.8867003376637]
本研究では,カモフラージュデータの合成フレームワークを提案する。
提案手法では,既存の物体検出モデルのトレーニングに使用可能な,現実的なカモフラージュ画像の生成に生成モデルを用いる。
我々のフレームワークは3つのデータセット上で最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-08-13T06:55:05Z) - MFFN: Multi-view Feature Fusion Network for Camouflaged Object Detection [10.04773536815808]
画像中の不明瞭な物体を見つける人間の振る舞いを模倣する,Multi-view Feature Fusion Network (MFFN) と呼ばれる行動に触発されたフレームワークを提案する。
MFFNは抽出したマルチビュー特徴を比較し、融合することにより、重要なエッジとセマンティック情報をキャプチャする。
提案手法は,同一データを用いたトレーニングにより,既存の最先端手法に対して良好に機能する。
論文 参考訳(メタデータ) (2022-10-12T16:12:58Z) - Boundary-Guided Camouflaged Object Detection [20.937071658007255]
カモフラージュ物体検出のための新しい境界誘導ネットワーク(BGNet)を提案する。
提案手法は,CODの表現学習をガイドするために,重要かつ余分なオブジェクト関連エッジセマンティクスを探索する。
提案手法は, 正確な境界位置同定を行うために, カモフラージュした物体の検出を促進する。
論文 参考訳(メタデータ) (2022-07-02T10:48:35Z) - Towards Deeper Understanding of Camouflaged Object Detection [64.81987999832032]
バイナリセグメンテーション設定は、カモフラージュの概念を完全に理解できない。
そこで本研究では,カモフラージュされたオブジェクトの局所化,セグメント化,ランク付けを同時に行う3段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-23T14:26:18Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Scribble-based Boundary-aware Network for Weakly Supervised Salient
Object Detection in Remote Sensing Images [10.628932392896374]
スパース・スクリブル・アノテーションからリモートセンシング画像の正当性を予測するために,弱教師付きサルエント・オブジェクト検出フレームワークを提案する。
具体的には,高信頼度オブジェクト境界 (擬似) ラベルによって明示的に制御されるオブジェクト境界意味論を探索する境界対応モジュール (BAM) を設計する。
次に,境界セマンティクスを高次特徴と統合し,スクリブルラベルの監督下での健全な物体検出を誘導する。
論文 参考訳(メタデータ) (2022-02-07T20:32:21Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z) - Active Perception for Ambiguous Objects Classification [7.837959746116199]
現実世界では、単一の視点から正確な分類と検出を許さないあいまいな物体を見つけることができる。
本稿では,オブジェクトの単一ビューが与えられた場合,オブジェクトを類似するものと識別するための次の視点の座標を提供し,あいまいさを解消するフレームワークを提案する。
我々は,フランカ・エミカ・パンダロボットと,あいまいさを特徴とする一般家庭用物体を用いて,我々のアプローチを検証する。
論文 参考訳(メタデータ) (2021-08-02T09:12:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。