論文の概要: A bioinspired three-stage model for camouflaged object detection
- arxiv url: http://arxiv.org/abs/2305.12635v2
- Date: Tue, 6 Jun 2023 12:17:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 19:37:03.573190
- Title: A bioinspired three-stage model for camouflaged object detection
- Title(参考訳): カモフラージュ物体検出のためのバイオインスパイア3段階モデル
- Authors: Tianyou Chen, Jin Xiao, Xiaoguang Hu, Guofeng Zhang, Shaojie Wang
- Abstract要約: 本稿では,1回の繰り返しで粗い部分分割を可能にする3段階モデルを提案する。
本モデルでは, 3つのデコーダを用いて, サブサンプル特徴, 収穫特徴, および高解像度のオリジナル特徴を逐次処理する。
我々のネットワークは、不要な複雑さを伴わずに最先端のCNNベースのネットワークを上回る。
- 参考スコア(独自算出の注目度): 8.11866601771984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camouflaged objects are typically assimilated into their backgrounds and
exhibit fuzzy boundaries. The complex environmental conditions and the high
intrinsic similarity between camouflaged targets and their surroundings pose
significant challenges in accurately locating and segmenting these objects in
their entirety. While existing methods have demonstrated remarkable performance
in various real-world scenarios, they still face limitations when confronted
with difficult cases, such as small targets, thin structures, and indistinct
boundaries. Drawing inspiration from human visual perception when observing
images containing camouflaged objects, we propose a three-stage model that
enables coarse-to-fine segmentation in a single iteration. Specifically, our
model employs three decoders to sequentially process subsampled features,
cropped features, and high-resolution original features. This proposed approach
not only reduces computational overhead but also mitigates interference caused
by background noise. Furthermore, considering the significance of multi-scale
information, we have designed a multi-scale feature enhancement module that
enlarges the receptive field while preserving detailed structural cues.
Additionally, a boundary enhancement module has been developed to enhance
performance by leveraging boundary information. Subsequently, a mask-guided
fusion module is proposed to generate fine-grained results by integrating
coarse prediction maps with high-resolution feature maps. Our network surpasses
state-of-the-art CNN-based counterparts without unnecessary complexities. Upon
acceptance of the paper, the source code will be made publicly available at
https://github.com/clelouch/BTSNet.
- Abstract(参考訳): カモフラージュされたオブジェクトは通常、背景に同化され、ファジィ境界を示す。
複雑な環境条件と、カモフラージュされたターゲットとその周囲の高固有の類似性は、これらの物体全体を正確に配置し、セグメント化する上で重要な課題となる。
既存の手法は様々な現実のシナリオで顕著な性能を示しているが、小さなターゲット、薄い構造、不明瞭な境界といった難しいケースに直面すると、まだ限界に直面している。
カモフラージュされた物体を含む画像の観察において、人間の視覚知覚からインスピレーションを得た3段階モデルを提案する。
具体的には,3つのデコーダを用いて,サブサンプリングされた特徴,収穫された特徴,高解像度のオリジナル特徴を逐次処理する。
提案手法は,計算オーバーヘッドを削減するだけでなく,背景雑音による干渉を軽減する。
さらに,マルチスケール情報の重要性を考慮し,詳細な構造的手がかりを保ちながら受容領域を拡大するマルチスケール機能拡張モジュールを設計した。
また,境界情報の活用による性能向上のため,バウンダリ強化モジュールが開発された。
続いて,粗い予測地図と高分解能特徴地図を統合することで,細粒度な結果を生成するためのマスク誘導型融合モジュールを提案する。
我々のネットワークは、不要な複雑さなしに最先端のcnnベースのネットワークを上回る。
論文が受理されると、ソースコードはhttps://github.com/clelouch/BTSNet.comで公開される。
関連論文リスト
- Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Push-the-Boundary: Boundary-aware Feature Propagation for Semantic
Segmentation of 3D Point Clouds [0.5249805590164901]
本研究では,オブジェクト境界近傍のセマンティックセグメンテーションを改善するための境界対応特徴伝搬機構を提案する。
1つの共有エンコーダで、ネットワークは、(i)境界ローカライゼーション、(ii)オブジェクトの内部を指す方向の予測、(iii)セマンティックセグメンテーションを3つの並列ストリームで出力する。
提案手法は境界誤差を低減することによって一貫した改善をもたらす。
論文 参考訳(メタデータ) (2022-12-23T15:42:01Z) - Feature Aggregation and Propagation Network for Camouflaged Object
Detection [42.33180748293329]
カモフラージュされたオブジェクト検出(COD)は、環境に埋め込まれたカモフラージュされたオブジェクトを検出し、分離することを目的としている。
いくつかのCOD法が開発されているが, 前景オブジェクトと背景環境との固有の類似性により, 依然として不満足な性能に悩まされている。
カモフラージュされた物体検出のための新しい特徴集約・伝播ネットワーク(FAP-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T05:54:28Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Zoom In and Out: A Mixed-scale Triplet Network for Camouflaged Object
Detection [0.0]
本稿では,不明瞭な画像を観察する際の人間の動作を模倣する混合スケール三重項ネットワークbf ZoomNetを提案する。
具体的には、ZoomNetは、ズーム戦略を用いて、設計されたスケール統合ユニットと階層的な混合スケールユニットによって、差別的な混合スケール意味学を学ぶ。
提案したタスクフレンドリなモデルは、4つの公開データセット上の既存の23の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2022-03-05T09:13:52Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - Enhanced Boundary Learning for Glass-like Object Segmentation [55.45473926510806]
本稿では,拡張境界学習によるガラス状物体分割問題を解くことを目的とする。
特に,より微細な境界キューを生成するための改良された微分モジュールを最初に提案する。
境界に沿った大域的な形状表現をモデル化するために,エッジ対応のグラフ畳み込みネットワークモジュールを提案する。
論文 参考訳(メタデータ) (2021-03-29T16:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。