論文の概要: MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2511.12810v1
- Date: Sun, 16 Nov 2025 22:29:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.556548
- Title: MSRNet: A Multi-Scale Recursive Network for Camouflaged Object Detection
- Title(参考訳): MSRNet:カモフラージュオブジェクト検出のためのマルチスケール再帰ネットワーク
- Authors: Leena Alghamdi, Muhammad Usman, Hafeez Anwar, Abdul Bais, Saeed Anwar,
- Abstract要約: カモフラージュされたオブジェクト検出は、環境にシームレスに結合するオブジェクトの識別とセグメンテーションを必要とする、新しいコンピュータビジョンタスクである。
本稿では、ピラミッドビジョン変換器のバックボーンを介してマルチスケール特徴を抽出するマルチスケール再帰ネットワークを提案する。
より精密な物体検出のために、我々はマルチグラニュラリティ・フュージョン・ユニットを組み込むことで特徴を洗練する。
- 参考スコア(独自算出の注目度): 19.92307841724757
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camouflaged object detection is an emerging and challenging computer vision task that requires identifying and segmenting objects that blend seamlessly into their environments due to high similarity in color, texture, and size. This task is further complicated by low-light conditions, partial occlusion, small object size, intricate background patterns, and multiple objects. While many sophisticated methods have been proposed for this task, current methods still struggle to precisely detect camouflaged objects in complex scenarios, especially with small and multiple objects, indicating room for improvement. We propose a Multi-Scale Recursive Network that extracts multi-scale features via a Pyramid Vision Transformer backbone and combines them via specialized Attention-Based Scale Integration Units, enabling selective feature merging. For more precise object detection, our decoder recursively refines features by incorporating Multi-Granularity Fusion Units. A novel recursive-feedback decoding strategy is developed to enhance global context understanding, helping the model overcome the challenges in this task. By jointly leveraging multi-scale learning and recursive feature optimization, our proposed method achieves performance gains, successfully detecting small and multiple camouflaged objects. Our model achieves state-of-the-art results on two benchmark datasets for camouflaged object detection and ranks second on the remaining two. Our codes, model weights, and results are available at \href{https://github.com/linaagh98/MSRNet}{https://github.com/linaagh98/MSRNet}.
- Abstract(参考訳): カモフラージュされた物体検出は、色、テクスチャ、サイズに高い類似性があるため、環境にシームレスに溶け込んだ物体を識別し、セグメンテーションする必要がある、新しくて挑戦的なコンピュータビジョンタスクである。
このタスクは、低照度条件、部分閉塞、小さなオブジェクトサイズ、複雑な背景パターン、複数のオブジェクトによってさらに複雑になる。
このタスクには多くの高度な手法が提案されているが、現在の手法では複雑なシナリオ、特に小型で複数のオブジェクトにおいて、キャモフラージュされたオブジェクトを正確に検出することは困難であり、改善の余地があることを示している。
本稿では,Mraamid Vision Transformerのバックボーンを介してマルチスケール機能を抽出し,Attention-Based Scale Integration Unitsを介して組み合わせて,選択的機能マージを実現するマルチスケール再帰ネットワークを提案する。
より精密な物体検出のために,マルチグラニュラリティ・フュージョン・ユニットを組み込むことにより,デコーダは機能を再帰的に洗練する。
新たな再帰フィードバックデコーディング戦略が開発され、グローバルなコンテキスト理解が向上し、このタスクにおける課題を克服するのに役立つ。
マルチスケール学習と再帰的特徴最適化の併用により,提案手法は性能向上を実現し,小型かつ複数個のカモフラージュ対象の検出に成功している。
本モデルでは,キャモフラーグされた物体検出のための2つのベンチマークデータセットに対して,最先端の結果が得られ,残りの2つに次いで第2位にランク付けされる。
私たちのコード、モデルウェイト、結果は、 \href{https://github.com/linaagh98/MSRNet}{https://github.com/linaagh98/MSRNet}で公開されています。
関連論文リスト
- Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Camouflaged Object Detection with Feature Grafting and Distractor Aware [9.791590363932519]
そこで我々は,Camouflaged Object Detectionタスクを処理するために,FDNet(Feature Grafting and Distractor Aware Network)を提案する。
具体的には、CNNとTransformerを使ってマルチスケール画像を並列にエンコードする。
Distractor Aware Moduleは、CODタスクで考えられる2つの障害を明示的にモデル化して、粗いカモフラージュマップを洗練させるように設計されている。
論文 参考訳(メタデータ) (2023-07-08T09:37:08Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Dense Multiscale Feature Fusion Pyramid Networks for Object Detection in
UAV-Captured Images [0.09065034043031667]
本研究では,よりリッチな特徴を可能な限り得ることを目的とした,高密度多スケール特徴融合ピラミッドネットワーク(dmffpn)と呼ばれる新しい手法を提案する。
具体的には、密度の高い接続は、異なる畳み込み層からの表現を完全に活用するように設計されている。
VisDrone-DETと呼ばれるドローンベースのデータセットの実験は、我々の方法の競争力を示唆している。
論文 参考訳(メタデータ) (2020-12-19T10:05:31Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection [170.30694322460045]
我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
論文 参考訳(メタデータ) (2020-01-18T15:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。