論文の概要: MCOD: The First Challenging Benchmark for Multispectral Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2509.15753v1
- Date: Fri, 19 Sep 2025 08:29:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.079172
- Title: MCOD: The First Challenging Benchmark for Multispectral Camouflaged Object Detection
- Title(参考訳): MCOD:マルチスペクトルカモフラージュ物体検出のための最初のベンチマーク
- Authors: Yang Li, Tingfa Xu, Shuyan Bai, Peifu Liu, Jianan Li,
- Abstract要約: Camouflaged Object Detection (COD)は、自然界にシームレスに溶け込む物体を識別することを目的としている。
既存のCODベンチマークデータセットはRGBベースであり、マルチスペクトルアプローチに不可欠なサポートがない。
マルチスペクトルカモフラージュオブジェクト検出のために特別に設計された、最初の挑戦的なベンチマークデータセットであるMCODを紹介する。
- 参考スコア(独自算出の注目度): 26.760763912987795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camouflaged Object Detection (COD) aims to identify objects that blend seamlessly into natural scenes. Although RGB-based methods have advanced, their performance remains limited under challenging conditions. Multispectral imagery, providing rich spectral information, offers a promising alternative for enhanced foreground-background discrimination. However, existing COD benchmark datasets are exclusively RGB-based, lacking essential support for multispectral approaches, which has impeded progress in this area. To address this gap, we introduce MCOD, the first challenging benchmark dataset specifically designed for multispectral camouflaged object detection. MCOD features three key advantages: (i) Comprehensive challenge attributes: It captures real-world difficulties such as small object sizes and extreme lighting conditions commonly encountered in COD tasks. (ii) Diverse real-world scenarios: The dataset spans a wide range of natural environments to better reflect practical applications. (iii) High-quality pixel-level annotations: Each image is manually annotated with precise object masks and corresponding challenge attribute labels. We benchmark eleven representative COD methods on MCOD, observing a consistent performance drop due to increased task difficulty. Notably, integrating multispectral modalities substantially alleviates this degradation, highlighting the value of spectral information in enhancing detection robustness. We anticipate MCOD will provide a strong foundation for future research in multispectral camouflaged object detection. The dataset is publicly accessible at https://github.com/yl2900260-bit/MCOD.
- Abstract(参考訳): Camouflaged Object Detection (COD)は、自然界にシームレスに溶け込む物体を識別することを目的としている。
RGBベースの手法は進歩しているが、その性能は依然として困難な条件下で制限されている。
豊富なスペクトル情報を提供するマルチスペクトル画像は、フォアグラウンド-バックグラウンド識別を強化するための有望な代替手段を提供する。
しかし、既存のCODベンチマークデータセットはRGBベースであり、マルチスペクトルアプローチを必須サポートしていないため、この分野の進歩を妨げている。
このギャップに対処するために、マルチスペクトルカモフラージュされたオブジェクト検出のために特別に設計された、最初の挑戦的なベンチマークデータセットMCODを導入する。
MCODには3つの利点がある。
(i)CODタスクでよく見られる小さな物体の大きさや極端な照明条件などの現実の難しさを捉えた総合的課題属性。
(ii) 異種現実シナリオ: このデータセットは、実用的な応用をよりよく反映するために、幅広い自然環境にまたがる。
(iii)高品質なピクセルレベルのアノテーション:各画像に正確なオブジェクトマスクと対応するチャレンジ属性ラベルを手動でアノテートする。
MCODで11種類のCOD法をベンチマークし,タスク難易度の増加による一貫した性能低下を観察した。
特に、多重スペクトルのモジュラリティの統合は、この劣化を著しく軽減し、検出ロバスト性を高めるためのスペクトル情報の価値を強調している。
我々は,MCODが多スペクトルカモフラージュ物体検出における将来の研究の強力な基盤となることを期待する。
データセットはhttps://github.com/yl2900260-bit/MCODで公開されている。
関連論文リスト
- PLOT: Pseudo-Labeling via Video Object Tracking for Scalable Monocular 3D Object Detection [35.524943073010675]
モノクロ3Dオブジェクト検出(M3OD)は、高アノテーションコストと固有の2Dから3Dの曖昧さに起因するデータの不足により、長年にわたって課題に直面してきた。
ビデオデータのみを使用し、マルチビュー設定、追加センサー、カメラポーズ、ドメイン固有のトレーニングを必要とせず、より堅牢な疑似ラベルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-03T07:46:39Z) - AuxDet: Auxiliary Metadata Matters for Omni-Domain Infrared Small Target Detection [58.67129770371016]
シーン認識最適化のためのテキストメタデータを組み込むことにより、IRSTDパラダイムを再定義する新しいIRSTDフレームワークを提案する。
AuxDetは最先端の手法を一貫して上回り、堅牢性と正確性を改善する上で補助情報の重要な役割を検証している。
論文 参考訳(メタデータ) (2025-05-21T07:02:05Z) - Real-IAD D3: A Real-World 2D/Pseudo-3D/3D Dataset for Industrial Anomaly Detection [53.2590751089607]
Real-IAD D3は高精度なマルチモーダルデータセットであり、フォトメトリックステレオによって生成された擬似3Dモダリティが組み込まれている。
本稿では,RGB,点雲,擬似3次元深度情報を統合し,各モードの相補的強度を活用する効果的な手法を提案する。
本実験は,検出の堅牢性向上とIAD全体の性能向上におけるこれらのモダリティの重要性を強調した。
論文 参考訳(メタデータ) (2025-04-19T08:05:47Z) - HSOD-BIT-V2: A New Challenging Benchmarkfor Hyperspectral Salient Object Detection [12.1018751772293]
HSOD-BIT-V2は,これまでで最大かつ最も困難なHSODベンチマークデータセットである。
我々は高分解能HSODネットワークであるHyper-HRNetを提案する。
有効スペクトル情報を抽出し、統合し、保存し、自己相似スペクトルの特徴を捉え、次元性を減少させる。
詳細な詳細を伝達し、包括的グローバル情報と詳細なオブジェクト塩分表現を組み込むことで、オブジェクトの輪郭を正確に特定する。
論文 参考訳(メタデータ) (2025-03-18T05:09:42Z) - Toward Realistic Camouflaged Object Detection: Benchmarks and Method [11.279532701331647]
カモフラージュされたオブジェクト検出(COD)は、主にセマンティックまたはインスタンスセグメンテーション手法に依存している。
カモフラージュ検出のためのCAFR(camouflage-aware feature refinement)戦略を提案する。
CAFRは、大型モデルの以前の知識の中で、現在の物体の明確な認識を十分に利用し、背景と前景の区別を深く理解する検出器を支援する。
論文 参考訳(メタデータ) (2025-01-13T13:04:00Z) - Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。
モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。
本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-27T12:18:39Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。