論文の概要: SDDF: Specificity-Driven Dynamic Focusing for Open-Vocabulary Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2603.26109v1
- Date: Fri, 27 Mar 2026 06:37:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.377221
- Title: SDDF: Specificity-Driven Dynamic Focusing for Open-Vocabulary Camouflaged Object Detection
- Title(参考訳): SDDF:開語彙カモフラージュ物体検出のための特異性駆動動的焦点付け
- Authors: Jiaming Liang, Yifeng Zhan, Chunlin Liu, Weihua Zheng, Bingye Peng, Qiwei Liang, Boyang Cai, Xiaochun Mai, Qiang Nie,
- Abstract要約: Open-vocabulary Object Detection (OVOD) は、テキストプロンプトを活用することで、オープン世界の未知の物体や未知の物体を検出することを目的としている。
OVCOD-D という名前のベンチマークは、細かなテキスト記述で慎重に選択されたカモフラーグオブジェクトイメージを増補することで構成する。
オープンセット評価設定では,OVCOD-Dベンチマークで56.4のAPを達成する。
- 参考スコア(独自算出の注目度): 12.404050551208366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-vocabulary object detection (OVOD) aims to detect known and unknown objects in the open world by leveraging text prompts. Benefiting from the emergence of large-scale vision--language pre-trained models, OVOD has demonstrated strong zero-shot generalization capabilities. However, when dealing with camouflaged objects, the detector often fails to distinguish and localize objects because the visual features of the objects and the background are highly similar. To bridge this gap, we construct a benchmark named OVCOD-D by augmenting carefully selected camouflaged object images with fine-grained textual descriptions. Due to the limited scale of available camouflaged object datasets, we adopt detectors pre-trained on large-scale object detection datasets as our baseline methods, as they possess stronger zero-shot generalization ability. In the specificity-aware sub-descriptions generated by multimodal large models, there still exist confusing and overly decorative modifiers. To mitigate such interference, we design a sub-description principal component contrastive fusion strategy that reduces noisy textual components. Furthermore, to address the challenge that the visual features of camouflaged objects are highly similar to those of their surrounding environment, we propose a specificity-guided regional weak alignment and dynamic focusing method, which aims to strengthen the detector's ability to discriminate camouflaged objects from background. Under the open-set evaluation setting, the proposed method achieves an AP of 56.4 on the OVCOD-D benchmark.
- Abstract(参考訳): Open-vocabulary Object Detection (OVOD) は、テキストのプロンプトを利用して、オープン世界の未知の物体や未知の物体を検出することを目的としている。
OVODは、大規模視覚-言語事前訓練モデルの出現から恩恵を受け、強力なゼロショット一般化能力を示した。
しかし、カモフラージュされた物体を扱う場合、検出器はしばしば物体と背景の視覚的特徴が非常に似ているため、物体を識別し、位置決めすることができない。
このギャップを埋めるために、細かなテキスト記述で慎重に選択されたカモフラーグオブジェクトイメージを拡大することにより、OVCOD-Dというベンチマークを構築した。
カモフラージュされたオブジェクトデータセットが限られているため、我々は大規模なオブジェクト検出データセットを事前訓練した検出器をベースラインとして採用している。
マルチモーダルな大モデルによって生成される特異性を考慮したサブ記述では、混乱と過度に装飾的な修飾子が存在する。
このような干渉を軽減するために、ノイズの多いテキスト成分を減らすためのサブ記述主成分コントラスト融合戦略を設計する。
さらに, カモフラージュされた物体の視覚的特徴が周囲環境と非常によく似ているという課題に対処するため, カモフラージュされた物体を背景から識別する能力を強化することを目的とした, 特異性誘導型地域弱アライメントとダイナミックフォーカス手法を提案する。
オープンセット評価設定では,OVCOD-Dベンチマークで56.4のAPを達成する。
関連論文リスト
- Toward Realistic Camouflaged Object Detection: Benchmarks and Method [11.279532701331647]
カモフラージュされたオブジェクト検出(COD)は、主にセマンティックまたはインスタンスセグメンテーション手法に依存している。
カモフラージュ検出のためのCAFR(camouflage-aware feature refinement)戦略を提案する。
CAFRは、大型モデルの以前の知識の中で、現在の物体の明確な認識を十分に利用し、背景と前景の区別を深く理解する検出器を支援する。
論文 参考訳(メタデータ) (2025-01-13T13:04:00Z) - UN-DETR: Promoting Objectness Learning via Joint Supervision for Unknown Object Detection [6.837147490662261]
Unknown Object Detection (UOD) は、クローズドワールドの仮定によって制限された伝統的な検出パラダイムとは異なる、目に見えないカテゴリのオブジェクトを識別することを目的としている。
従来の手法では, 局所化情報と分類情報の両方から, 客観性学習のための監視信号が得られ, UODの性能は低下した。
そこで我々は,UN-DETRというトランスフォーマーをベースとした UOD フレームワークを提案し,それに基づいて IPS (Instance Presence Score) を作成し,オブジェクトの存在の確率を表す。
論文 参考訳(メタデータ) (2024-12-13T14:45:11Z) - OW-Rep: Open World Object Detection with Instance Representation Learning [1.8749305679160366]
Open World Object Detection (OWOD)は、見えないオブジェクトクラスが出現する現実的なシナリオに対処する。
OWODフレームワークを拡張して、未知のオブジェクトを共同で検出し、セマンティックにリッチなインスタンス埋め込みを学ぶ。
論文 参考訳(メタデータ) (2024-09-24T13:13:34Z) - Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。
近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。
本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-01T17:32:26Z) - Detecting Every Object from Events [24.58024539462497]
本稿では,イベントベースの視覚において,クラスに依存しない高速なオープンワールドオブジェクト検出を実現するためのアプローチとして,イベント中のすべてのオブジェクトの検出(DEOE)を提案する。
私たちのコードはhttps://github.com/Hatins/DEOEで公開されています。
論文 参考訳(メタデータ) (2024-04-08T08:20:53Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Scribble-based Boundary-aware Network for Weakly Supervised Salient
Object Detection in Remote Sensing Images [10.628932392896374]
スパース・スクリブル・アノテーションからリモートセンシング画像の正当性を予測するために,弱教師付きサルエント・オブジェクト検出フレームワークを提案する。
具体的には,高信頼度オブジェクト境界 (擬似) ラベルによって明示的に制御されるオブジェクト境界意味論を探索する境界対応モジュール (BAM) を設計する。
次に,境界セマンティクスを高次特徴と統合し,スクリブルラベルの監督下での健全な物体検出を誘導する。
論文 参考訳(メタデータ) (2022-02-07T20:32:21Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。