論文の概要: Zero-Shot Aerial Object Detection with Visual Description Regularization
- arxiv url: http://arxiv.org/abs/2402.18233v1
- Date: Wed, 28 Feb 2024 10:58:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 15:25:53.920620
- Title: Zero-Shot Aerial Object Detection with Visual Description Regularization
- Title(参考訳): 視覚記述規則化によるゼロショット空中物体検出
- Authors: Zhengqing Zang, Chenyu Lin, Chenwei Tang, Tao Wang, Jiancheng Lv
- Abstract要約: 本稿では,視覚的記述規則化(DescReg)と呼ばれる空中物体検出のためのゼロショット手法を提案する。
航空物体の弱い意味的・視覚的相関を同定し,その視覚的外観を事前に記述した上で,課題に対処することを目的とする。
我々は、DIOR、xView、DOTAを含む3つの挑戦的空中物体検出データセットを用いて、広範囲にわたる実験を行った。
- 参考スコア(独自算出の注目度): 15.14310599469107
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing object detection models are mainly trained on large-scale labeled
datasets. However, annotating data for novel aerial object classes is expensive
since it is time-consuming and may require expert knowledge. Thus, it is
desirable to study label-efficient object detection methods on aerial images.
In this work, we propose a zero-shot method for aerial object detection named
visual Description Regularization, or DescReg. Concretely, we identify the weak
semantic-visual correlation of the aerial objects and aim to address the
challenge with prior descriptions of their visual appearance. Instead of
directly encoding the descriptions into class embedding space which suffers
from the representation gap problem, we propose to infuse the prior inter-class
visual similarity conveyed in the descriptions into the embedding learning. The
infusion process is accomplished with a newly designed similarity-aware triplet
loss which incorporates structured regularization on the representation space.
We conduct extensive experiments with three challenging aerial object detection
datasets, including DIOR, xView, and DOTA. The results demonstrate that DescReg
significantly outperforms the state-of-the-art ZSD methods with complex
projection designs and generative frameworks, e.g., DescReg outperforms best
reported ZSD method on DIOR by 4.5 mAP on unseen classes and 8.1 in HM. We
further show the generalizability of DescReg by integrating it into generative
ZSD methods as well as varying the detection architecture.
- Abstract(参考訳): 既存のオブジェクト検出モデルは、主に大規模なラベル付きデータセットでトレーニングされる。
しかし,新しい空域オブジェクトのアノテーションは時間を要するため,専門家の知識を必要とする可能性がある。
したがって, 航空画像上でのラベル効率の高い物体検出手法を検討することが望ましい。
本研究では,視覚的記述規則化(DescReg)と呼ばれる空中物体検出のためのゼロショット手法を提案する。
具体的には、航空物体の弱い意味的・視覚的相関を識別し、その視覚的外観の事前記述による課題に対処することを目的とする。
表現ギャップ問題に苦しむクラス埋め込み空間に記述を直接エンコードするのではなく,記述に伝達されるクラス間の視覚的類似性を埋め込み学習に注入することを提案する。
注入プロセスは、表現空間上の構造化正規化を含む、新たに設計された類似性を考慮した三重項損失によって達成される。
我々は、dior、xview、dotaを含む3つの挑戦的な空中物体検出データセットを用いて広範囲な実験を行う。
その結果、DescRegは複雑なプロジェクション設計や生成フレームワークで最先端のZSDメソッドよりも優れており、例えば、DescRegはDIOR上で4.5mAP、HMでは8.1のZSDメソッドよりも優れていた。
さらに,descregを生成型zsd法に統合し,検出アーキテクチャを変化させることで,その一般化可能性を示す。
関連論文リスト
- InfRS: Incremental Few-Shot Object Detection in Remote Sensing Images [11.916941756499435]
本稿では,リモートセンシング画像におけるインクリメンタルな数ショット物体検出の複雑な課題について検討する。
本稿では,新しい授業の漸進的な学習を促進するために,InfRSと呼ばれる先駆的な微調整技術を導入する。
我々はワッサーシュタイン距離に基づく原型校正戦略を開発し、破滅的な忘れ問題を軽減する。
論文 参考訳(メタデータ) (2024-05-18T13:39:50Z) - Few-shot Oriented Object Detection with Memorable Contrastive Learning in Remote Sensing Images [11.217630579076237]
リモートセンシングの分野では、FSOD(Few-shot Object Detection)が注目されている。
本稿では,Few-shot Oriented Object Detection with Memorable Contrastive Learning (FOMC) という,リモートセンシングのための新しいFSOD法を提案する。
具体的には、従来の水平有界ボックスの代わりに指向的有界ボックスを用いて、任意指向の空中オブジェクトのより優れた特徴表現を学習する。
論文 参考訳(メタデータ) (2024-03-20T08:15:18Z) - Exploring Robust Features for Few-Shot Object Detection in Satellite
Imagery [17.156864650143678]
従来の2段階アーキテクチャに基づく数発の物体検出器を開発した。
大規模な事前訓練モデルを使用して、クラス参照の埋め込みやプロトタイプを構築する。
課題と稀なオブジェクトを含む2つのリモートセンシングデータセットの評価を行う。
論文 参考訳(メタデータ) (2024-03-08T15:20:27Z) - Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Transformation-Invariant Network for Few-Shot Object Detection in Remote
Sensing Images [15.251042369061024]
FSOD(Few-shot Object Detection)は、トレーニングのために大量のラベル付きデータを頼りにしている。
リモートセンシング画像におけるオブジェクトのスケールと向きのバリエーションは、既存のFSOD法に重大な課題をもたらす。
特徴ピラミッドネットワークの統合と,クエリ機能向上のためのプロトタイプ機能の利用を提案する。
論文 参考訳(メタデータ) (2023-03-13T02:21:38Z) - Knowledge Distillation for Oriented Object Detection on Aerial Images [1.827510863075184]
本稿では,KD-RNetの知識蒸留による空中画像の回転物体検出のためのモデル圧縮手法を提案する。
大規模空中物体検出データセット(DOTA)による実験結果から,提案したKD-RNetモデルにより,パラメータ数を削減した平均値精度(mAP)が向上し,同時にKD-RNetは,基底アノテーションと高い重なり合う高品質検出を提供することで,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T14:24:16Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。