論文の概要: Few-shot Object Detection in Remote Sensing: Lifting the Curse of
Incompletely Annotated Novel Objects
- arxiv url: http://arxiv.org/abs/2309.10588v1
- Date: Tue, 19 Sep 2023 13:00:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 14:33:14.629779
- Title: Few-shot Object Detection in Remote Sensing: Lifting the Curse of
Incompletely Annotated Novel Objects
- Title(参考訳): リモートセンシングにおけるオブジェクト検出:不完全な注釈付きオブジェクトのカースをリフティングする
- Authors: Fahong Zhang, Yilei Shi, Zhitong Xiong, and Xiao Xiang Zhu
- Abstract要約: 物体検出のための自己学習型FSOD (ST-FSOD) アプローチを提案する。
提案手法は,様々なFSOD設定における最先端性能を大きなマージンで向上させる。
- 参考スコア(独自算出の注目度): 23.171410277239534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection is an essential and fundamental task in computer vision and
satellite image processing. Existing deep learning methods have achieved
impressive performance thanks to the availability of large-scale annotated
datasets. Yet, in real-world applications the availability of labels is
limited. In this context, few-shot object detection (FSOD) has emerged as a
promising direction, which aims at enabling the model to detect novel objects
with only few of them annotated. However, many existing FSOD algorithms
overlook a critical issue: when an input image contains multiple novel objects
and only a subset of them are annotated, the unlabeled objects will be
considered as background during training. This can cause confusions and
severely impact the model's ability to recall novel objects. To address this
issue, we propose a self-training-based FSOD (ST-FSOD) approach, which
incorporates the self-training mechanism into the few-shot fine-tuning process.
ST-FSOD aims to enable the discovery of novel objects that are not annotated,
and take them into account during training. On the one hand, we devise a
two-branch region proposal networks (RPN) to separate the proposal extraction
of base and novel objects, On another hand, we incorporate the student-teacher
mechanism into RPN and the region of interest (RoI) head to include those
highly confident yet unlabeled targets as pseudo labels. Experimental results
demonstrate that our proposed method outperforms the state-of-the-art in
various FSOD settings by a large margin. The codes will be publicly available
at https://github.com/zhu-xlab/ST-FSOD.
- Abstract(参考訳): 物体検出はコンピュータビジョンと衛星画像処理において必須かつ基本的な課題である。
既存のディープラーニング手法は、大規模な注釈付きデータセットが利用可能になったことで、目覚ましいパフォーマンスを達成した。
しかし、現実のアプリケーションではラベルの可用性は限られている。
この文脈では、少数ショットオブジェクト検出(FSOD)が有望な方向として現れ、このモデルが新規オブジェクトを注釈付きで検出することを目的としている。
しかし、既存のfsodアルゴリズムの多くは、重要な問題を見逃している。入力画像が複数の新しいオブジェクトを含み、そのサブセットのみが注釈付けされている場合、ラベルのないオブジェクトはトレーニング中に背景とみなされる。
これは混乱を引き起こし、モデルが新しいオブジェクトを思い出す能力に深刻な影響を与える可能性がある。
この問題に対処するために, 自己学習機構を組み込んだ FSOD (Self-training-based FSOD) アプローチを提案する。
ST-FSODは、注釈のない新しい物体の発見を可能にすることを目的としており、訓練中にそれらを考慮に入れている。
一方で,ベースと新規オブジェクトの抽出提案を分離する2分岐領域提案ネットワーク(rpn)を考案する一方で,学生教師機構をrpnと関心領域(roi)ヘッドに組み込んで,信頼度の高い非ラベル対象を疑似ラベルとして含める。
実験の結果,提案手法は様々なfsod設定における最先端技術よりも大きなマージンを持つことがわかった。
コードはhttps://github.com/zhu-xlab/ST-FSOD.comで公開されている。
関連論文リスト
- Few-shot Oriented Object Detection with Memorable Contrastive Learning in Remote Sensing Images [11.217630579076237]
リモートセンシングの分野では、FSOD(Few-shot Object Detection)が注目されている。
本稿では,Few-shot Oriented Object Detection with Memorable Contrastive Learning (FOMC) という,リモートセンシングのための新しいFSOD法を提案する。
具体的には、従来の水平有界ボックスの代わりに指向的有界ボックスを用いて、任意指向の空中オブジェクトのより優れた特徴表現を学習する。
論文 参考訳(メタデータ) (2024-03-20T08:15:18Z) - ECEA: Extensible Co-Existing Attention for Few-Shot Object Detection [52.16237548064387]
Few-shot Object Detection (FSOD) は、非常に少数のアノテーション付きサンプルからオブジェクトを識別する。
近年のFSOD法の多くは、2段階の学習パラダイムを適用しており、このパラダイムは豊富なベースクラスから学んだ知識を、グローバルな特徴を学習することで、数発の検知を補助する。
本研究では,局所的な部分に応じて大域的オブジェクトを推論するための拡張可能共存注意(ECEA)モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-15T06:55:43Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Identification of Novel Classes for Improving Few-Shot Object Detection [12.013345715187285]
Few-shot Object Detection (FSOD) メソッドは、クラス毎に少数のトレーニングサンプルのみを使用して、堅牢なオブジェクト検出を実現することで、改善を提供する。
我々は、FSOD性能を向上させるためのトレーニング中に、未ラベルの新規物体を正のサンプルとして検出し、利用するための半教師付きアルゴリズムを開発した。
実験の結果,本手法は既存のSOTA FSOD法よりも有効であり,優れた結果が得られた。
論文 参考訳(メタデータ) (2023-03-18T14:12:52Z) - Open-Set Object Detection Using Classification-free Object Proposal and
Instance-level Contrastive Learning [25.935629339091697]
オープンセットオブジェクト検出(OSOD)は、オブジェクトと背景分離、オープンセットオブジェクト分類という2つのサブタスクからなる問題を処理するための有望な方向である。
我々は,OSODの課題に対処するため,Openset RCNNを提案する。
我々のOpenset RCNNは、散らばった環境下でロボットの並べ替えタスクをサポートするオープンセットの知覚能力でロボットを支援できることを示します。
論文 参考訳(メタデータ) (2022-11-21T15:00:04Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z) - Exploring Bottom-up and Top-down Cues with Attentive Learning for Webly
Supervised Object Detection [76.9756607002489]
本稿では,新しいクラスを対象としたWebSOD法を提案する。
提案手法はボトムアップとトップダウンを組み合わせた新しいクラス検出手法である。
提案手法は,3種類の新規/ベース分割を持つPASCAL VOCデータセット上で実証した。
論文 参考訳(メタデータ) (2020-03-22T03:11:24Z) - Progressive Object Transfer Detection [84.48927705173494]
本稿では,新しいプログレッシブオブジェクト転送検出(POTD)フレームワークを提案する。
第一に、POTDは様々なドメインの様々なオブジェクトを効果的にプログレッシブな検出手順に活用することができる。
第2に、POTDは2つの微妙な転送段階、すなわち、LSTD(low-Shot Transfer Detection)とWSTD(Weakly Supervised Transfer Detection)から構成される。
論文 参考訳(メタデータ) (2020-02-12T00:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。