論文の概要: Experience feedback using Representation Learning for Few-Shot Object
Detection on Aerial Images
- arxiv url: http://arxiv.org/abs/2109.13027v1
- Date: Mon, 27 Sep 2021 13:04:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 22:30:16.141361
- Title: Experience feedback using Representation Learning for Few-Shot Object
Detection on Aerial Images
- Title(参考訳): 航空画像における少数撮影物体検出のための表現学習を用いた経験フィードバック
- Authors: Pierre Le Jeune, Mustapha Lebbah, Anissa Mokraoui, Hanene Azzag
- Abstract要約: 大規模なリモートセンシング画像データセットであるDOTAを用いて,本手法の性能評価を行った。
特に、数発のオブジェクト検出タスクの固有の弱点を強調します。
- 参考スコア(独自算出の注目度): 2.8560476609689185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a few-shot method based on Faster R-CNN and
representation learning for object detection in aerial images. The two
classification branches of Faster R-CNN are replaced by prototypical networks
for online adaptation to new classes. These networks produce embeddings vectors
for each generated box, which are then compared with class prototypes. The
distance between an embedding and a prototype determines the corresponding
classification score. The resulting networks are trained in an episodic manner.
A new detection task is randomly sampled at each epoch, consisting in detecting
only a subset of the classes annotated in the dataset. This training strategy
encourages the network to adapt to new classes as it would at test time. In
addition, several ideas are explored to improve the proposed method such as a
hard negative examples mining strategy and self-supervised clustering for
background objects. The performance of our method is assessed on DOTA, a
large-scale remote sensing images dataset. The experiments conducted provide a
broader understanding of the capabilities of representation learning. It
highlights in particular some intrinsic weaknesses for the few-shot object
detection task. Finally, some suggestions and perspectives are formulated
according to these insights.
- Abstract(参考訳): 本稿では,高速なR-CNNと空中画像における物体検出のための表現学習に基づく数ショット手法を提案する。
Faster R-CNNの2つの分類分野は、新しいクラスへのオンライン適応のために、プロトタイプネットワークに置き換えられる。
これらのネットワークは生成されたボックスごとに埋め込みベクトルを生成し、クラスプロトタイプと比較する。
埋め込みとプロトタイプの間の距離は、対応する分類スコアを決定する。
得られたネットワークは、エピソディックな方法で訓練される。
新しい検出タスクは各エポックでランダムにサンプリングされ、データセットに注釈付けされたクラスのサブセットのみを検出する。
このトレーニング戦略は、テスト時に、ネットワークが新しいクラスに適応するように促します。
さらに,提案手法を改善するために,難解なサンプルマイニング戦略やバックグラウンドオブジェクトの自己教師付きクラスタリングなど,いくつかのアイデアが検討されている。
提案手法の性能は,大規模リモートセンシング画像データセットであるdotaを用いて評価する。
実験は、表現学習の能力に関するより広範な理解を提供する。
特に、数発のオブジェクト検出タスクの固有の弱点を強調します。
最後に、これらの洞察に基づいていくつかの提案と視点が定式化される。
関連論文リスト
- Joint Neural Networks for One-shot Object Recognition and Detection [5.389851588398047]
本稿では,一発物体の認識と検出に難渋する課題に対処する,新しい結合ニューラルネットワーク手法を提案する。
Siameseのニューラルネットワークと最先端のマルチボックス検出アプローチにインスパイアされたジョイントニューラルネットワークは、トレーニングプロセス中に見つからないカテゴリのオブジェクト認識と検出を行うことができる。
提案手法は,MiniImageNetデータセット上での1ショットオブジェクト認識における61.41%の精度と,データセット上でトレーニングしてテストした場合の1ショットオブジェクト検出における47.1%のmAPを実現する。
論文 参考訳(メタデータ) (2024-08-01T16:48:03Z) - Exploring Robust Features for Few-Shot Object Detection in Satellite
Imagery [17.156864650143678]
従来の2段階アーキテクチャに基づく数発の物体検出器を開発した。
大規模な事前訓練モデルを使用して、クラス参照の埋め込みやプロトタイプを構築する。
課題と稀なオブジェクトを含む2つのリモートセンシングデータセットの評価を行う。
論文 参考訳(メタデータ) (2024-03-08T15:20:27Z) - Identification of Novel Classes for Improving Few-Shot Object Detection [12.013345715187285]
Few-shot Object Detection (FSOD) メソッドは、クラス毎に少数のトレーニングサンプルのみを使用して、堅牢なオブジェクト検出を実現することで、改善を提供する。
我々は、FSOD性能を向上させるためのトレーニング中に、未ラベルの新規物体を正のサンプルとして検出し、利用するための半教師付きアルゴリズムを開発した。
実験の結果,本手法は既存のSOTA FSOD法よりも有効であり,優れた結果が得られた。
論文 参考訳(メタデータ) (2023-03-18T14:12:52Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with
Attentive Feature Alignment [33.446875089255876]
Few-shot Object Detection (FSOD) は、少数の例でオブジェクトを検出することを目的としている。
本稿では,データ不足ベースクラスから学習したメタ知識を新しいクラスに転送することで,メタラーニングに基づくマイショットオブジェクト検出手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T19:01:27Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Restoring Negative Information in Few-Shot Object Detection [27.876368807936732]
近年,ディープラーニング分野における新たな課題として,ショット学習が登場している。
本稿では, 否定的, 肯定的, 肯定的, 肯定的, 否定的, 肯定的, 肯定的, 否定的, 肯定的となる新しい推論手法を提案する。
提案手法は,最先端の複数ショット検出ソリューションを大幅に改善する。
論文 参考訳(メタデータ) (2020-10-22T13:39:48Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Exploring Bottom-up and Top-down Cues with Attentive Learning for Webly
Supervised Object Detection [76.9756607002489]
本稿では,新しいクラスを対象としたWebSOD法を提案する。
提案手法はボトムアップとトップダウンを組み合わせた新しいクラス検出手法である。
提案手法は,3種類の新規/ベース分割を持つPASCAL VOCデータセット上で実証した。
論文 参考訳(メタデータ) (2020-03-22T03:11:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。