論文の概要: Object Detection in Aerial Images in Scarce Data Regimes
- arxiv url: http://arxiv.org/abs/2310.10433v1
- Date: Mon, 16 Oct 2023 14:16:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 13:56:53.266988
- Title: Object Detection in Aerial Images in Scarce Data Regimes
- Title(参考訳): スカースデータレジームにおける空中画像中の物体検出
- Authors: Pierre Le Jeune
- Abstract要約: 小さな物体は、より多数の空中画像において、自然画像と空中画像の間の明らかなパフォーマンスギャップの原因となっている。
FSOD法の訓練と評価を改善するスケール適応型ボックス類似度基準を提案する。
また、計量学習と微調整に基づく2つの異なるアプローチによる汎用FSODにも貢献する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most contributions on Few-Shot Object Detection (FSOD) evaluate their methods
on natural images only, yet the transferability of the announced performance is
not guaranteed for applications on other kinds of images. We demonstrate this
with an in-depth analysis of existing FSOD methods on aerial images and
observed a large performance gap compared to natural images. Small objects,
more numerous in aerial images, are the cause for the apparent performance gap
between natural and aerial images. As a consequence, we improve FSOD
performance on small objects with a carefully designed attention mechanism. In
addition, we also propose a scale-adaptive box similarity criterion, that
improves the training and evaluation of FSOD methods, particularly for small
objects. We also contribute to generic FSOD with two distinct approaches based
on metric learning and fine-tuning. Impressive results are achieved with the
fine-tuning method, which encourages tackling more complex scenarios such as
Cross-Domain FSOD. We conduct preliminary experiments in this direction and
obtain promising results. Finally, we address the deployment of the detection
models inside COSE's systems. Detection must be done in real-time in extremely
large images (more than 100 megapixels), with limited computation power.
Leveraging existing optimization tools such as TensorRT, we successfully tackle
this engineering challenge.
- Abstract(参考訳): Few-Shot Object Detection (FSOD) におけるほとんどのコントリビューションは、自然画像のみに対するメソッドの評価を行っているが、他の種類の画像に対するアプリケーションに対して、発表されたパフォーマンスの転送性は保証されていない。
航空画像における既存のfsod法を詳細に分析し,自然画像と比較して大きな性能ギャップを観測した。
航空画像に多く見られる小型物体は、自然画像と空中画像の明らかな性能差の原因となっている。
その結果,小物体のfsod性能を注意深く設計した注意機構により改善する。
また,FSOD法,特に小型オブジェクトの訓練と評価を改善するスケール適応型ボックス類似度基準を提案する。
また、計量学習と微調整に基づく2つの異なるアプローチによる汎用FSODにも貢献する。
印象的な結果は、クロスドメインFSODのようなより複雑なシナリオに取り組むための微調整手法によって達成される。
この方向に予備実験を行い、有望な結果を得る。
最後に,COSEシステム内における検出モデルの展開について述べる。
検出は、計算能力に制限のある非常に大きな画像(100メガピクセル以上)でリアルタイムに行う必要がある。
TensorRTのような既存の最適化ツールを活用することで、このエンジニアリング課題にうまく取り組みました。
関連論文リスト
- SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients [0.8873228457453465]
空中画像における小さな物体検出は、コンピュータビジョンにおいて重要な課題である。
トランスフォーマーベースのモデルを用いた従来の手法は、特殊データベースの欠如に起因する制限に直面していることが多い。
本稿では,小型空中物体の検出とセグメンテーション機能を大幅に向上する2つの革新的なアプローチを紹介する。
論文 参考訳(メタデータ) (2024-05-02T19:47:08Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Transformation-Invariant Network for Few-Shot Object Detection in Remote
Sensing Images [15.251042369061024]
FSOD(Few-shot Object Detection)は、トレーニングのために大量のラベル付きデータを頼りにしている。
リモートセンシング画像におけるオブジェクトのスケールと向きのバリエーションは、既存のFSOD法に重大な課題をもたらす。
特徴ピラミッドネットワークの統合と,クエリ機能向上のためのプロトタイプ機能の利用を提案する。
論文 参考訳(メタデータ) (2023-03-13T02:21:38Z) - A Comparative Attention Framework for Better Few-Shot Object Detection
on Aerial Images [2.292003207440126]
Few-Shot Object Detection (FSOD) 法は主に自然画像データセットに基づいて設計・評価されている。
自然画像の最良の方法が空中画像の最良の方法であるかどうかは不明だ。
本稿では,アテンションベースのFSOD手法の実装と比較を行うフレキシブルな環境を提供するベンチマークフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-25T11:20:31Z) - ARUBA: An Architecture-Agnostic Balanced Loss for Aerial Object
Detection [24.085715205081385]
我々は、オブジェクトのサイズを画像中の画素数、サイズ不均衡として、データセット内の特定のサイズのオブジェクトの過剰表現として表現する。
本稿では,任意のオブジェクト検出モデル上にプラグインとして適用可能な,新しいARchitectUre-Agnostic BAlanced Loss (ARUBA)を提案する。
論文 参考訳(メタデータ) (2022-10-10T11:28:16Z) - Learning Efficient Representations for Enhanced Object Detection on
Large-scene SAR Images [16.602738933183865]
SAR(Synthetic Aperture Radar)画像のターゲットの検出と認識は難しい問題である。
近年開発されたディープラーニングアルゴリズムは,SAR画像の固有の特徴を自動的に学習することができる。
本稿では,効率的かつ堅牢なディープラーニングに基づくターゲット検出手法を提案する。
論文 参考訳(メタデータ) (2022-01-22T03:25:24Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - DeepEMD: Differentiable Earth Mover's Distance for Few-Shot Learning [122.51237307910878]
我々は,画像領域間の最適なマッチングの新しい視点から,少数ショット画像分類法を開発した。
我々は、高密度画像表現間の構造距離を計算するために、Earth Mover's Distance (EMD) を用いている。
定式化において重要な要素の重みを生成するために,我々は相互参照機構を設計する。
論文 参考訳(メタデータ) (2020-03-15T08:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。