論文の概要: Weakly-semi-supervised object detection in remotely sensed imagery
- arxiv url: http://arxiv.org/abs/2311.17449v1
- Date: Wed, 29 Nov 2023 08:43:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 22:05:07.226703
- Title: Weakly-semi-supervised object detection in remotely sensed imagery
- Title(参考訳): リモートセンシング画像における弱半教師対象検出
- Authors: Ji Hun Wang, Jeremy Irvin, Beri Kohen Behar, Ha Tran, Raghav
Samavedam, Quentin Hsu, Andrew Y. Ng
- Abstract要約: リモートセンシング画像を用いた弱半教師付き物体検出(WSSOD)モデルを構築した。
我々は,FAIR1Mのバウンディングボックスラベル画像と風車検出データセットを用いて,大量の点ラベル付き画像を使用するWSSODモデルを訓練する。
2-10倍少ない境界ボックスラベル付き画像でトレーニングされたWSSODモデルは、フルセットの有界ボックスラベル付き画像でトレーニングされた完全教師付きモデルと同様に、または性能が良くなることがわかった。
- 参考スコア(独自算出の注目度): 2.7464980644644386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning for detecting objects in remotely sensed imagery can enable new
technologies for important applications including mitigating climate change.
However, these models often require large datasets labeled with bounding box
annotations which are expensive to curate, prohibiting the development of
models for new tasks and geographies. To address this challenge, we develop
weakly-semi-supervised object detection (WSSOD) models on remotely sensed
imagery which can leverage a small amount of bounding boxes together with a
large amount of point labels that are easy to acquire at scale in geospatial
data. We train WSSOD models which use large amounts of point-labeled images
with varying fractions of bounding box labeled images in FAIR1M and a wind
turbine detection dataset, and demonstrate that they substantially outperform
fully supervised models trained with the same amount of bounding box labeled
images on both datasets. Furthermore, we find that the WSSOD models trained
with 2-10x fewer bounding box labeled images can perform similarly to or
outperform fully supervised models trained on the full set of bounding-box
labeled images. We believe that the approach can be extended to other remote
sensing tasks to reduce reliance on bounding box labels and increase
development of models for impactful applications.
- Abstract(参考訳): リモートセンシング画像における物体検出のためのディープラーニングは、気候変動の緩和を含む重要な応用のための新しい技術を可能にする。
しかしながら、これらのモデルは、しばしば、新しいタスクや地理のためのモデルの開発を禁止し、キュレートするのに高価なバウンディングボックスアノテーションでラベル付けされた大きなデータセットを必要とする。
この課題に対処するため,地理空間データの大規模取得が容易な大量の点ラベルとともに,少数の境界ボックスを活用可能なリモートセンシング画像を用いた弱半教師付き物体検出(WSSOD)モデルを開発した。
我々は,fair1mと風力タービン検出データセットで,境界ボックスラベル付き画像の比率が異なる,多量の点ラベル付き画像を使用するwssodモデルを訓練し,両者のデータセットで同じ量の境界ボックスラベル付き画像でトレーニングされた完全教師付きモデルを大幅に上回ることを示す。
さらに,2~10倍少ない境界ボックスラベル付き画像でトレーニングしたWSSODモデルは,フルセットの有界ボックスラベル付き画像でトレーニングした完全教師付きモデルと同等あるいは優れることがわかった。
このアプローチは他のリモートセンシングタスクにも拡張でき、バウンディングボックスラベルへの依存を減らし、影響のあるアプリケーションのためのモデルの開発を拡大できると考えています。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - NBBOX: Noisy Bounding Box Improves Remote Sensing Object Detection [11.564184330068775]
本文では,リモートセンシング物体検出のための拡張,回転,翻訳の観点から,境界ボックス変換の徹底的な検討を行う。
DOTAとDIOR-Rはどちらもよく知られたデータセットであり、空中画像に様々な回転するジェネリックオブジェクトを含む。
実験結果から,提案手法はホイッスルやベルを使わずにリモートセンシング対象の検出を大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-09-14T12:25:14Z) - Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - Multi-View Unsupervised Image Generation with Cross Attention Guidance [23.07929124170851]
本稿では,単一カテゴリデータセット上でのポーズ条件拡散モデルの教師なし学習のための新しいパイプラインを提案する。
特定のオブジェクト部分の可視性と位置を比較することで、データセットをクラスタリングすることで、オブジェクトのポーズを識別する。
我々のモデルであるMIRAGEは、実画像における新しいビュー合成における先行研究を超越している。
論文 参考訳(メタデータ) (2023-12-07T14:55:13Z) - SSMG: Spatial-Semantic Map Guided Diffusion Model for Free-form
Layout-to-Image Generation [68.42476385214785]
本稿では,レイアウトから派生した特徴写像を用いた空間意味マップガイド(SSMG)拡散モデルを提案する。
SSMGは,従来の研究に比べて空間的,意味的な制御性に優れた生成品質を実現する。
また,RSA(Relation-Sensitive Attention)機構とLSA(Location-Sensitive Attention)機構を提案する。
論文 参考訳(メタデータ) (2023-08-20T04:09:12Z) - Density Crop-guided Semi-supervised Object Detection in Aerial Images [12.944309759825902]
空中画像における物体検出のための密度作物誘導半監視検出器を提案する。
トレーニング中、ラベル付き画像とラベルなし画像から識別されたクラスタの画像作物を使用してトレーニングセットを増強する。
推論中、検出器は興味のある物体を検出できるが、小さな物体の密度が高い領域も検出できる。
論文 参考訳(メタデータ) (2023-08-09T15:59:42Z) - Controllable Image Generation via Collage Representations [31.456445433105415]
ミラー・アンド・マッチングシーン(M&Ms)とは、コラージュ内の異なる要素の外観的特徴と空間的位置を条件とした、逆向きに訓練された生成画像モデルからなるアプローチである。
M&Mは、画質とサンプルの多様性の点で非常に競争力がありながら、きめ細かなシーン制御性の観点から、ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-26T17:58:39Z) - CamDiff: Camouflage Image Augmentation via Diffusion Model [83.35960536063857]
CamDiffは、カモフラージュされたシーンで透明なオブジェクトを合成するための新しいアプローチだ。
我々は,潜伏拡散モデルを用いて,カモフラージュされたシーンで有能な物体を合成する。
当社のアプローチでは、フレキシブルな編集と大規模データセットの効率的な生成を低コストで実現している。
論文 参考訳(メタデータ) (2023-04-11T19:37:47Z) - TINYCD: A (Not So) Deep Learning Model For Change Detection [68.8204255655161]
変化検出(CD)の目的は、同じ領域で発生した変化を異なる時間に撮影された2つの画像を比較して検出することである。
ディープラーニングの分野での最近の進歩により、研究者はこの分野で卓越した成果を得られるようになった。
我々はTinyCDと呼ばれる新しいモデルを提案し、軽量かつ効果的であることを実証した。
論文 参考訳(メタデータ) (2022-07-26T19:28:48Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。