論文の概要: Investigating Long-term Training for Remote Sensing Object Detection
- arxiv url: http://arxiv.org/abs/2407.15143v4
- Date: Tue, 30 Sep 2025 00:01:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 19:34:21.332748
- Title: Investigating Long-term Training for Remote Sensing Object Detection
- Title(参考訳): リモートセンシング対象検出のための長期トレーニングの検討
- Authors: JongHyun Park, Yechan Kim, Moongu Jeon,
- Abstract要約: リモートセンシングオブジェクト検出における機能バックボーン微細調整のための動的バックボーン凍結(DBF)を提案する。
提案手法は,背骨が低レベルジェネリック特徴を抽出すべきか,リモートセンシング領域の特定の知識を持つべきかというジレンマに対処する。
本手法は,長期学習における計算コストを大幅に削減しつつ,より正確なモデル学習を可能にする。
- 参考スコア(独自算出の注目度): 9.749560288448114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, numerous methods have achieved impressive performance in remote sensing object detection, relying on convolution or transformer architectures. Such detectors typically have a feature backbone to extract useful features from raw input images. A common practice in current detectors is initializing the backbone with pre-trained weights available online. Fine-tuning the backbone is typically required to generate features suitable for remote-sensing images. While the prolonged training could lead to over-fitting, hindering the extraction of basic visual features, it can enable models to gradually extract deeper insights and richer representations from remote sensing data. Striking a balance between these competing factors is critical for achieving optimal performance. In this study, we aim to investigate the performance and characteristics of remote sensing object detection models under very long training schedules, and propose a novel method named Dynamic Backbone Freezing (DBF) for feature backbone fine-tuning on remote sensing object detection under long-term training. Our method addresses the dilemma of whether the backbone should extract low-level generic features or possess specific knowledge of the remote sensing domain, by introducing a module called 'Freezing Scheduler' to manage the update of backbone features during long-term training dynamically. Extensive experiments on DOTA and DIOR-R show that our approach enables more accurate model learning while substantially reducing computational costs in long-term training. Besides, it can be seamlessly adopted without additional effort due to its straightforward design. The code is available at https://github.com/unique-chan/dbf.
- Abstract(参考訳): 近年、多くの手法が、畳み込みやトランスフォーマーアーキテクチャに依存するリモートセンシングオブジェクト検出において、目覚ましい性能を達成している。
このような検出器は、通常、生の入力画像から有用な特徴を抽出する特徴バックボーンを持つ。
現在の検出器における一般的なプラクティスは、オンラインでトレーニング済みの重量でバックボーンを初期化することである。
バックボーンの微調整は通常、リモートセンシング画像に適した機能を生成するために必要である。
長期間のトレーニングが過度に適合し、基本的な視覚的特徴の抽出を妨げる可能性があるが、モデルがより深い洞察とより豊かな表現を、リモートセンシングデータから徐々に取り出すことができる。
最適なパフォーマンスを達成するためには、これらの競合する要因のバランスを取ることが重要です。
本研究では,長時間のトレーニングスケジュール下でのリモートセンシング対象検出モデルの性能と特性について検討し,長期トレーニングにおけるリモートセンシング対象検出のバックボーン微調整のための動的バックボーン凍結法(DBF)を提案する。
本手法は,長期トレーニング中のバックボーン機能の更新を動的に管理する「フリーズ・スケジューラ」と呼ばれるモジュールを導入することで,バックボーンが低レベルなジェネリックな特徴を抽出すべきか,リモートセンシング領域の特定の知識を持つべきか,というジレンマに対処する。
DOTAとDIOR-Rの大規模な実験により,本手法は長期学習における計算コストを大幅に削減しつつ,より正確なモデル学習を可能にした。
さらに、簡単な設計のため、追加の労力なしでシームレスに採用することができる。
コードはhttps://github.com/unique-chan/dbf.comで公開されている。
関連論文リスト
- MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection [36.478530086163744]
本研究では,MutDetと呼ばれるリモートセンシングオブジェクト検出のための,Mutally最適化事前学習フレームワークを提案する。
MutDetはオブジェクトの埋め込みを融合し、検出器は最後のエンコーダ層に双方向に機能し、情報インタラクションを強化する。
様々な環境での実験は、新しい最先端の転送性能を示している。
論文 参考訳(メタデータ) (2024-07-13T15:28:15Z) - Generic Knowledge Boosted Pre-training For Remote Sensing Images [46.071496675604884]
Generic Knowledge Boosted Remote Sensing Pre-training (GeRSP)は、新しいリモートセンシング事前トレーニングフレームワークである。
GeRSPは、リモートセンシング理解タスクのために、リモートセンシングと自然なイメージから堅牢な表現を学ぶ。
本稿では,GeRSPが効果的にロバスト表現を統一的に学習できることを示し,リモートセンシングダウンストリームタスクの性能を向上させる。
論文 参考訳(メタデータ) (2024-01-09T15:36:07Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - An Empirical Study of Remote Sensing Pretraining [117.90699699469639]
本研究では,空中画像におけるリモートセンシング事前訓練(RSP)の実証的研究を行った。
RSPは、シーン認識タスクで特有のパフォーマンスを提供するのに役立つ。
RSPは、従来のイメージネットがRS画像に事前学習する際のデータ格差を緩和するが、それでもタスクの相違に悩まされる可能性がある。
論文 参考訳(メタデータ) (2022-04-06T13:38:11Z) - Proper Reuse of Image Classification Features Improves Object Detection [4.240984948137734]
トランスファーラーニングの一般的な実践は、データに基づく上流タスクで事前学習することで、下流モデルの重み付けを初期化することである。
近年の研究では、長いトレーニング体制下では必須ではないことが示されており、背骨をスクラッチからトレーニングするためのレシピを提供している。
知識保存の極端な形態 -- 分類器dのバックボーンを凍結する -- が、一貫して多くの異なる検出モデルを改善していることを示す。
論文 参考訳(メタデータ) (2022-04-01T14:44:47Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Few-shot Object Detection on Remote Sensing Images [11.40135025181393]
リモートセンシング画像におけるオブジェクト検出のための数ショットの学習手法を提案する。
我々は、YOLOv3アーキテクチャに基づいて、少数ショットオブジェクト検出モデルを構築し、マルチスケールオブジェクト検出フレームワークを開発する。
論文 参考訳(メタデータ) (2020-06-14T07:18:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。