論文の概要: Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection
- arxiv url: http://arxiv.org/abs/2202.06513v1
- Date: Mon, 14 Feb 2022 07:01:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-15 17:20:58.239775
- Title: Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection
- Title(参考訳): SAR船舶検出のためのコンテキスト保存型インスタンスレベル拡張と変形可能な畳み込みネットワーク
- Authors: Taeyong Song, Sunok Kim, SungTai Kim, Jaeseok Lee and Kwanghoon Sohn
- Abstract要約: ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 50.53262868498824
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Shape deformation of targets in SAR image due to random orientation and
partial information loss caused by occlusion of the radar signal, is an
essential challenge in SAR ship detection. In this paper, we propose a data
augmentation method to train a deep network that is robust to partial
information loss within the targets. Taking advantage of ground-truth
annotations for bounding box and instance segmentation mask, we present a
simple and effective pipeline to simulate information loss on targets in
instance-level, while preserving contextual information. Furthermore, we adopt
deformable convolutional network to adaptively extract shape-invariant deep
features from geometrically translated targets. By learning sampling offset to
the grid of standard convolution, the network can robustly extract the features
from targets with shape variations for SAR ship detection. Experiments on the
HRSID dataset including comparisons with other deep networks and augmentation
methods, as well as ablation study, demonstrate the effectiveness of our
proposed method.
- Abstract(参考訳): レーダー信号の閉塞によるランダムな方向や部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
本稿では,ターゲット内の部分的情報損失に対して堅牢なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
境界ボックスとインスタンスセグメンテーションマスクの接地トルースアノテーションを活用することで、コンテキスト情報を保持しながら、インスタンスレベルのターゲットの情報損失をシミュレートする、シンプルで効果的なパイプラインを提供する。
さらに,変形可能な畳み込みネットワークを採用し,幾何学的に変換された対象から形状不変な深層特徴を適応的に抽出する。
標準畳み込みのグリッドへのサンプリングオフセットを学習することにより、SAR船の検出のための形状変化のあるターゲットから特徴をしっかりと抽出することができる。
提案手法の有効性を実証するため,他の深層ネットワークとの比較,拡張手法,アブレーション研究などを含むHRSIDデータセットの実験を行った。
関連論文リスト
- CATSNet: a context-aware network for Height Estimation in a Forested Area based on Pol-TomoSAR data [4.9793121278328]
この研究は、CATSNetというコンテキスト対応のディープラーニングベースのソリューションを定義している。
畳み込みニューラルネットワークは、パッチベースの情報を活用し、単一のピクセルに注目するのではなく、近隣から特徴を抽出すると考えられる。
実験結果から,複数基線(MB)のTtomoSARデータ内のコンテキスト情報を活用することで,従来の手法を超越した性能と能力の両面で,顕著な優位性を示した。
論文 参考訳(メタデータ) (2024-03-29T16:27:40Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Adaptive Sparse Convolutional Networks with Global Context Enhancement
for Faster Object Detection on Drone Images [26.51970603200391]
本稿では,スパース畳み込みに基づく検出ヘッドの最適化について検討する。
これは、小さなオブジェクトのコンテキスト情報の不十分な統合に悩まされる。
本稿では,グローバルな文脈拡張型適応スパース畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-25T14:42:50Z) - Unsupervised Spike Depth Estimation via Cross-modality Cross-domain Knowledge Transfer [53.413305467674434]
スパイク深度推定をサポートするためにオープンソースのRGBデータを導入し,そのアノテーションと空間情報を活用する。
教師なしスパイク深さ推定を実現するために,クロスモーダルクロスドメイン(BiCross)フレームワークを提案する。
提案手法は,RGB指向の教師なし深度推定法と比較して,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-08-26T09:35:20Z) - Knowledge Distillation for Oriented Object Detection on Aerial Images [1.827510863075184]
本稿では,KD-RNetの知識蒸留による空中画像の回転物体検出のためのモデル圧縮手法を提案する。
大規模空中物体検出データセット(DOTA)による実験結果から,提案したKD-RNetモデルにより,パラメータ数を削減した平均値精度(mAP)が向上し,同時にKD-RNetは,基底アノテーションと高い重なり合う高品質検出を提供することで,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T14:24:16Z) - Change Detection from Synthetic Aperture Radar Images via Graph-Based
Knowledge Supplement Network [36.41983596642354]
画像変化検出のためのグラフベースの知識補足ネットワーク(GKSNet)を提案する。
より具体的には、既存のラベル付きデータセットから識別情報を付加的な知識として抽出する。
提案手法を検証するために,4つのSARデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-01-22T02:50:50Z) - A Convolutional Neural Network with Parallel Multi-Scale Spatial Pooling
to Detect Temporal Changes in SAR Images [43.56177583903999]
合成開口レーダ(SAR)画像変化検出では,ノイズ差画像から変化する情報を活用することは極めて困難である。
雑音差画像から変化した情報を利用するマルチスケール空間プーリング(MSSP)ネットワークを提案する。
論文 参考訳(メタデータ) (2020-05-22T03:37:30Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。