論文の概要: Structural Prior Driven Regularized Deep Learning for Sonar Image
Classification
- arxiv url: http://arxiv.org/abs/2010.13317v1
- Date: Mon, 26 Oct 2020 04:00:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 19:04:42.125392
- Title: Structural Prior Driven Regularized Deep Learning for Sonar Image
Classification
- Title(参考訳): 構造優先型正規化ディープラーニングによるソナー画像分類
- Authors: Isaac D. Gerg and Vishal Monga
- Abstract要約: 深層学習は合成開口ソナー(SAS)画像分類の領域での性能を向上させることが示されている。
近年のディープラーニングの成功にもかかわらず、高い誤報率を下げる上で、魅力的なオープンな課題がまだ残っている。
我々は,事前知識を取り入れた新しいディープラーニングアーキテクチャを導入し,自動目標認識の改善を目指す。
- 参考スコア(独自算出の注目度): 28.306713374371814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning has been recently shown to improve performance in the domain of
synthetic aperture sonar (SAS) image classification. Given the constant
resolution with range of a SAS, it is no surprise that deep learning techniques
perform so well. Despite deep learning's recent success, there are still
compelling open challenges in reducing the high false alarm rate and enabling
success when training imagery is limited, which is a practical challenge that
distinguishes the SAS classification problem from standard image classification
set-ups where training imagery may be abundant. We address these challenges by
exploiting prior knowledge that humans use to grasp the scene. These include
unconscious elimination of the image speckle and localization of objects in the
scene. We introduce a new deep learning architecture which incorporates these
priors with the goal of improving automatic target recognition (ATR) from SAS
imagery. Our proposal -- called SPDRDL, Structural Prior Driven Regularized
Deep Learning -- incorporates the previously mentioned priors in a multi-task
convolutional neural network (CNN) and requires no additional training data
when compared to traditional SAS ATR methods. Two structural priors are
enforced via regularization terms in the learning of the network: (1)
structural similarity prior -- enhanced imagery (often through despeckling)
aids human interpretation and is semantically similar to the original imagery
and (2) structural scene context priors -- learned features ideally encapsulate
target centering information; hence learning may be enhanced via a
regularization that encourages fidelity against known ground truth target
shifts (relative target position from scene center). Experiments on a
challenging real-world dataset reveal that SPDRDL outperforms state-of-the-art
deep learning and other competing methods for SAS image classification.
- Abstract(参考訳): 近年,合成開口ソナー(SAS)画像分類における深層学習の性能向上が示されている。
SASの範囲の一定解像度を考えると、ディープラーニング技術がこれほどよく機能するのは驚くにあたらない。
近年の深層学習の成功にもかかわらず、高い誤報率を減らし、訓練画像が限定された場合の成功を可能にするという、魅力的なオープンな課題が依然として残っており、これは、SAS分類問題と訓練画像が豊富である可能性のある標準画像分類セットとを区別する実践的な課題である。
我々は、人間がシーンを把握するために使用する事前知識を活用することで、これらの課題に対処する。
これには、画像のスペックルの無意識的な削除とシーン内のオブジェクトのローカライズが含まれる。
SAS画像から自動目標認識(ATR)を改善することを目的として,これらの先行情報を組み込んだ新しいディープラーニングアーキテクチャを提案する。
我々の提案はSPDRDLと呼ばれ、従来のSAS ATR手法と比較して、前述のように、マルチタスク畳み込みニューラルネットワーク(CNN)に組み込まれており、追加のトレーニングデータを必要としない。
Two structural priors are enforced via regularization terms in the learning of the network: (1) structural similarity prior -- enhanced imagery (often through despeckling) aids human interpretation and is semantically similar to the original imagery and (2) structural scene context priors -- learned features ideally encapsulate target centering information; hence learning may be enhanced via a regularization that encourages fidelity against known ground truth target shifts (relative target position from scene center).
挑戦的な実世界のデータセットの実験により、SPDRDLはSAS画像分類のための最先端のディープラーニングやその他の競合する手法よりも優れていることが明らかになった。
関連論文リスト
- Advances in Self-Supervised Learning for Synthetic Aperture Sonar Data
Processing, Classification, and Pattern Recognition [0.36700088931938835]
本稿では,SASデータ処理,分類,パターン認識に自己教師付き学習を活用するMoCo-SASを提案する。
実験の結果,MoCo-SASは従来の教師あり学習法よりも優れていた。
これらの知見は、SASデータ処理における最先端の進歩におけるSSLの可能性を強調し、水中物体の検出と分類を強化するための有望な道を提供する。
論文 参考訳(メタデータ) (2023-08-12T20:59:39Z) - Self-Supervised Learning for Improved Synthetic Aperture Sonar Target
Recognition [0.0]
本研究では,合成開口ソナー(SAS)画像における目標認識向上のための自己教師付き学習(SSL)の適用について検討する。
高分解能SASデータは、ディープニューラルネットワーク(DNN)をトレーニングするための重要なステップであるラベル付けに重要な課題を呈している。
この研究は、バイナリ画像分類タスクにおいて、よく認識された教師付き学習モデルであるResNet18に対して、2つの著名なSSLアルゴリズムであるMoCov2とBYOLの性能を評価する。
論文 参考訳(メタデータ) (2023-07-27T14:17:24Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Iterative, Deep Synthetic Aperture Sonar Image Segmentation [21.319490900396474]
SAS画像セグメンテーションのための非教師なし学習フレームワークIterative Deep Unsupervised (IDUS)を提案する。
IDUSは,1)ディープネットワークのクラス割り当てを推定する,2)ディープネットワークからの低レベルの画像特徴をスーパーピクセルにクラスタ化する,3)スーパーピクセルをクラス割り当てにクラスタ化する,4)ディープネットワーク予測の損失バックプロパゲーションに擬似ラベルを使用する,の4つのステップに分けることができる。
SAS画像セグメンテーションのための現実的なベンチマークデータセットにおけるIDUSと最先端手法の比較は,提案手法の利点を実証するものである。
論文 参考訳(メタデータ) (2022-03-28T20:41:24Z) - Semantic-Aware Generation for Self-Supervised Visual Representation
Learning [116.5814634936371]
セマンティック・アウェア・ジェネレーション(SaGe)は、生成した画像に保存される詳細よりも、よりリッチなセマンティクスを促進する。
SaGeは、ターゲットネットワークをビュー特有の特徴で補完することで、集中的なデータ拡張によって引き起こされるセマンティックな劣化を軽減する。
我々は、ImageNet-1K上でSaGeを実行し、近接検定、線形分類、微視的画像認識を含む5つの下流タスクで事前訓練されたモデルを評価する。
論文 参考訳(メタデータ) (2021-11-25T16:46:13Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - Speckle2Void: Deep Self-Supervised SAR Despeckling with Blind-Spot
Convolutional Neural Networks [30.410981386006394]
切り離しはシーン分析アルゴリズムの 重要な予備段階です
ディープラーニングの最近の成功は、新しい世代の非仕様化技術が想定されている。
本稿では,自己教師型ベイズ解法を提案する。
論文 参考訳(メタデータ) (2020-07-04T11:38:48Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z) - Towards Deep Unsupervised SAR Despeckling with Blind-Spot Convolutional
Neural Networks [30.410981386006394]
ディープラーニング技術は、古典的なモデルに基づく非特定アルゴリズムよりも優れています。
本稿では,自己教師型ベイズ解法を提案する。
提案するネットワークの性能は,合成データの教師あり学習手法に非常に近いことを示し,実データ上での競争力を示す。
論文 参考訳(メタデータ) (2020-01-15T12:21:12Z) - Scene Text Synthesis for Efficient and Effective Deep Network Training [62.631176120557136]
我々は,背景画像に前景オブジェクトを埋め込むことで,注釈付き訓練画像を構成する革新的な画像合成技術を開発した。
提案手法は,ディープネットワークトレーニングにおける合成画像の有用性を高める2つの重要な要素から構成される。
複数の公開データセットに対する実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2019-01-26T10:15:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。