論文の概要: Forward-Looking Sonar Patch Matching: Modern CNNs, Ensembling, and
Uncertainty
- arxiv url: http://arxiv.org/abs/2108.01066v1
- Date: Mon, 2 Aug 2021 17:49:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 17:07:14.142855
- Title: Forward-Looking Sonar Patch Matching: Modern CNNs, Ensembling, and
Uncertainty
- Title(参考訳): 前向きなSonar Patch Matching:現代のCNN、組み立て、不確実性
- Authors: Arka Mallick and Paul Pl\"oger and Matias Valdenegro-Toro
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は類似性関数を学習し、2つの入力ソナー画像が似ているかどうかを予測する。
最高の性能モデルは、0.955 AUCのDenseNet Two-Channelネットワーク、0.949 AUCのVGG-Siamese、0.921 AUCのDenseNet Siameseである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Application of underwater robots are on the rise, most of them are dependent
on sonar for underwater vision, but the lack of strong perception capabilities
limits them in this task. An important issue in sonar perception is matching
image patches, which can enable other techniques like localization, change
detection, and mapping. There is a rich literature for this problem in color
images, but for acoustic images, it is lacking, due to the physics that produce
these images. In this paper we improve on our previous results for this problem
(Valdenegro-Toro et al, 2017), instead of modeling features manually, a
Convolutional Neural Network (CNN) learns a similarity function and predicts if
two input sonar images are similar or not. With the objective of improving the
sonar image matching problem further, three state of the art CNN architectures
are evaluated on the Marine Debris dataset, namely DenseNet, and VGG, with a
siamese or two-channel architecture, and contrastive loss. To ensure a fair
evaluation of each network, thorough hyper-parameter optimization is executed.
We find that the best performing models are DenseNet Two-Channel network with
0.955 AUC, VGG-Siamese with contrastive loss at 0.949 AUC and DenseNet Siamese
with 0.921 AUC. By ensembling the top performing DenseNet two-channel and
DenseNet-Siamese models overall highest prediction accuracy obtained is 0.978
AUC, showing a large improvement over the 0.91 AUC in the state of the art.
- Abstract(参考訳): 水中ロボットの応用は増加しており、そのほとんどが水中視覚のためのソナーに依存しているが、強い知覚能力の欠如は、このタスクにおいてそれらを制限する。
ソナー認識における重要な問題は、画像パッチのマッチングであり、ローカライゼーション、変更検出、マッピングなどの他のテクニックを可能にする。
カラー画像には、この問題に関する豊富な文献があるが、音響画像では、これらの画像を生成する物理学のために不足している。
本稿では,この問題に対するこれまでの結果(valdenegro-toro et al, 2017)を,手作業でモデリングする代わりに,畳み込みニューラルネットワーク(cnn)が類似度関数を学習し,2つの入力ソナー画像が類似しているか否かを予測する。
さらに、ソナー画像マッチング問題を改善することを目的として、CNNアーキテクチャの3つの状態が、DenseNetとVGGというMarine Debrisデータセット上で評価され、シアムまたは2チャネルアーキテクチャと対照的な損失が生じる。
各ネットワークの公平な評価を確保するために、徹底的なハイパーパラメータ最適化を行う。
DenseNet Two-Channel Network with 0.955 AUC, VGG-Siamese with 0.949 AUC, DenseNet Siamese with 0.921 AUCが最適である。
DenseNetの2チャンネルモデルとDenseNet-Siameseモデルの上位をアンサンブルすることで、得られる予測精度は0.978 AUCとなり、芸術の状況において0.91 AUCよりも大幅に改善された。
関連論文リスト
- DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Yin Yang Convolutional Nets: Image Manifold Extraction by the Analysis
of Opposites [1.1560177966221703]
Yin Yang Convolutional Networkは、視覚多様体を抽出するアーキテクチャである。
最初のモデルでは、テスト精度93.32%に達し、このカテゴリーでは古いSOTAよりも0.8%高かった。
ImageNetでも分析を行い、1.6Mパラメータで66.49%の精度で検証しました。
論文 参考訳(メタデータ) (2023-10-24T19:48:07Z) - Combining UPerNet and ConvNeXt for Contrails Identification to reduce
Global Warming [0.0]
本研究は,地球規模の衛星画像における航空機のコントラル検出に着目し,コントラルモデルの改善と気候変動への影響を緩和する。
NOAA GOES-16衛星画像のための革新的なデータ前処理技術を開発した。
クラス不均衡に取り組むために、トレーニングデータセットは、正の反則ラベルを持つイメージのみを含む。
論文 参考訳(メタデータ) (2023-10-07T13:59:05Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - Unsupervised Denoising of Optical Coherence Tomography Images with
Dual_Merged CycleWGAN [3.3909577600092122]
そこで我々は,網膜CT画像復調のためのDual-Merged Cycle-WGANと呼ばれる新しいサイクル一貫性生成適応ネットを提案する。
本モデルでは,2つのCycle-GANネットワークとデクリミネータとワッセルシュタイン損失を併用して,優れたトレーニング安定性と性能を実現する。
論文 参考訳(メタデータ) (2022-05-02T07:38:19Z) - Attentions Help CNNs See Better: Attention-based Hybrid Image Quality
Assessment Network [20.835800149919145]
画像品質評価(IQA)アルゴリズムは、画像品質に対する人間の認識を定量化することを目的としている。
GAN(Generative Adversarial Network)によって生成された歪み画像を、一見現実的なテクスチャで評価する際の性能低下がある。
本稿では,AHIQ(Hybrid Image Quality Assessment Network)を提案する。
論文 参考訳(メタデータ) (2022-04-22T03:59:18Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Shape-Texture Debiased Neural Network Training [50.6178024087048]
畳み込みニューラルネットワークは、トレーニングデータセットによって、テクスチャまたは形状にバイアスされることが多い。
形状・テクスチャ・デバイアスド学習のためのアルゴリズムを開発した。
実験により,本手法は複数の画像認識ベンチマークにおけるモデル性能の向上に成功していることが示された。
論文 参考訳(メタデータ) (2020-10-12T19:16:12Z) - Improved Residual Networks for Image and Video Recognition [98.10703825716142]
ResNets(Residual Networks)は、CNN(Convolutional Neural Network)アーキテクチャの強力なタイプである。
ベースライン上での精度と学習収束性を一貫した改善を示す。
提案手法では,高度に深いネットワークをトレーニングできるが,ベースラインは厳密な最適化問題を示す。
論文 参考訳(メタデータ) (2020-04-10T11:09:50Z) - Adversarial Perturbations Prevail in the Y-Channel of the YCbCr Color
Space [43.49959098842923]
ホワイトボックス攻撃では、RGB画像上で動作する深いモデルに対して、逆方向の摂動が一般的に学習される。
本稿では, YCbCr空間のYチャネルにおいて, 対向摂動が広まることを示す。
そこで本研究では,敵画像に対する防御法を提案する。
論文 参考訳(メタデータ) (2020-02-25T02:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。