論文の概要: Improving Generalization of Synthetically Trained Sonar Image
Descriptors for Underwater Place Recognition
- arxiv url: http://arxiv.org/abs/2308.01058v2
- Date: Sun, 24 Sep 2023 17:22:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 01:41:49.998896
- Title: Improving Generalization of Synthetically Trained Sonar Image
Descriptors for Underwater Place Recognition
- Title(参考訳): 水中位置認識のための合成訓練ソナー画像記述子の一般化
- Authors: Ivano Donadi, Emilio Olivastri, Daniel Fusaro, Wanmeng Li, Daniele
Evangelista, and Alberto Pretto
- Abstract要約: 水中環境における自律航法は、光吸収や水濁度などの要因によって困難を呈する。
従来のコンピュータビジョンアルゴリズムはソナー生成音響画像に適用しても効果が低い。
本稿では,合成データのみを訓練しながら,実シナリオに一般化可能な,コンパクトな深層ソナー記述子パイプラインを提案する。
- 参考スコア(独自算出の注目度): 1.8911961520222997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous navigation in underwater environments presents challenges due to
factors such as light absorption and water turbidity, limiting the
effectiveness of optical sensors. Sonar systems are commonly used for
perception in underwater operations as they are unaffected by these
limitations. Traditional computer vision algorithms are less effective when
applied to sonar-generated acoustic images, while convolutional neural networks
(CNNs) typically require large amounts of labeled training data that are often
unavailable or difficult to acquire. To this end, we propose a novel compact
deep sonar descriptor pipeline that can generalize to real scenarios while
being trained exclusively on synthetic data. Our architecture is based on a
ResNet18 back-end and a properly parameterized random Gaussian projection
layer, whereas input sonar data is enhanced with standard ad-hoc
normalization/prefiltering techniques. A customized synthetic data generation
procedure is also presented. The proposed method has been evaluated extensively
using both synthetic and publicly available real data, demonstrating its
effectiveness compared to state-of-the-art methods.
- Abstract(参考訳): 水中環境における自律航法は、光吸収や水濁度などの要因により、光学センサーの有効性を制限している。
ソナーシステムは、これらの制限の影響を受けないため、水中操作の知覚に一般的に使用される。
従来のコンピュータビジョンアルゴリズムはソナー生成音響画像に適用しても効果が低いが、畳み込みニューラルネットワーク(CNN)は通常、しばしば入手できない、あるいは取得が難しい大量のラベル付きトレーニングデータを必要とする。
そこで本研究では,合成データのみを訓練しながら実シナリオに一般化可能な,コンパクトなディープソナー記述回路を提案する。
我々のアーキテクチャはResNet18バックエンドと適切にパラメータ化されたランダムガウス射影層に基づいており、入力ソナーデータは標準のアドホック正規化/プリフィルタ技術で拡張されている。
また、カスタマイズされた合成データ生成手順も提示する。
提案手法は合成実データと公開実データの両方を用いて広く評価され,最新手法と比較して有効性を示している。
関連論文リスト
- A Novel Score-CAM based Denoiser for Spectrographic Signature Extraction without Ground Truth [0.0]
本稿では,Score-CAMをベースとした新しいデノイザを開発し,ノイズスペクトルデータからオブジェクトのシグネチャを抽出する。
特に,本論文では,スペクトルトレーニングデータの学習と生成のための,新たな生成逆ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-10-28T21:40:46Z) - Syn2Real Domain Generalization for Underwater Mine-like Object Detection Using Side-Scan Sonar [1.7851018240619703]
本稿では,拡散モデルを用いたSyn2Real(Synthetic to Real)領域一般化手法を提案する。
DDPMモデルとDDIMモデルによるノイズによって生成された合成データは、完全に現実的でないとしても、トレーニングのための実世界のサンプルを効果的に増強できることを実証する。
論文 参考訳(メタデータ) (2024-10-16T18:42:08Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - RFTrans: Leveraging Refractive Flow of Transparent Objects for Surface
Normal Estimation and Manipulation [50.10282876199739]
本稿では、透明物体の表面正規化と操作のためのRGB-Dに基づくRFTransを提案する。
RFNetは屈折流、物体マスク、境界を予測し、次いでF2Netは屈折流から表面の正常を推定する。
現実のロボットがタスクをつかむと、成功率は83%となり、屈折流が直接シミュレートから現実への移動を可能にすることが証明される。
論文 参考訳(メタデータ) (2023-11-21T07:19:47Z) - SONIC: Sonar Image Correspondence using Pose Supervised Learning for Imaging Sonars [21.36164161799472]
我々は,視点変化に耐えられる頑健な特徴対応を実現するために設計されたポーズ制御ネットワークSONICを紹介する。
本手法は,ソナー画像の対応生成における性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-10-23T15:21:46Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Underwater Acoustic Target Recognition based on Smoothness-inducing Regularization and Spectrogram-based Data Augmentation [21.327653766608805]
不十分なデータは、複雑なモデリングをサポートする認識システムの能力を阻害する可能性がある。
限られたデータの場合,モデルの一般化能力を高めるための2つの戦略を提案する。
論文 参考訳(メタデータ) (2023-06-12T08:26:47Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Single Underwater Image Enhancement Using an Analysis-Synthesis Network [21.866940227491146]
水中画像強調のためのほとんどの深層モデルは、水中画像形成モデルに基づく合成データセットの訓練に頼っている。
新しい水中合成データセットが最初に確立され、改良された環境光合成方程式が組み込まれている。
ANA-SYNという名前の統一されたフレームワークは、事前情報とデータ情報の協調の下で、効果的に水中画像を強化することができる。
論文 参考訳(メタデータ) (2021-08-20T06:29:12Z) - Learning Topology from Synthetic Data for Unsupervised Depth Completion [66.26787962258346]
画像から高密度深度マップとスパース深度測定を推定する手法を提案する。
我々は,疎点雲と密度の高い自然形状の関係を学習し,その画像を用いて予測深度マップの検証を行う。
論文 参考訳(メタデータ) (2021-06-06T00:21:12Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。