論文の概要: Learning Visual Representation of Underwater Acoustic Imagery Using
Transformer-Based Style Transfer Method
- arxiv url: http://arxiv.org/abs/2211.05396v1
- Date: Thu, 10 Nov 2022 07:54:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 15:57:52.566790
- Title: Learning Visual Representation of Underwater Acoustic Imagery Using
Transformer-Based Style Transfer Method
- Title(参考訳): 変圧器型伝達法を用いた水中音響画像の視覚表現学習
- Authors: Xiaoteng Zhou, Changli Yu, Shihao Yuan, Xin Yuan, Hangchi Yu and
Citong Luo
- Abstract要約: 本論文は水中音響画像の視覚的表現を学習するための枠組みを提案する。
これは、光学画像の低レベルのテクスチャ特徴を水中音響画像の視覚的特徴に置き換える可能性がある。
提案するフレームワークは、擬似音響画像データセットを生成するために、リッチな光学画像データセットを完全に利用できる。
- 参考スコア(独自算出の注目度): 4.885034271315195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater automatic target recognition (UATR) has been a challenging
research topic in ocean engineering. Although deep learning brings
opportunities for target recognition on land and in the air, underwater target
recognition techniques based on deep learning have lagged due to sensor
performance and the size of trainable data. This letter proposed a framework
for learning the visual representation of underwater acoustic imageries, which
takes a transformer-based style transfer model as the main body. It could
replace the low-level texture features of optical images with the visual
features of underwater acoustic imageries while preserving their raw high-level
semantic content. The proposed framework could fully use the rich optical image
dataset to generate a pseudo-acoustic image dataset and use it as the initial
sample to train the underwater acoustic target recognition model. The
experiments select the dual-frequency identification sonar (DIDSON) as the
underwater acoustic data source and also take fish, the most common marine
creature, as the research subject. Experimental results show that the proposed
method could generate high-quality and high-fidelity pseudo-acoustic samples,
achieve the purpose of acoustic data enhancement and provide support for the
underwater acoustic-optical images domain transfer research.
- Abstract(参考訳): 水中自動目標認識 (uatr) は海洋工学において難しい研究課題となっている。
深層学習は、陸地や空中における目標認識の機会をもたらすが、センサ性能と訓練可能なデータの大きさにより、深層学習に基づく水中目標認識技術が遅れている。
本論文は, トランスフォーマー方式の伝達モデルを本体とする水中音響画像の視覚的表現を学習するための枠組みを提案する。
光学画像の低レベルのテクスチャ特徴を水中音響画像の視覚的特徴に置き換え、生の高レベルのセマンティックコンテンツを保存できる。
提案フレームワークは,水中音響目標認識モデルのトレーニングに擬似音響画像データセットを生成するために,リッチな光学画像データセットを完全に使用することができる。
実験では、水中の音響データ源としてデュアル周波数識別ソナー(didson)を選択し、最も一般的な海洋生物であるフィッシュを研究対象とする。
実験の結果,提案手法は高品質で高忠実な擬似音響サンプルを生成し,音響データエンハンスメントの目的を達成し,水中音響光学画像領域転送研究を支援することができた。
関連論文リスト
- Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - A Dataset with Multibeam Forward-Looking Sonar for Underwater Object
Detection [0.0]
マルチビーム前方ソナー (MFLS) は水中検出において重要な役割を担っている。
MFLSを用いた水中物体検出の研究にはいくつかの課題がある。
本稿では,Tritech Gemini 1200ikソナーを用いて,9000枚以上のMFLS画像からなる新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-12-01T08:26:03Z) - Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。
また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文 参考訳(メタデータ) (2022-11-19T07:50:34Z) - Synthetic Sonar Image Simulation with Various Seabed Conditions for
Automatic Target Recognition [1.179296191012968]
本研究では,Unreal Engine を用いたサイドスキャンソナーによる水中物体画像の生成手法を提案する。
本稿では、自動目標認識(ATR)と機械学習アルゴリズムの訓練に使用する代表画像の開発、チューニング、生成のプロセスについて述べる。
論文 参考訳(メタデータ) (2022-10-19T03:08:02Z) - Domain Adaptation for Underwater Image Enhancement via Content and Style
Separation [7.077978580799124]
水中画像は、カラーキャスト、低コントラスト、光吸収、屈折、散乱によるハジー効果に悩まされている。
近年の学習に基づく手法は水中画像の強調に驚くべき性能を示した。
本稿では,コンテンツとスタイル分離による水中画像強調のためのドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-17T09:30:29Z) - Perceptual underwater image enhancement with deep learning and physical
priors [35.37760003463292]
本稿では,2つの知覚強調モデルを提案する。
トレーニングデータの欠如により, 物理的先行とデータ駆動的手がかりを融合したハイブリッド水中画像合成モデルが提案され, トレーニングデータを合成する。
実験結果から,提案手法は実環境および合成水中データセット上でのいくつかの最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-08-21T22:11:34Z) - Cross-Task Transfer for Geotagged Audiovisual Aerial Scene Recognition [61.54648991466747]
映像と音を入力として用いた視覚的空中シーン認識タスクについて検討する。
航空シーン認識のための音声情報を活用する利点を示す。
論文 参考訳(メタデータ) (2020-05-18T04:14:16Z) - Domain Adaptive Adversarial Learning Based on Physics Model Feedback for
Underwater Image Enhancement [10.143025577499039]
物理モデルに基づくフィードバック制御と,水中画像の高機能化のための領域適応機構を用いた,新しい頑健な対角学習フレームワークを提案する。
水中画像形成モデルを用いてRGB-Dデータから水中訓練データセットをシミュレーションする新しい手法を提案する。
合成および実水中画像の最終的な改良結果は,提案手法の優位性を示している。
論文 参考訳(メタデータ) (2020-02-20T07:50:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。