論文の概要: Self-Supervised Compression and Artifact Correction for Streaming Underwater Imaging Sonar
- arxiv url: http://arxiv.org/abs/2511.13922v1
- Date: Mon, 17 Nov 2025 21:19:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.80549
- Title: Self-Supervised Compression and Artifact Correction for Streaming Underwater Imaging Sonar
- Title(参考訳): 水中イメージングソナーの自己監督圧縮とアーチファクト補正
- Authors: Rongsheng Qian, Chi Xu, Xiaoqiang Ma, Hao Fang, Yili Jin, William I. Atlas, Jiangchuan Liu,
- Abstract要約: 実時間撮像ソナーは、光センシングが信頼性の低い環境下での水中監視において重要なツールとなっている。
クリーンノイズペアや合成仮定を使わずに圧縮とアーティファクトの補正を共同で行う自己教師型フレームワークSCOPEを提案する。
SCOPEは太平洋岸北西部の3つの河川に数ヶ月間展開され、野生でのリアルタイムサケの列挙と環境モニタリングを支援している。
- 参考スコア(独自算出の注目度): 14.023965177100239
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time imaging sonar has become an important tool for underwater monitoring in environments where optical sensing is unreliable. Its broader use is constrained by two coupled challenges: highly limited uplink bandwidth and severe sonar-specific artifacts (speckle, motion blur, reverberation, acoustic shadows) that affect up to 98% of frames. We present SCOPE, a self-supervised framework that jointly performs compression and artifact correction without clean-noise pairs or synthetic assumptions. SCOPE combines (i) Adaptive Codebook Compression (ACC), which learns frequency-encoded latent representations tailored to sonar, with (ii) Frequency-Aware Multiscale Segmentation (FAMS), which decomposes frames into low-frequency structure and sparse high-frequency dynamics while suppressing rapidly fluctuating artifacts. A hedging training strategy further guides frequency-aware learning using low-pass proxy pairs generated without labels. Evaluated on months of in-situ ARIS sonar data, SCOPE achieves a structural similarity index (SSIM) of 0.77, representing a 40% improvement over prior self-supervised denoising baselines, at bitrates down to <= 0.0118 bpp. It reduces uplink bandwidth by more than 80% while improving downstream detection. The system runs in real time, with 3.1 ms encoding on an embedded GPU and 97 ms full multi-layer decoding on the server end. SCOPE has been deployed for months in three Pacific Northwest rivers to support real-time salmon enumeration and environmental monitoring in the wild. Results demonstrate that learning frequency-structured latents enables practical, low-bitrate sonar streaming with preserved signal details under real-world deployment conditions.
- Abstract(参考訳): 実時間撮像ソナーは、光センシングが信頼性の低い環境下での水中監視において重要なツールとなっている。
非常に制限されたアップリンク帯域と、最大98%のフレームに影響を与えるソナー固有のアーティファクト(スペックル、モーションボケ、リバーベーション、アコースティックシャドウ)である。
クリーンノイズペアや合成仮定を使わずに圧縮とアーティファクトの補正を共同で行う自己教師型フレームワークSCOPEを提案する。
SCOPE が組み合わさる
一 ソナーに合わせた周波数符号化潜在表現を学習する適応型コードブック圧縮(ACC)
(II) フレームを低周波構造に分解する周波数対応型マルチスケールセグメンテーション(FAMS)。
ヘッジトレーニング戦略は、ラベルなしで生成された低パスプロキシペアを使用した周波数認識学習をさらにガイドする。
SCOPE は ARIS ソナーデータの数ヶ月で評価され、構造類似度指数 (SSIM) は 0.77 であり、従来の自己監督型デノナイジングベースラインよりも40%改善され、ビットレートは <= 0.0118 bpp となる。
ダウンストリーム検出を改善しながら、アップリンク帯域幅を80%以上削減する。
システムはリアルタイムで動作し、3.1ミリ秒のエンコーディングを組み込みGPUで行い、97ミリ秒のフルマルチレイヤデコーディングをサーバの端で実行する。
SCOPEは太平洋岸北西部の3つの河川に数ヶ月間展開され、野生でのリアルタイムサケの列挙と環境モニタリングを支援している。
その結果,実世界の展開条件下での信号の保存による低ビットレートソナーストリーミングを実現することができることがわかった。
関連論文リスト
- Towards Frequency-Adaptive Learning for SAR Despeckling [10.764049665817629]
分割・分散アーキテクチャに基づく周波数適応型ヘテロジニアスデスペクリングモデルを提案する。
ノイズ特性の異なるサブネットワークを設計し,周波数成分の異なるサブネットワークを設計する。
エッジやテクスチャに富んだ高周波サブバンドに対して,ノイズ抑制と機能強化のための変形可能な畳み込みを備えた拡張U-Netを導入する。
論文 参考訳(メタデータ) (2025-11-08T07:08:22Z) - Real-time Noise Detection and Classification in Single-Channel EEG: A Lightweight Machine Learning Approach for EMG, White Noise, and EOG Artifacts [0.0]
単一チャネル脳波における眼球,筋 (EMG) , ホワイトノイズアーティファクトのリアルタイム検出と分類のためのハイブリッドスペクトル時間フレームワークを提案する。
30秒のトレーニング時間(CNNよりも97%高速)とSNRレベルの堅牢なパフォーマンスにより、このフレームワークは臨床応用性と計算効率のギャップを埋める。
この研究は、脳波アーチファクト検出のためのモデル深さへのユビキタスな依存にも挑戦し、ドメインインフォームド機能融合が複雑なアーキテクチャをノイズの多いシナリオで超越していることを示します。
論文 参考訳(メタデータ) (2025-09-30T10:32:38Z) - Lightweight Physics-Informed Zero-Shot Ultrasound Plane Wave Denoising [1.912429179274357]
超音波コヒーレント平面波合成(CPWC)は、複数のステアリング伝送からのエコーを組み合わせることにより、画像コントラストを向上させる。
低角CPWC取得に適したゼロショット復調フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-26T17:28:32Z) - SpikeStereoNet: A Brain-Inspired Framework for Stereo Depth Estimation from Spike Streams [70.9610707466343]
バイオインスパイクカメラは、マイクロ秒レベルの解像度で非同期イベントを出力し、代替のセンシングモードを提供する。
既存の手法には、スパイクデータに適した特別なステレオアルゴリズムとベンチマークが欠けている。
本稿では,脳にインスパイアされたフレームワークであるSpikeStereoNetを提案する。
論文 参考訳(メタデータ) (2025-05-26T04:14:34Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - Thunder: Thumbnail based Fast Lightweight Image Denoising Network [92.9631117239565]
textbfThumbtextbfnail ベースの textbfDtextbfenoising Netwotextbfrk called Thunder が提案されている。
論文 参考訳(メタデータ) (2022-05-24T06:38:46Z) - Exploring Inter-frequency Guidance of Image for Lightweight Gaussian
Denoising [1.52292571922932]
本稿では,周波数帯域を低域から高域に漸進的に洗練するために,IGNetと呼ばれる新しいネットワークアーキテクチャを提案する。
この設計では、より周波数間先行と情報を利用するため、モデルサイズは軽量化でき、競争結果も維持できる。
論文 参考訳(メタデータ) (2021-12-22T10:35:53Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。