論文の概要: Sonar-MASt3R: Real-Time Opti-Acoustic Fusion in Turbid, Unstructured Environments
- arxiv url: http://arxiv.org/abs/2603.13585v1
- Date: Fri, 13 Mar 2026 20:51:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-28 17:43:02.95504
- Title: Sonar-MASt3R: Real-Time Opti-Acoustic Fusion in Turbid, Unstructured Environments
- Title(参考訳): Sonar-MASt3R: 乱流・非構造環境における実時間オプティカル・音響核融合
- Authors: Amy Phung, Richard Camilli,
- Abstract要約: 本稿では,光学カメラデータから高密度対応をリアルタイムで抽出するオプティア音響融合法Sonar-MASt3Rを提案する。
本手法は, 振動条件下でのロバスト性を確保するため, 音響3次元再構成による幾何学的手がかりと組み合わせる。
- 参考スコア(独自算出の注目度): 0.8594140167290097
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater intervention is an important capability in several marine domains, with numerous industrial, scientific, and defense applications. However, existing perception systems used during intervention operations rely on data from optical cameras, which limits capabilities in poor visibility or lighting conditions. Prior work has examined opti-acoustic fusion methods, which use sonar data to resolve the depth ambiguity of the camera data while using camera data to resolve the elevation angle ambiguity of the sonar data. However, existing methods cannot achieve dense 3D reconstructions in real-time, and few studies have reported results from applying these methods in a turbid environment. In this work, we propose the opti-acoustic fusion method Sonar-MASt3R, which uses MASt3R to extract dense correspondences from optical camera data in real-time and pairs it with geometric cues from an acoustic 3D reconstruction to ensure robustness in turbid conditions. Experimental results using data recorded from an opti-acoustic eye-in-hand configuration across turbidity values ranging from <0.5 to >12 NTU highlight this method's improved robustness to turbidity relative to baseline methods.
- Abstract(参考訳): 水中介入はいくつかの海洋ドメインにおいて重要な機能であり、多くの産業、科学、防衛用途がある。
しかし、既存の知覚システムは光学カメラのデータに依存しており、視界不良や照明条件が制限されている。
従来の研究では、ソナーデータを用いてカメラデータの深度あいまいを解消し、カメラデータを用いてソナーデータの標高角あいまいを解消するオプティ音響融合法が検討されている。
しかし,既存の方法ではリアルタイムに高密度な3次元再構成を行うことはできない。
そこで本研究では,MASt3Rを用いて光学カメラデータから高密度対応をリアルタイムに抽出し,音響3次元再構成から幾何的手がかりと組み合わせることで,振動条件の堅牢性を確保する,光音響融合方式Sonar-MASt3Rを提案する。
また,<0.5から>12 NTUの範囲の濁度値にまたがるオプティア音響的アイ・イン・ハンド構成から得られたデータを用いた実験結果から,ベースライン法と比較して濁度に対するロバスト性の向上が示された。
関連論文リスト
- Towards Versatile Opti-Acoustic Sensor Fusion and Volumetric Mapping [2.064612766965483]
自動水中車両にはボリュームマッピングが不可欠である。
視覚に基づく知覚は高解像度のデータを提供するが、濁った状況では失敗する。
ソナーは光と濁りに強いが 解像度が低く 高さの曖昧さに悩まされている
本稿では,ステレオソナー対とモノクラーカメラを融合させて,様々な視認性条件下での安全なナビゲーションを実現するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-15T16:06:28Z) - SonarSweep: Fusing Sonar and Vision for Robust 3D Reconstruction via Plane Sweeping [6.826863809223021]
3次元再構成への単一モダリティアプローチは、視認性や幾何学的制約が低いために失敗する。
それまでの融合技術は、欠陥のある幾何学に依存しており、重要なアーティファクトと複雑なシーンをモデル化することができない。
本稿では,これらの制約を克服する新しいエンドツーエンドディープラーニングフレームワークであるSonarSweepを紹介する。
論文 参考訳(メタデータ) (2025-11-01T04:12:27Z) - Noise-adapted Neural Operator for Robust Non-Line-of-Sight Imaging [5.486845789695915]
本稿では3次元画像再構成における大規模線形問題に適したパラメータ化逆問題フレームワークを提案する。
パラメータ化ニューラル演算子を開発し、逆マッピングを近似し、エンドツーエンドの高速画像再構成を容易にする。
演算子学習を基盤とした3次元画像再構成フレームワークは,ディープアルゴリズムの展開によって構築される。
論文 参考訳(メタデータ) (2025-08-13T09:40:38Z) - D3DR: Lighting-Aware Object Insertion in Gaussian Splatting [48.80431740983095]
D3DRと呼ばれる3DGS並列化オブジェクトを3DGSシーンに挿入する手法を提案する。
我々は、現実世界のデータに基づいて訓練された拡散モデルの進歩を活用し、正しいシーンライティングを暗黙的に理解する。
提案手法を既存手法と比較することにより,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2025-03-09T19:48:00Z) - Can Optical Denoising Clean Sonar Images? A Benchmark and Fusion Approach [24.02055678758872]
ソナー画像における物体検出は水中ロボット工学の応用に不可欠である。
復調技術は光学画像において顕著な成功を収めてきたが、ソナーデータの適用性は未解明のままである。
本研究では、異なるアーキテクチャを持つ9つの最先端のディープ・デノゲーション・モデルについて、初めて体系的評価を行った。
論文 参考訳(メタデータ) (2025-03-03T15:30:39Z) - Digging into contrastive learning for robust depth estimation with diffusion models [55.62276027922499]
そこで我々はD4RDと呼ばれる新しい頑健な深度推定法を提案する。
複雑な環境での性能劣化を軽減するために、拡散モデルに適した独自のコントラスト学習モードを備えている。
実験では、D4RDは合成汚職データセットや現実世界の気象条件に関する最先端のソリューションを超越している。
論文 参考訳(メタデータ) (2024-04-15T14:29:47Z) - Realistic Noise Synthesis with Diffusion Models [44.404059914652194]
ディープラーニングモデルには、大規模な実世界のトレーニングデータが必要です。
本稿では,これらの課題に対処するために拡散モデルを用いた新しい実音合成拡散器(RNSD)法を提案する。
論文 参考訳(メタデータ) (2023-05-23T12:56:01Z) - Few-shot Non-line-of-sight Imaging with Signal-surface Collaborative
Regularization [18.466941045530408]
非視線イメージング技術は、多重反射光からターゲットを再構成することを目的としている。
最小限の測定回数でノイズロバストを再現する信号表面の協調正規化フレームワークを提案する。
我々のアプローチは、救助活動や自律運転といったリアルタイム非視線画像アプリケーションにおいて大きな可能性を秘めている。
論文 参考訳(メタデータ) (2022-11-21T11:19:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。