論文の概要: SH-SAS: An Implicit Neural Representation for Complex Spherical-Harmonic Scattering Fields for 3D Synthetic Aperture Sonar
- arxiv url: http://arxiv.org/abs/2509.11087v1
- Date: Sun, 14 Sep 2025 04:29:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.90933
- Title: SH-SAS: An Implicit Neural Representation for Complex Spherical-Harmonic Scattering Fields for 3D Synthetic Aperture Sonar
- Title(参考訳): SH-SAS:複合球面-高調波散乱場における3次元合成開口ソナーのための暗黙的ニューラル表現
- Authors: Omkar Shailendra Vengurlekar, Adithya Pediredla, Suren Jayasuriya,
- Abstract要約: 本稿では,複雑な音響散乱場を球面調和係数の集合として表現する暗黙的神経表現SH-SASを紹介する。
以上の結果から,SH-SASは従来の手法よりも3次元再構成品質と幾何学的指標の点で優れていた。
- 参考スコア(独自算出の注目度): 10.13553727839228
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic aperture sonar (SAS) reconstruction requires recovering both the spatial distribution of acoustic scatterers and their direction-dependent response. Time-domain backprojection is the most common 3D SAS reconstruction algorithm, but it does not model directionality and can suffer from sampling limitations, aliasing, and occlusion. Prior neural volumetric methods applied to synthetic aperture sonar treat each voxel as an isotropic scattering density, not modeling anisotropic returns. We introduce SH-SAS, an implicit neural representation that expresses the complex acoustic scattering field as a set of spherical harmonic (SH) coefficients. A multi-resolution hash encoder feeds a lightweight MLP that outputs complex SH coefficients up to a specified degree L. The zeroth-order coefficient acts as an isotropic scattering field, which also serves as the density term, while higher orders compactly capture directional scattering with minimal parameter overhead. Because the model predicts the complex amplitude for any transmit-receive baseline, training is performed directly from 1-D time-of-flight signals without the need to beamform intermediate images for supervision. Across synthetic and real SAS (both in-air and underwater) benchmarks, results show that SH-SAS performs better in terms of 3D reconstruction quality and geometric metrics than previous methods.
- Abstract(参考訳): 合成開口ソナー(SAS)の再構成には,音響散乱器の空間分布と方向依存応答の両方を復元する必要がある。
時間領域のバックプロジェクションは最も一般的な3D SAS再構成アルゴリズムであるが、方向性をモデル化せず、サンプリング制限、エイリアス、オクルージョンに悩まされる。
合成開口ソナーに適用される以前の神経体積法では、ボクセルは異方性リターンをモデル化せず、等方性散乱密度として扱う。
本稿では,複雑な音響散乱場を球面調和係数の集合として表現する暗黙的神経表現SH-SASを紹介する。
多分解能ハッシュエンコーダは、特定の次数 L までの複素SH係数を出力する軽量MLPを供給し、ゼロ階係数は等方散乱場として機能し、密度項としても機能し、高次は最小パラメータオーバーヘッドで方向散乱をコンパクトに捕捉する。
モデルは、送受信ベースラインの複雑な振幅を予測するため、監視のために中間画像をビームフォーミングすることなく、1次元の飛行時間信号から直接トレーニングを行う。
その結果, SH-SASは従来の手法よりも3次元再構成品質と幾何学的指標の点で優れた性能を示した。
関連論文リスト
- TensoIS: A Step Towards Feed-Forward Tensorial Inverse Subsurface Scattering for Perlin Distributed Heterogeneous Media [9.981742844158903]
画像からヘテロジニアス媒質の散乱パラメータを推定することは、過度に制約され難解な問題である。
実世界の異種散乱パラメータを明示的にモデル化できる具体的な分布は分かっていない。
本稿では、これらのパーリン分布不均一散乱パラメータを推定する学習ベースのフィードフォワードフレームワークであるTensoISを提案する。
論文 参考訳(メタデータ) (2025-09-04T09:28:20Z) - Enabling Probabilistic Learning on Manifolds through Double Diffusion Maps [3.081704060720176]
本稿では,PLoM(Probabilistic Learning on Manifolds)アプローチの拡張に基づく確率的サンプリングのための生成学習フレームワークを提案する。
我々は、システム全体の動的複雑さを保ちながら、潜在空間で直接、全順序ISDEを解く。
論文 参考訳(メタデータ) (2025-06-02T20:58:49Z) - SHaDe: Compact and Consistent Dynamic 3D Reconstruction via Tri-Plane Deformation and Latent Diffusion [0.0]
本稿では3つの重要な要素を統合した動的3次元シーン再構成のための新しいフレームワークを提案する。
明示的な三面変形場、球面調和(SH)注目の視野条件付き正準場、時間的に認識される潜在拡散。
提案手法は,時間とともに進化する3つの2次元特徴面を用いて4次元シーンを符号化し,効率的なコンパクト表現を実現する。
論文 参考訳(メタデータ) (2025-05-22T11:25:38Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Q-SLAM: Quadric Representations for Monocular SLAM [85.82697759049388]
四角形のレンズを通して体積表現を再現する。
我々は、RGB入力からノイズの深い深さ推定を正すために二次仮定を用いる。
本研究では,新たな二次分割変換器を導入し,二次情報を集約する。
論文 参考訳(メタデータ) (2024-03-12T23:27:30Z) - Consistent3D: Towards Consistent High-Fidelity Text-to-3D Generation with Deterministic Sampling Prior [87.55592645191122]
スコア蒸留サンプリング(SDS)とその変種は、テキスト・ツー・3D世代の発展を大幅に加速させたが、幾何崩壊やテクスチャの低下に弱い。
テキストから3D生成に先立ってODE決定論的サンプリングを探索する新しい「一貫性3D」手法を提案する。
実験により,高忠実で多様な3Dオブジェクトと大規模シーンの生成にConsistent3Dの有効性が示された。
論文 参考訳(メタデータ) (2024-01-17T08:32:07Z) - StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。
まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。
第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文 参考訳(メタデータ) (2023-12-02T02:27:58Z) - Orthogonal Matrix Retrieval with Spatial Consensus for 3D Unknown-View
Tomography [58.60249163402822]
未知視トモグラフィ(UVT)は、未知のランダムな向きで2次元投影から3次元密度マップを再構成する。
提案したOMRはより堅牢で、従来の最先端のOMRアプローチよりも大幅に性能が向上している。
論文 参考訳(メタデータ) (2022-07-06T21:40:59Z) - Learning Generative Prior with Latent Space Sparsity Constraints [25.213673771175692]
自然像の分布は1つの多様体にではなく、むしろいくつかの部分多様体の結合にあると論じられている。
本稿では,スペーサ性駆動型潜時空間サンプリング(SDLSS)フレームワークを提案し,PMLアルゴリズムを用いて潜時空間のスペーサ性を実現する。
その結果, SDLSS法は, 高次圧縮では最先端法よりも効率が高いことがわかった。
論文 参考訳(メタデータ) (2021-05-25T14:12:04Z) - NuSPAN: A Proximal Average Network for Nonuniform Sparse Model --
Application to Seismic Reflectivity Inversion [23.080395291046408]
我々は, 地震データの高分解能回復の観点から, 近位脱畳の問題を解く。
凸と非一様シグナライザの組み合わせを用いる。
結果として生じるスパースネットワークアーキテクチャは、データ駆動方式で取得できる。
論文 参考訳(メタデータ) (2021-05-01T04:33:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。