論文の概要: When Less Is More: Simplicity Beats Complexity for Physics-Constrained InSAR Phase Unwrapping
- arxiv url: http://arxiv.org/abs/2605.00896v1
- Date: Tue, 28 Apr 2026 02:36:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.459929
- Title: When Less Is More: Simplicity Beats Complexity for Physics-Constrained InSAR Phase Unwrapping
- Title(参考訳): 物理学に制約のあるInSAR位相アンラッピングのシンプルさが複雑化
- Authors: Prabhjot Singh, Manmeet Singh,
- Abstract要約: InSARを基盤とした火山・地震モニタリングにおいて、運用段階の解凍が主要な計算ボトルネックとなっている。
我々は,世界規模のLiCSARベンチマーク(20フレーム,39,724パッチ,651万ピクセル)における最初の大規模アーキテクチャアブレーション研究を示す。
- 参考スコア(独自算出の注目度): 0.34376560669160394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Operational phase unwrapping is the primary computational bottleneck in InSAR-based volcanic and seismic monitoring. We challenge the industry trend of adopting high-complexity computer vision architectures, such as attention mechanisms, without validating their suitability for physics-constrained geophysical regression. We present the first large-scale architectural ablation study on a global LiCSAR benchmark (20 frames, 39,724 patches, 651M pixels). Our results reveal a significant "complexity penalty": a vanilla U-Net (7.76M parameters) achieves $R^2=0.834$ and RMSE $= 1.01$ cm, outperforming 11.37M-parameter attention-based models by 34% in $R^2$ and 51% in RMSE. Power Spectral Density (PSD) analysis provides the physical justification: while attention excels at capturing sharp semantic edges in natural images, it injects unphysical high-frequency artifacts ($>0.3$ cycles/pixel) into geophysical fields, violating the fundamental smoothness constraints of elastic surface deformation. With a 2.92ms inference latency (a $2.5\times$ speedup), the vanilla U-Net is the only candidate to comfortably meet the sub-100ms requirement for operational early-warning systems. This work bridges the "publication-to-practice" gap by proving that convolutional locality outperforms modern complexity for smooth-field regression, advocating for physics-informed simplicity in ML4RS. Code available at https://github.com/prabhjotschugh/When-Less-is-More-InSAR-Phase-Unwrapping
- Abstract(参考訳): InSARを基盤とした火山・地震モニタリングにおいて、運用段階の解凍が主要な計算ボトルネックとなっている。
我々は,物理に制約された物理レグレッションに対する適合性を検証せずに,注意機構などの複雑度の高いコンピュータビジョンアーキテクチャを採用する業界動向に挑戦する。
我々は,世界規模のLiCSARベンチマーク(20フレーム,39,724パッチ,651万ピクセル)において,最初の大規模アーキテクチャアブレーション研究を行った。
U-Net (7.76Mパラメータ) が$R^2=0.834$, RMSE$=1.01$cmを達成し, 11.37Mパラメータ・アテンションベースモデルよりも34%, RMSEでは51%向上した。
パワースペクトル密度 (PSD) 解析は、自然画像の鋭いセマンティックエッジを捉えることに注意を向ける一方で、非物理的な高周波アーティファクト (0.3$ cycles/pixel) を物理場に注入し、弾性表面の変形の基本的な滑らかさの制約を破る。
2.92msの推論レイテンシ(2.5\times$ Speedup)で、バニラU-Netは、運用早期警告システムに対する100ms以下の要件を快適に満たす唯一の候補である。
この研究は、畳み込みの局所性がスムーズなフィールド回帰のために現代の複雑さを上回ることを証明し、ML4RSの物理学的インフォームド単純さを提唱することで、「出版から実践への」ギャップを埋める。
https://github.com/prabhjotschugh/When-Less-is-More-InSAR-Phase-Unwrapping
関連論文リスト
- Linearizing Vision Transformer with Test-Time Training [54.52616866374482]
事前訓練されたトランスフォーマーからウェイトを継承することは、魅力的なショートカットを提供するが、ソフトマックスと線形アテンションの基本的な表現的ギャップは、効果的なウェイト転送を妨げている。
テスト時間トレーニング(TTT)は2層動的定式化がSoftmaxの注意と構造的に一致している線形複雑アーキテクチャである。
安定拡散3.5を線形化して、SD3.5-T$5$(Transformer to Test Time Training)を導入することで、我々のアプローチを検証する。
論文 参考訳(メタデータ) (2026-05-04T16:16:26Z) - DexWorldModel: Causal Latent World Modeling towards Automated Learning of Embodied Tasks [54.32016216994156]
本稿では,DINOv3特徴を生成対象として用い,視覚ノイズから相互作用意味を乱す因果潜在世界モデル(CLWM)を提案する。
メモリスケーリングを克服するため、CLWMはDual-State Test-Time Training (TTT)メモリを備えている。
EmbodiChainは、トレーニング中に物理基底軌道の無限の流れを注入することによって効率法を確立するオンラインフレームワークである。
論文 参考訳(メタデータ) (2026-04-13T03:19:36Z) - ReconPhys: Reconstruct Appearance and Physical Attributes from Single Video [51.2815592637053]
ReconPhysは、単一の単眼ビデオから物理的属性推定と3次元ガウススプラッティング再構成を共同で学習するフィードフォワードフレームワークである。
提案手法では, 自己教師型戦略を用いて訓練したデュアルブランチアーキテクチャを用いて, 地上の物理ラベルの必要性を解消する。
大規模合成データセットの実験は優れた性能を示した。
論文 参考訳(メタデータ) (2026-04-09T06:51:14Z) - $D^3$-RSMDE: 40$\times$ Faster and High-Fidelity Remote Sensing Monocular Depth Estimation [72.9912717963138]
リモートセンシング画像からのリアルタイムで高忠実な単眼深度推定は、多くのアプリケーションにとって不可欠である。
視覚変換器(ViT)のバックボーンを高密度な予測に使用するのは速いが、知覚品質は低いことが多い。
リモートセンシング単眼深度推定のための深度詳細拡散法(D3$-RSMDE)を提案する。
D3$-RSMDEは、Learninged Perceptual Image Patch similarity (LPIPS)の知覚距離を11.85%削減する。
論文 参考訳(メタデータ) (2026-03-17T10:50:36Z) - LeWorldModel: Stable End-to-End Joint-Embedding Predictive Architecture from Pixels [49.35636088613484]
JEPA(Joint Embedding Predictive Architectures)は、コンパクトな潜在空間で世界モデルを学習するための魅力的なフレームワークを提供する。
最初のJEPAであるLeModelWorldを紹介します。
数時間で1つのGPU上で15万のパラメータをトレーニングできるため、LeWMはファンデーションモデルベースの世界モデルよりも48倍高速に計画している。
論文 参考訳(メタデータ) (2026-03-13T19:48:14Z) - PSTNet: Physically-Structured Turbulence Network [0.0]
物理構造乱流ネットワーク(PSTNet)は、物理を直接その構造に埋め込む軽量アーキテクチャである。
PSTNetは平均ミス距離が2.8%向上し、78%の勝利率と統計的に有意な効果がある。
論文 参考訳(メタデータ) (2026-03-09T04:46:46Z) - Momentum Attention: The Physics of In-Context Learning and Spectral Forensics for Mechanistic Interpretability [0.0]
本稿では,運動性差分演算子を介して物理前兆を埋め込んだシンプレクティック拡張であるMomentum Attentionを紹介する。
直流(セマンティック)と交流(メカニスティック)の信号が高パスモーメントと相互作用するときに周波数帯域に分離することが証明された直交定理を定式化する。
論文 参考訳(メタデータ) (2026-02-03T21:31:36Z) - Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - Training Transformers for Mesh-Based Simulations [3.4998703934432682]
本稿では,アテンションマスクとして隣接行列を利用する新しいグラフトランスフォーマーアーキテクチャを提案する。
60以上のモデルをトレーニングして、FLOPのトレーニングとパラメータのスケーリングの法則を見つけます。
導入されたモデルは、最大3万ノードと300万エッジのメッシュ上で実行する、素晴らしいスケーラビリティを示している。
論文 参考訳(メタデータ) (2025-08-25T14:10:13Z) - Physics-Informed Graph Neural Networks for Transverse Momentum Estimation in CMS Trigger Systems [0.0]
高エネルギー物理におけるリアルタイム粒子横運動量(p_T$)推定は、厳密なハードウェア制約の下で効率的なアルゴリズムを要求する。
本稿では,物理インフォームドグラフニューラルネットワーク(GNN)フレームワークを提案する。
我々の共同設計手法は、既存のベースラインに比べて精度と効率のトレードオフが優れている。
論文 参考訳(メタデータ) (2025-07-25T12:19:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。