論文の概要: DualTCN: A Physics-Constrained Temporal Convolutional Network for 2 Time-Domain Marine CSEM Inversion
- arxiv url: http://arxiv.org/abs/2605.04997v1
- Date: Wed, 06 May 2026 14:58:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.889122
- Title: DualTCN: A Physics-Constrained Temporal Convolutional Network for 2 Time-Domain Marine CSEM Inversion
- Title(参考訳): DualTCN: 2つの時間領域海洋CSEMインバージョンのための物理制約付き時間畳み込みネットワーク
- Authors: Khaled Ahmed, Ghada Omar,
- Abstract要約: DualTCNは、時間領域の海洋電磁制御源(MCSEM)過渡データを反転させるための最初のディープラーニングフレームワークである。
このフレームワークは、4つのアースモデルパラメータを回帰し、微分可能なソフトステップデコーダを用いてプロファイルを再構成する。
このフレームワークは、カリキュラムベースの振幅増大によるノイズに対する高い堅牢性を示し、平均$barR2$ 0.858 at $pm2%$ランダム振幅誤差を維持している。
- 参考スコア(独自算出の注目度): 1.2031796234206138
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: DualTCN is the first deep-learning framework for inverting time-domain marine controlled-source electromagnetic (MCSEM) transient data. Moving away from traditional subsurface discretization, the framework regresses four earth-model parameters -- $σ_1$, $σ_2$, $d_1$, $d_2$ -- and reconstructs conductivity-depth profiles using a differentiable soft-step decoder. The optimized architecture (379K parameters) features a Temporal Convolutional Network (TCN) encoder paired with a late-time branch and an auxiliary seafloor-depth head. This design achieves a 25.3\% loss reduction over baseline models, with high predictive accuracy ($R^2 = 0.898$ for $σ_2$) and an inversion speed of 3.5~ms per sample on an A100 GPU. The framework demonstrates high robustness to noise through curriculum-based amplitude augmentation, maintaining a mean $\bar{R}^2$ of 0.858 at $\pm2\%$ random amplitude error, compared to $0.363$ without augmentation. DualTCN generalizes effectively to three-layer extensions (seawater/resistive layer/basement), accurately resolving basement conductivity ($R^2 \approx 0.88$), though thin-layer resolution remains a physical limitation ($R^2 \approx 0.23$). In comparative benchmarks, DualTCN significantly outperforms traditional local optimization methods like Levenberg-Marquardt and L-BFGS-B, yielding a mean $\bar{R}^2 = 0.877$ versus 0.129-0.439 for multi-start baselines, while operating at up to 21,000$\times$ lower computational cost. Finally, the framework incorporates uncertainty quantification via Monte Carlo (MC) Dropout. While well-calibrated for $σ_1$ (PICP90 = 0.944), inherent signal limitations at short offsets (200m) lead to under-coverage for $d_2$ (PICP90 = 0.572), which can be mitigated through post-hoc temperature scaling or split conformal prediction.
- Abstract(参考訳): DualTCNは、時間領域の海洋電磁制御源(MCSEM)過渡データを反転させるための最初のディープラーニングフレームワークである。
従来の地下の離散化から離れて、このフレームワークは4つのアースモデルパラメータ($σ_1$, $σ_2$, $d_1$, $d_2$)を回帰し、微分可能なソフトステップデコーダを用いて導電性深度プロファイルを再構成する。
最適化されたアーキテクチャ(379Kパラメータ)は、一時畳み込みネットワーク(TCN)エンコーダと、遅い時間分岐と補助的な海底深度ヘッドが組み合わされている。
この設計は、ベースラインモデルよりも25.3\%の損失削減を実現し、高い予測精度(R^2 = 0.898$ for $σ_2$)とA100 GPU上のサンプルあたり3.5〜msの反転速度を実現している。
このフレームワークは、カリキュラムベースの振幅増大によるノイズに対する高い堅牢性を示し、平均$\bar{R}^2$ of 0.858 at $\pm2\%$ランダム振幅誤差を維持している。
DualTCNは、3層拡張(海水/抵抗層/基底)に効果的に一般化し、地下導電率を正確に解決する(R^2 \approx 0.88$)が、薄層分解能は物理的制限(R^2 \approx 0.23$)のままである。
比較ベンチマークでは、DualTCN は従来の局所最適化手法である Levenberg-Marquardt や L-BFGS-B を大きく上回り、平均$\bar{R}^2 = 0.877$対 0.129-0.439 となる。
最後に、このフレームワークはモンテカルロ・ドロップアウト(MC)による不確実な定量化を取り入れている。
σ_1$ (PICP90 = 0.944) についてはよく校正されているが、短いオフセットでの信号制限 (200m) は、熱後のスケーリングや整合予測の分割によって緩和できる$d_2$ (PICP90 = 0.572) のアンダーカバーに繋がる。
関連論文リスト
- When Less Is More: Simplicity Beats Complexity for Physics-Constrained InSAR Phase Unwrapping [0.34376560669160394]
InSARを基盤とした火山・地震モニタリングにおいて、運用段階の解凍が主要な計算ボトルネックとなっている。
我々は,世界規模のLiCSARベンチマーク(20フレーム,39,724パッチ,651万ピクセル)における最初の大規模アーキテクチャアブレーション研究を示す。
論文 参考訳(メタデータ) (2026-04-28T02:36:08Z) - The Recurrent Transformer: Greater Effective Depth and Efficient Decoding [48.9323408950142]
Recurrent Transformerは、各レイヤがそれぞれのアクティベーションから計算されたキーと値のペアに付随する、シンプルなアーキテクチャ変更である。
このアーキテクチャは, (i) 従来のトランスフォーマーと (ii) トークン・ツー・グレッシブ・リカレント更新の両方を軽度な仮定でエミュレートできることを示す。
論文 参考訳(メタデータ) (2026-04-23T02:12:58Z) - Breaking the KV Cache Bottleneck: Fan Duality Model Achieves O(1) Decode Memory with Superior Associative Recall [0.0]
Fan Duality Modelは、シーケンスモデリングにおけるメモリ効率と連想リコールの間の緊張を解消する。
FDMはシーケンス処理を、長距離パターンを隠蔽状態に圧縮する波動成分と、特定のトークンを取得する粒子成分の2つのコンポーネントに分割する。
本稿では,再帰的なスキャンを凍結し,キャッシュを埋め込みと共に最適化する2段階のトレーニング戦略であるFreeze-Scanを提案する。
論文 参考訳(メタデータ) (2026-04-09T02:00:30Z) - Optimal Decay Spectra for Linear Recurrences [6.508284558109273]
PoSTは任意の対角線再帰をオーバーヘッドなく統合する。
Mamba RWKV-7、Gated DeltaNet、Gated Linear Attention、RetNetでインスタンス化します。
論文 参考訳(メタデータ) (2026-04-08T23:54:57Z) - Scaling DoRA: High-Rank Adaptation via Factored Norms and Fused Kernels [83.99688944263843]
DoRA(Weight-De Low-Rank Adaptation)は、LoRAを方向から分離することで拡張する。
d_in = 8192 とランク r = 384 では、単一のモジュールのノルムは bf16 で512MB の過渡的なワーキングメモリを必要とする。
因子ノルムは、二乗ノルムを O(d_out r + r2) 中間体を通して計算可能な基底、交差、およびグラマー項に分解し、密積を除去する。
論文 参考訳(メタデータ) (2026-03-23T17:57:24Z) - Radial Müntz-Szász Networks: Neural Architectures with Learnable Power Bases for Multidimensional Singularities [3.1861308132183375]
ラジアル Mntz-Szsz Networks (RMN) は、学習可能なラジアルパワーの線形結合として、負の指数を含む$r$を表す。
RMNは座標よりも1.5$times$-51$times$低いRMSE、10$times$-100$times$低いRMSEを達成する。
論文 参考訳(メタデータ) (2026-02-09T09:25:37Z) - AdamHD: Decoupled Huber Decay Regularization for Language Model Pre-Training [0.2578242050187029]
AdamHuberDecayはAdamWのドロップイン代替品で、$ell$ペナルティを分離したスムーズなHuberレギュレータで置き換える。
GPT-2 と GPT-3 の事前学習実験により,AdamHuberDecay は壁面時間で 10-15% の速度で収束することが示された。
論文 参考訳(メタデータ) (2025-11-18T18:08:20Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - Robust Layerwise Scaling Rules by Proper Weight Decay Tuning [50.11170157029911]
現代のスケール不変アーキテクチャでは、トレーニングは急速に劣化したグラデーション状態に入る。
我々は,AdamWに対して,幅をまたいだサブ層ゲインを保ったウェイトデカイスケーリングルールを導入する。
この結果は,パラメータが設定した定常スケールを明示的に制御することにより,ほぼ入出力体制を超えて$mu$Pを拡大する。
論文 参考訳(メタデータ) (2025-10-17T02:58:35Z) - FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA [68.44043212834204]
Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。
Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。
論文 参考訳(メタデータ) (2025-05-19T07:32:56Z) - Bounding the Width of Neural Networks via Coupled Initialization -- A
Worst Case Analysis [121.9821494461427]
2層ReLUネットワークに必要なニューロン数を著しく削減する方法を示す。
また、事前の作業を改善するための新しい下位境界を証明し、ある仮定の下では、最善を尽くすことができることを証明します。
論文 参考訳(メタデータ) (2022-06-26T06:51:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。