論文の概要: Spectrally Safe Neural Operator Warm-Starts for Large-Scale Newton Solvers
- arxiv url: http://arxiv.org/abs/2606.21828v1
- Date: Sat, 20 Jun 2026 01:34:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 02:53:18.036812
- Title: Spectrally Safe Neural Operator Warm-Starts for Large-Scale Newton Solvers
- Title(参考訳): 大規模ニュートン解法のためのスペクトル安全なニューラル演算子ウォームスター
- Authors: Jaemin Oh, Youngkyu Lee, Jerome Darbon, George Em Karniadakis,
- Abstract要約: ニューラル作用素は、離散ヤコビアンが不確定な初期状態を生成することができることを示す。
短いラベルのない微調整相はヤコビアンスペクトルを正定値に戻す。
これにより、非正規化作用素が失敗するフルローディング範囲に収束するウォームスタートされたニュートン法が提供される。
- 参考スコア(独自算出の注目度): 5.942002179090348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural operators are increasingly used to warm-start Newton solvers for nonlinear PDEs, on the premise that a low test error places the initial guess inside the basin of attraction. We show that this premise is unreliable. An operator trained to the relative \(L^2\) error \(O(10^{-3})\) can still produce an initial state in which the discrete Jacobian is indefinite, because the mean-squared training controls error on average while leaving localized pointwise violations of the underlying physics. For a nearly incompressible hyperelasticity problem, we trace this to the predicted volume change: the operator disperses \(\mathrm{det} F\) well away from one, and the resulting Jacobian acquires negative eigenvalues even when the predicted field is visually indistinguishable from the reference. At a small scale, this is a nuisance; at a multi-million degree-of-freedom scale, it is disqualifying, since the conjugate gradient and other Krylov solvers needed for memory-feasible Newton steps assume a definite spectrum. We then show that a short, label-free fine-tuning phase -- penalizing the operator against the discrete energy, with no additional solution data -- shifts the Jacobian spectrum back to positive definite. Combined with an inexact outer loop, this gives a warm-started Newton method that converges across the full loading range where the unregularized operator fails, reaching up to 5.4\(\times\) wall-clock speedup over incremental continuation on a 3D problem with 6.4 million degrees of freedom.
- Abstract(参考訳): ニューラル作用素は、低いテスト誤差でアトラクションの流域に最初の推測が配置されるという前提で、非線形PDEに対するニュートンソルバのウォームスタートにますます使われている。
この前提は信頼できない。
相対的な \(L^2\) 誤差 \(O(10^{-3})\ に訓練された作用素は、平均二乗トレーニングが基底物理学の局所的な点方向の違反を残しながら平均で誤差を制御するため、離散ジャコビアンが不確定な初期状態を生成することができる。
作用素は \(\mathrm{det} F\) をかなり遠くに分散し、結果として得られるヤコビアンは、予測された体が基準から視覚的に区別できない場合でも負の固有値を取得する。
数百万自由度スケールでは、メモリ実現可能なニュートンステップに必要な共役勾配と他のクリロフ解法が一定のスペクトルを仮定するため、不等式である。
すると、短いラベルのない微調整フェーズ -- 離散エネルギーに対して演算子を罰し、追加の解データなしで -- がジャコビアンスペクトルを正定値に戻すことを示す。
不正確な外ループと組み合わせることで、非正規化作用素が失敗する全負荷範囲に収束するウォームスタートニュートン法が得られ、最大5.4\(\times\)のウォールクロックスピードアップに達する。
関連論文リスト
- Operator Spectroscopy of Trained Lattice Samplers [0.0]
訓練されたフィールド空間関数自体を解析する。
適合前に固定された演算子ベースにこれらの関数を投影する。
作用素基底はモデルと対称性に依存しているが、テストは一般的である。
論文 参考訳(メタデータ) (2026-05-11T20:06:15Z) - Newton's Lantern: A Reinforcement Learning Framework for Finetuning AC Power Flow Warm Start Models [0.3058685580689604]
本稿では,グループ相対的政策最適化とベースモデルの予測の摂動に基づく学習報酬モデルを組み合わせた微調整パイプラインであるNewton's Lanternを紹介する。
IEEE 118-bus、OCC 500-bus、OCC 2000-busベンチマーク全体において、Newton's Lanternは最小限のイテレーション数を確保しながら、テストスナップショット毎に収束する唯一の方法である。
論文 参考訳(メタデータ) (2026-05-11T18:06:58Z) - Backward Reconstruction of the Chafee--Infante Equation via Physics-Informed WGAN-GP [0.0]
2次元領域上の逆シャフィー-ファンテ問題の解法として、勾配ペナルティ(WGAN-GP)を持つ物理インフォームドワッサーシュタインGANを提案する。
提案手法は、U-Netジェネレータ、スペクトル正規化のPatchGAN批評家、勾配ペナルティのワッサーシュタイン損失、物理インフォームド補助用語を統合する。
その結果,初期データでは,安定なインバージョン,界面構造の高精度回復,高周波ノイズに対する堅牢性が確認された。
論文 参考訳(メタデータ) (2026-01-12T17:11:00Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - Non-Clifford diagonalization for measurement shot reduction in quantum expectation value estimation [1.2754578699685275]
短期量子コンピュータ上での期待値を推定するには、しばしば非常に多くの測定を必要とする。
本稿では,この可換性の制約を緩和する手法を提案する。
我々は、$k$-NoCliDが回路ショットの数を、しばしば非常に大きなマージンで減らし、しばしば$k$が2.2まで小さくなることを示した。
論文 参考訳(メタデータ) (2024-08-21T18:00:03Z) - Ultracold Neutrons in the Low Curvature Limit: Remarks on the
post-Newtonian effects [49.1574468325115]
曲線時空における非相対論的シュル「オーディンガー方程式の導出に摂動スキームを適用する。
中性子のエネルギースペクトルの次から次への補正を計算する。
ウルトラコールド中性子の観測の現在の精度はまだ探究できないかもしれないが、将来や他の状況でも関係がある可能性がある。
論文 参考訳(メタデータ) (2023-12-30T16:45:56Z) - Over-Parameterization Exponentially Slows Down Gradient Descent for
Learning a Single Neuron [49.45105570960104]
ランダム勾配降下のグローバル収束を$Oleft(T-3right)$ rateで証明する。
これら2つの境界は、収束率の正確な特徴づけを与える。
このポテンシャル関数は緩やかに収束し、損失関数の緩やかな収束率を示す。
論文 参考訳(メタデータ) (2023-02-20T15:33:26Z) - Hessian Averaging in Stochastic Newton Methods Achieves Superlinear
Convergence [69.65563161962245]
ニュートン法を用いて,滑らかで強凸な目的関数を考える。
最適段階において局所収束に遷移する普遍重み付き平均化スキームが存在することを示す。
論文 参考訳(メタデータ) (2022-04-20T07:14:21Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Debiased Sinkhorn barycenters [110.79706180350507]
最適輸送(OT)におけるエントロピー正則化(Entropy regularization)は、機械学習におけるWassersteinメトリクスやバリセンタに対する近年の関心の原動力となっている。
このバイアスがエントロピー正則化器を定義する基準測度とどのように密接に関連しているかを示す。
両世界の長所を保ち、エントロピーを滑らかにしないシンクホーン様の高速な反復をデバイアスド・ワッサースタインのバリセンタとして提案する。
論文 参考訳(メタデータ) (2020-06-03T23:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。