論文の概要: Newton's Lantern: A Reinforcement Learning Framework for Finetuning AC Power Flow Warm Start Models
- arxiv url: http://arxiv.org/abs/2605.11102v1
- Date: Mon, 11 May 2026 18:06:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.345831
- Title: Newton's Lantern: A Reinforcement Learning Framework for Finetuning AC Power Flow Warm Start Models
- Title(参考訳): Newton's Lantern:ACパワーフローウォームスタートモデルの微調整のための強化学習フレームワーク
- Authors: Shourya Bose, Helgi Hilmarsson, Dhruv Suri,
- Abstract要約: 本稿では,グループ相対的政策最適化とベースモデルの予測の摂動に基づく学習報酬モデルを組み合わせた微調整パイプラインであるNewton's Lanternを紹介する。
IEEE 118-bus、OCC 500-bus、OCC 2000-busベンチマーク全体において、Newton's Lanternは最小限のイテレーション数を確保しながら、テストスナップショット毎に収束する唯一の方法である。
- 参考スコア(独自算出の注目度): 0.3058685580689604
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Neural warm starts can sharply reduce the number of Newton-Raphson iterations required to solve the AC power flow problem, but existing supervised approaches generalize poorly on heavily loaded instances near voltage collapse. We prove a lower bound on the Newton-Raphson iteration count that depends on the direction of the warm start error rather than on its magnitude, and show as a corollary that the bound becomes vacuous as the smallest singular value of the power-flow Jacobian shrinks, identifying the failure mode of supervised regression near the saddle-node bifurcation. Motivated by this analysis, we introduce Newton's Lantern, a finetuning pipeline that combines group relative policy optimization with a learned reward model trained on perturbations of the base model's predictions, using the iteration count itself as the supervisory signal. Across IEEE 118-bus, GOC 500-bus, and GOC 2000-bus benchmarks, Newton's Lantern is the only method that converges on every test snapshot while attaining the smallest mean iteration count.
- Abstract(参考訳): ニューラルウォームスタートは、交流電力フロー問題を解決するのに必要なニュートン・ラフソン・イテレーションの数を劇的に減少させるが、既存の教師付きアプローチは電圧崩壊に近い重負荷のインスタンスを十分に一般化する。
我々は,その大きさよりも温かい開始誤差の方向に依存するニュートン・ラフソン反復数に対する下界を証明し,サドルノード分岐近傍の教師付き回帰の失敗モードを同定し,パワーフローヤコビアン収縮の最小特異値として境界が空になることを示す。
この分析によって動機付けられたNewton's Lanternは、グループ相対的なポリシー最適化とベースモデルの予測の摂動を訓練した学習報酬モデルを組み合わせた微調整パイプラインであり、反復数自体を監督信号として利用する。
IEEE 118-bus、OCC 500-bus、OCC 2000-busベンチマーク全体において、Newton's Lanternは最小限のイテレーション数を確保しながら、テストスナップショット毎に収束する唯一の方法である。
関連論文リスト
- Backward Reconstruction of the Chafee--Infante Equation via Physics-Informed WGAN-GP [0.0]
2次元領域上の逆シャフィー-ファンテ問題の解法として、勾配ペナルティ(WGAN-GP)を持つ物理インフォームドワッサーシュタインGANを提案する。
提案手法は、U-Netジェネレータ、スペクトル正規化のPatchGAN批評家、勾配ペナルティのワッサーシュタイン損失、物理インフォームド補助用語を統合する。
その結果,初期データでは,安定なインバージョン,界面構造の高精度回復,高周波ノイズに対する堅牢性が確認された。
論文 参考訳(メタデータ) (2026-01-12T17:11:00Z) - Improved Convergence in Parameter-Agnostic Error Feedback through Momentum [49.163769734936295]
本研究では、EFと正規化更新、様々な運動量変動、パラメータに依存しない時変ステップサイズを組み合わせた正規化エラーフィードバックアルゴリズムについて検討する。
我々の結果は、ステップサイズと小さなミニバッチの減少に繋がる。
論文 参考訳(メタデータ) (2025-11-18T13:47:08Z) - NewVEM: A Newton Vertex Exchange Method for a Class of Constrained Self-Concordant Minimization Problems [13.365308428809849]
一般化された単純点への射影を計算するための高効率半平滑なニュートン法を提案し,解析する。
提案アルゴリズムの実用的な性能を数値実験により実証した。
論文 参考訳(メタデータ) (2024-07-03T17:28:17Z) - Incremental Quasi-Newton Methods with Faster Superlinear Convergence
Rates [50.36933471975506]
各成分関数が強く凸であり、リプシッツ連続勾配とヘシアンを持つ有限和最適化問題を考える。
最近提案されたインクリメンタル準ニュートン法は、BFGSの更新に基づいて、局所的な超線形収束率を達成する。
本稿では、対称ランク1更新をインクリメンタルフレームワークに組み込むことにより、より効率的な準ニュートン法を提案する。
論文 参考訳(メタデータ) (2024-02-04T05:54:51Z) - Provably Accelerating Ill-Conditioned Low-rank Estimation via Scaled
Gradient Descent, Even with Overparameterization [48.65416821017865]
この章では、スケールドグラデーション(ScaledGD)と呼ばれる新しいアルゴリズムアプローチを紹介します。
低ランク物体の条件数に依存しない定数速度で直線的に収束する。
様々なタスクに対して、勾配降下の低い摂動コストを維持できる。
論文 参考訳(メタデータ) (2023-10-09T21:16:57Z) - Hessian Averaging in Stochastic Newton Methods Achieves Superlinear
Convergence [69.65563161962245]
ニュートン法を用いて,滑らかで強凸な目的関数を考える。
最適段階において局所収束に遷移する普遍重み付き平均化スキームが存在することを示す。
論文 参考訳(メタデータ) (2022-04-20T07:14:21Z) - Bayesian inference via sparse Hamiltonian flows [16.393322369105864]
ベイジアンコアセット(Bayesian coreset)は、ベイジアン推論中に全データセットを置き換える、小さな重み付きデータサブセットである。
現在の手法は遅い傾向にあり、コアセットの構築後に二次的な推論ステップが必要であり、データ限界の証拠には限界がない。
これら3つの課題に対処する新しい手法、スパース・ハミルトン流を導入する。
論文 参考訳(メタデータ) (2022-03-11T02:36:59Z) - Newton-LESS: Sparsification without Trade-offs for the Sketched Newton
Update [88.73437209862891]
2階最適化において、潜在的なボトルネックは繰り返しごとに最適化関数のヘシアン行列を計算することである。
本稿では,ガウススケッチ行列を劇的に分散させることにより,スケッチの計算コストを大幅に削減できることを示す。
ニュートン=ルネッサはガウス埋め込みとほぼ同じ問題に依存しない局所収束率を享受していることを証明した。
論文 参考訳(メタデータ) (2021-07-15T17:33:05Z) - Robust Implicit Networks via Non-Euclidean Contractions [63.91638306025768]
暗黙のニューラルネットワークは、精度の向上とメモリ消費の大幅な削減を示す。
彼らは不利な姿勢と収束の不安定さに悩まされる。
本論文は,ニューラルネットワークを高機能かつ頑健に設計するための新しい枠組みを提供する。
論文 参考訳(メタデータ) (2021-06-06T18:05:02Z) - On Newton Screening [14.040371216692645]
我々はNewton Screening (NS) と呼ばれる新しいスクリーニング手法を開発した。
NSは、一段階局所収束を達成するという意味で、最適収束特性を有することを示す。
論文 参考訳(メタデータ) (2020-01-27T11:25:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。