論文の概要: Fine-Tuning LLMs to Generate Economical and Reliable Actions for the Power Grid
- arxiv url: http://arxiv.org/abs/2602.15350v1
- Date: Tue, 17 Feb 2026 04:33:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:17.981258
- Title: Fine-Tuning LLMs to Generate Economical and Reliable Actions for the Power Grid
- Title(参考訳): 電力グリッドのための経済・信頼性行動生成のための微調整LDM
- Authors: Mohamad Chehade, Hao Zhu,
- Abstract要約: 公共安全パワーシャットオフ(PSPS)は、標準的な運用ポイントを無効にできる急激なトポロジー変更を強制する。
本稿では,命令調整型大規模言語モデル (LLM) を微調整し,エンファンペンのみの修正型スイッチング計画を生成する,検証可能な多段階適応パイプラインを提案する。
- 参考スコア(独自算出の注目度): 4.826124200824742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Public Safety Power Shutoffs (PSPS) force rapid topology changes that can render standard operating points infeasible, requiring operators to quickly identify corrective transmission switching actions that reduce load shedding while maintaining acceptable voltage behavior. We present a verifiable, multi-stage adaptation pipeline that fine-tunes an instruction-tuned large language model (LLM) to generate \emph{open-only} corrective switching plans from compact PSPS scenario summaries under an explicit switching budget. First, supervised fine-tuning distills a DC-OPF MILP oracle into a constrained action grammar that enables reliable parsing and feasibility checks. Second, direct preference optimization refines the policy using AC-evaluated preference pairs ranked by a voltage-penalty metric, injecting voltage-awareness beyond DC imitation. Finally, best-of-$N$ selection provides an inference-time addition by choosing the best feasible candidate under the target metric. On IEEE 118-bus PSPS scenarios, fine-tuning substantially improves DC objective values versus zero-shot generation, reduces AC power-flow failure from 50\% to single digits, and improves voltage-penalty outcomes on the common-success set. Code and data-generation scripts are released to support reproducibility.
- Abstract(参考訳): パブリック・セーフティ・パワー・シャットオフ(PSPS)は、標準動作点を無効にできる急激なトポロジー変更を強制する。
命令調整された大言語モデル(LLM)を微調整して,PSPSシナリオのコンパクトなサマリから修正型スイッチングプランを生成する,検証可能な多段階適応パイプラインを提案する。
まず,DC-OPF MILPオーラクルを制約された動作文法に蒸留し,信頼性の高い解析と実現可能性チェックを可能にする。
第2に、直流模擬以上の電圧認識を注入し、電圧ペナルティメートル法でランク付けされた交流評価された選好対を用いて、直接選好最適化によりポリシーを洗練する。
最後に、ベスト・オブ・N$選択は、ターゲットメトリックの下で最も有効な候補を選択することで、推論時の追加を提供する。
IEEE 118-bus PSPSのシナリオでは、微調整は直流目標値とゼロショット生成を大幅に改善し、交流電力フローの故障を50\%から1桁に低減し、コモンサクセスセットの電圧収支結果を改善する。
コードとデータ生成スクリプトは再現性をサポートするためにリリースされている。
関連論文リスト
- An Adaptive Purification Controller for Quantum Networks: Dynamic Protocol Selection and Multipartite Distillation [10.706268477180858]
本稿では, タングル化蒸留シーケンスを自動的に最適化し, 出力を最大化する適応浄化制御器(APC)を提案する。
提案手法は,静的なプロトコルに固有の「忠実な崖」を緩和し,高雑音条件下での資源の浪費を低減する。
我々は、コントローラを異種シナリオに拡張し、マルチパーティのGHZ状態生成と連続変数システムの両方で評価する。
論文 参考訳(メタデータ) (2026-01-26T10:56:37Z) - GateRA: Token-Aware Modulation for Parameter-Efficient Fine-Tuning [51.79350934271497]
GateRAは、PEFT更新の強度を動的に調整するトークン対応変調を導入する統一フレームワークである。
適応ゲーティングを標準のPEFTブランチに組み込むことで、Gateraは選択的でトークンレベルの適応を可能にする。
複数のコモンセンス推論ベンチマークの実験により、GateRAはPEFT法よりも一貫して優れ、一致していることが示された。
論文 参考訳(メタデータ) (2025-11-15T17:55:47Z) - PASS-Enhanced MEC: Joint Optimization of Task Offloading and Uplink PASS Beamforming [67.78883135636657]
ピンチアンテナシステム (PASS) によるモバイルエッジコンピューティング (MEC) アーキテクチャについて検討した。
PASSは、重要な経路損失と潜在的な信号遮断を効果的に軽減しつつ、短距離ライン・オブ・ライト(LoS)リンクを確立する。
ネットワーク遅延最小化問題を定式化し、アップリンクPASSビームフォーミングとタスクオフロードを共同で最適化する。
論文 参考訳(メタデータ) (2025-10-27T03:04:46Z) - REFA: Reference Free Alignment for multi-preference optimization [27.079664155329535]
本稿では、終端を制御する構造トークンの確率的制御を提案する新しいアライメントフレームワークREFAを紹介する。
REFAは60.29%の勝利率と52.17%のAlpacaEval2とLlama-3-8B-Instructを達成している。
論文 参考訳(メタデータ) (2024-12-20T22:25:23Z) - Learning Model Predictive Control Parameters via Bayesian Optimization for Battery Fast Charging [0.0]
モデル予測制御(MPC)のチューニングパラメータは、特に制御器の予測と閉ループプラントの挙動に顕著な相違がある場合、重要な課題を示す。
本研究では,バッテリ高速充電の閉ループ性能向上を目的とした,未知のモデルパラメータとパラメータ化された制約バックオフ項の効率的な学習にベイズ最適化を適用した。
論文 参考訳(メタデータ) (2024-04-09T08:49:41Z) - Approximated Prompt Tuning for Vision-Language Pre-trained Models [54.326232586461614]
視覚言語による事前学習モデルでは、事前学習タスクと下流タスクのギャップを埋めるために、しばしば多くの学習可能なトークンを必要とする。
本稿では,効率的なVL転送学習を実現するために,APT(Approximated Prompt Tuning)アプローチを提案する。
論文 参考訳(メタデータ) (2023-06-27T05:43:47Z) - Scalable Optimal Design of Incremental Volt/VAR Control using Deep
Neural Networks [2.018732483255139]
深層ニューラルネットワーク(DNN)のトレーニングとして最適ルール設計(ORD)を改訂し,スケーラブルなソリューションを提案する。
我々は、深層ニューラルネットワーク(DNN)のトレーニングとしてORDを再構成することでスケーラブルなソリューションを考案した。
分析結果と数値実験により,提案したORD溶液が単相/多相供給装置に適切に適用可能であることが確認された。
論文 参考訳(メタデータ) (2023-01-04T04:19:12Z) - Effective Pre-Training Objectives for Transformer-based Autoencoders [97.99741848756302]
トランスフォーマーエンコーダの効率,コスト,精度のトレードオフについて検討する。
共通の目的の機能を組み合わせて、新しい効果的な事前学習アプローチを作成します。
論文 参考訳(メタデータ) (2022-10-24T18:39:44Z) - Data-Driven Stochastic AC-OPF using Gaussian Processes [54.94701604030199]
大量の再生可能エネルギーを電力網に統合することは、おそらく気候変動を遅らせる電力網からの二酸化炭素排出量を減らす最も有効な方法だろう。
本稿では、不確実な入力を組み込むことのできる交流電力流方程式に基づく代替データ駆動方式を提案する。
GPアプローチは、このギャップを交流電力流方程式に閉じるために、単純だが制約のないデータ駆動アプローチを学ぶ。
論文 参考訳(メタデータ) (2022-07-21T23:02:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。