論文の概要: Surpassing legacy approaches and human intelligence with hybrid single-
and multi-objective Reinforcement Learning-based optimization and
interpretable AI to enable the economic operation of the US nuclear fleet
- arxiv url: http://arxiv.org/abs/2402.11040v1
- Date: Fri, 16 Feb 2024 19:35:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 23:49:56.077343
- Title: Surpassing legacy approaches and human intelligence with hybrid single-
and multi-objective Reinforcement Learning-based optimization and
interpretable AI to enable the economic operation of the US nuclear fleet
- Title(参考訳): 単一および多目的の強化学習に基づく最適化と解釈可能なaiによる米国原子力艦隊の経済活動を可能にするレガシーアプローチとヒューマンインテリジェンス
- Authors: Paul Seurin, Koroush Shirvan
- Abstract要約: 原子力セクターは、アメリカ合衆国における炭素フリーエネルギーの主要な供給源である。
既存の原子力発電所は、ガス発電所のような代替品と経済的に競合することができないため、早期閉鎖の脅威に直面している。
我々は,Deep Reinforcement Learningに基づくコアリロードパターンの最先端化手法を開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The nuclear sector represents the primary source of carbon-free energy in the
United States. Nevertheless, existing nuclear power plants face the threat of
early shutdowns due to their inability to compete economically against
alternatives such as gas power plants. Optimizing the fuel cycle cost through
the optimization of core loading patterns is one approach to addressing this
lack of competitiveness. However, this optimization task involves multiple
objectives and constraints, resulting in a vast number of candidate solutions
that cannot be explicitly solved. While stochastic optimization (SO)
methodologies are utilized by various nuclear utilities and vendors for fuel
cycle reload design, manual design remains the preferred approach. To advance
the state-of-the-art in core reload patterns, we have developed methods based
on Deep Reinforcement Learning. Previous research has laid the groundwork for
this approach and demonstrated its ability to discover high-quality patterns
within a reasonable timeframe. However, there is a need for comparison against
legacy methods to demonstrate its utility in a single-objective setting. While
RL methods have shown superiority in multi-objective settings, they have not
yet been applied to address the competitiveness issue effectively. In this
paper, we rigorously compare our RL-based approach against the most commonly
used SO-based methods, namely Genetic Algorithm (GA), Simulated Annealing (SA),
and Tabu Search (TS). Subsequently, we introduce a new hybrid paradigm to
devise innovative designs, resulting in economic gains ranging from 2.8 to 3.3
million dollars per year per plant. This development leverages interpretable
AI, enabling improved algorithmic efficiency by making black-box optimizations
interpretable. Future work will focus on scaling this method to address a
broader range of core designs.
- Abstract(参考訳): 原子力部門は、アメリカ合衆国における炭素フリーエネルギーの主要源である。
それでも、既存の原子力発電所は、ガス発電所のような代替品と経済的に競合できないため、早期閉鎖の脅威に直面している。
コアローディングパターンの最適化による燃料サイクルコストの最適化は、この競争力の欠如に対処する1つのアプローチである。
しかし、この最適化タスクには複数の目的と制約が伴うため、明示的に解決できない候補解が多数存在する。
確率最適化(SO)手法は、燃料サイクルのリロード設計のために様々な原子力施設やベンダーによって使用されているが、手動設計は依然として好ましいアプローチである。
コアリロードパターンの最先端化に向けて,Deep Reinforcement Learningに基づく手法を開発した。
従来の研究はこのアプローチの基礎を築き、合理的な時間枠内で高品質なパターンを発見する能力を示した。
しかし、単一目的の設定でその有用性を示すために、レガシーメソッドと比較する必要がある。
rlメソッドは多目的設定において優れているが、競争力の問題に効果的に対処するためにはまだ適用されていない。
本稿では遺伝的アルゴリズム(GA)、シミュレート・アニーリング(SA)、タブ・サーチ(TS)など、最もよく使われているSOベースの手法に対して、我々のRLベースのアプローチを厳格に比較する。
続いて,革新的デザインを考案する新たなハイブリッドパラダイムを導入し,年間2.8~3.3億ドルの経済効果を得た。
この開発は解釈可能なAIを活用し、ブラックボックス最適化を解釈可能なものにすることでアルゴリズム効率を向上させる。
今後は、このメソッドをスケールして、幅広いコア設計に対処していく予定だ。
関連論文リスト
- Learning-assisted Stochastic Capacity Expansion Planning: A Bayesian
Optimization Approach [3.4137115855910767]
大規模容量拡大問題(CEP)は、地域エネルギーシステムのコスト効率の高い脱炭の中心である。
本稿では,2段階のCEPを抽出する学習支援近似解法を提案する。
本手法では, 直列集約法と比較して最大3.8%のコスト削減効果が得られた。
論文 参考訳(メタデータ) (2024-01-19T01:40:58Z) - Rethinking and Benchmarking Predict-then-Optimize Paradigm for
Combinatorial Optimization Problems [62.25108152764568]
多くのWebアプリケーションは、エネルギーコストを考慮したスケジューリング、Web広告の予算配分、ソーシャルネットワークでのグラフマッチングなど、最適化問題の解決に頼っている。
統一システムにおける予測と意思決定の性能について考察する。
我々は、現在のアプローチを包括的に分類し、既存の実験シナリオを統合する。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - Energy-Guided Continuous Entropic Barycenter Estimation for General
Costs [98.51150518987954]
任意のOTコスト関数に対して連続的エントロピーOT(EOT)バリセンタを近似する新しいアルゴリズムを提案する。
本手法は、弱いOTに基づくEOT問題の二重再構成に基づいている。
論文 参考訳(メタデータ) (2023-10-02T11:24:36Z) - A Human-on-the-Loop Optimization Autoformalism Approach for
Sustainability [27.70596933019959]
本稿では,大規模言語モデル(LLM)を用いたパーソナライズされたエネルギー問題に対する自然な対話的アプローチについて概説する。
我々は,LLMを最適化解決器で強化し,ユーザの仕様や好みを理解し,応答する能力を高める戦略を提唱した。
提案手法は,自然言語タスク仕様を自動で最適化インスタンスに翻訳することで,人間誘導最適化オートフォーマリズムという新しい概念を開拓する。
論文 参考訳(メタデータ) (2023-08-20T22:42:04Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Assessment of Reinforcement Learning Algorithms for Nuclear Power Plant
Fuel Optimization [0.0]
この研究は、深いRLを用いてロードパターンの問題を解決するための第一種アプローチを示し、任意のエンジニアリング設計最適化に利用することができる。
論文 参考訳(メタデータ) (2023-05-09T23:51:24Z) - An Empirical Evaluation of Zeroth-Order Optimization Methods on
AI-driven Molecule Optimization [78.36413169647408]
分子目的を最適化するための様々なZO最適化手法の有効性について検討する。
ZO符号に基づく勾配降下(ZO-signGD)の利点を示す。
本稿では,Guurcamol スイートから広く使用されているベンチマークタスクに対して,ZO 最適化手法の有効性を示す。
論文 参考訳(メタデータ) (2022-10-27T01:58:10Z) - Accelerating the Evolutionary Algorithms by Gaussian Process Regression
with $\epsilon$-greedy acquisition function [2.7716102039510564]
本稿では,最適化の収束を早めるために,エリート個人を推定する新しい手法を提案する。
我々の提案には、エリート個人を推定し、最適化の収束を加速する幅広い見通しがある。
論文 参考訳(メタデータ) (2022-10-13T07:56:47Z) - Improved Fitness Dependent Optimizer for Solving Economic Load Dispatch
Problem [1.5886047676987318]
フィトネス依存(Fitness Dependent)は、ミツバチの群れ決定および繁殖過程によって刺激される新しい最適化アルゴリズムである。
改良されたFitness Dependentは、低透過損失、低燃料コスト、低排出割り当ての点で優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-14T12:04:29Z) - Sequential Information Design: Markov Persuasion Process and Its
Efficient Reinforcement Learning [156.5667417159582]
本稿では,逐次情報設計の新たなモデル,すなわちマルコフ説得過程(MPP)を提案する。
MPPのプランニングは、ミオピックレシーバーに同時に説得されるシグナルポリシーを見つけ、送信者の最適な長期累積ユーティリティを誘導する、というユニークな課題に直面している。
我々は,楽観主義と悲観主義の両原理の新たな組み合わせを特徴とする,実証可能な効率のよい非回帰学習アルゴリズム,Optimism-Pessimism Principle for Persuasion Process (OP4) を設計する。
論文 参考訳(メタデータ) (2022-02-22T05:41:43Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。