Fugu-MT 論文翻訳(概要): Numerical Demonstration of Multiple Actuator Constraint Enforcement Algorithm for a Molten Salt Loop

論文の概要: Numerical Demonstration of Multiple Actuator Constraint Enforcement Algorithm for a Molten Salt Loop

arxiv url: http://arxiv.org/abs/2202.02094v1
Date: Fri, 4 Feb 2022 11:58:40 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-07 17:08:19.030209
Title: Numerical Demonstration of Multiple Actuator Constraint Enforcement Algorithm for a Molten Salt Loop
Title（参考訳）: 溶融塩ループに対する複数アクチュエータ拘束強化アルゴリズムの数値実証
Authors: Akshay J. Dave, Haoyu Wang, Roberto Ponciroli, Richard B. Vilim
Abstract要約: 溶融塩ループの自律制御に対して、解釈可能で適応可能なデータ駆動機械学習アプローチを実証する。適応性に対処するために、制御アルゴリズムを使用して、定数と時間依存の制約を強制しながらアクチュエータセットポイントを変更する。
参考スコア（独自算出の注目度）: 5.6006269492683725
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: To advance the paradigm of autonomous operation for nuclear power plants, a data-driven machine learning approach to control is sought. Autonomous operation for next-generation reactor designs is anticipated to bolster safety and improve economics. However, any algorithms that are utilized need to be interpretable, adaptable, and robust. In this work, we focus on the specific problem of optimal control during autonomous operation. We will demonstrate an interpretable and adaptable data-driven machine learning approach to autonomous control of a molten salt loop. To address interpretability, we utilize a data-driven algorithm to identify system dynamics in state-space representation. To address adaptability, a control algorithm will be utilized to modify actuator setpoints while enforcing constant, and time-dependent constraints. Robustness is not addressed in this work, and is part of future work. To demonstrate the approach, we designed a numerical experiment requiring intervention to enforce constraints during a load-follow type transient.
Abstract（参考訳）: 原子力発電所の自律運転のパラダイムを推し進めるために、データ駆動機械学習による制御のアプローチが求められている。次世代原子炉設計の自律運転は安全性を高め、経済性を向上させることが期待されている。しかし、利用されるアルゴリズムは、解釈可能、適応可能、堅牢である必要がある。本研究では,自律運転時の最適制御の具体的問題に焦点をあてる。溶融塩ループの自律制御に対する解釈可能かつ適応可能なデータ駆動機械学習アプローチを実証する。解釈可能性に対処するために、状態空間表現におけるシステムダイナミクスの同定にデータ駆動アルゴリズムを用いる。適応性に対処するために、制御アルゴリズムを利用して、定数と時間依存制約を課しながらアクチュエータのセットポイントを修正する。この作業では堅牢性は対処されておらず、将来の作業の一部である。提案手法を実証するために,負荷追従型過渡期における制約を強制するための介入を必要とする数値実験を設計した。

関連論文リスト

Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文参考訳（メタデータ） (2025-09-24T13:35:15Z)
Action Flow Matching for Continual Robot Learning [57.698553219660376]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文参考訳（メタデータ） (2025-04-25T16:26:15Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
Scenario-based Thermal Management Parametrization Through Deep Reinforcement Learning [0.4218593777811082]
本稿では,熱管理機能に対する学習に基づくチューニング手法を提案する。我々の深層強化学習エージェントは、チューニングタスクコンテキストを処理し、組込みパラメータセットのイメージベースの解釈を組み込む。本稿では,バルブ制御器のパラメトリゼーションタスクへの適用性を実証し,実際の車両試験で検証する。
論文参考訳（メタデータ） (2024-08-04T13:19:45Z)
Distributed Robust Learning based Formation Control of Mobile Robots based on Bioinspired Neural Dynamics [14.149584412213269]
まず,変数構造とカスケード設計手法を用いた分散推定器を導入し,実時間性能向上のための微分情報の必要性を排除した。そして、スムーズな制御入力を提供し、スピードジャンプ問題を効果的に解決することを目的とした、バイオインスパイアされたニューラルダイナミックベースのアプローチを用いて、キネマティックトラッキング制御法を開発した。完全に未知の力学と乱れを持つロボットの課題に対処するために,学習に基づく頑健な動的コントローラを開発した。
論文参考訳（メタデータ） (2024-03-23T04:36:12Z)
A Safe Reinforcement Learning Algorithm for Supervisory Control of Power Plants [7.1771300511732585]
モデルフリー強化学習(RL)は、制御タスクのための有望なソリューションとして登場した。本稿では,監督制御のための近似ポリシ最適化に基づく確率制約付きRLアルゴリズムを提案する。本手法は, 原子力プラント設計における負荷追従操作において, 違反距離と違反率の最小化を実現するものである。
論文参考訳（メタデータ） (2024-01-23T17:52:49Z)
Active Uncertainty Reduction for Safe and Efficient Interaction Planning: A Shielding-Aware Dual Control Approach [9.07774184840379]
本稿では,暗黙的二重制御パラダイムに基づく対話型動作計画における能動的不確実性低減を実現するアルゴリズムを提案する。提案手法は, 動的プログラミングのサンプリングに基づく近似に依拠し, リアルタイム勾配最適化法で容易に解けるモデル予測制御問題に導かれる。
論文参考訳（メタデータ） (2023-02-01T01:34:48Z)
Learning Robust Policy against Disturbance in Transition Dynamics via State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文参考訳（メタデータ） (2021-12-20T13:13:05Z)
Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文参考訳（メタデータ） (2021-05-25T19:48:35Z)
Strictly Batch Imitation Learning by Energy-based Distribution Matching [104.33286163090179]
すなわち、強化信号へのアクセスがなく、遷移力学の知識がなく、環境とのさらなる相互作用もない。 1つの解決策は、既存のアルゴリズムをオフライン環境で動作させるために、見習いの学習に適合させることである。しかし、このようなアプローチは、政治外の評価やオフラインモデルの推定に大きく依存しており、間接的で非効率である可能性がある。優れたソリューションは、ポリシーを明示的にパラメータ化し、ロールアウトダイナミクスから暗黙的に学習し、完全にオフラインで運用できるべきだ、と私たちは主張する。
論文参考訳（メタデータ） (2020-06-25T03:27:59Z)
Improving Input-Output Linearizing Controllers for Bipedal Robots via Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文参考訳（メタデータ） (2020-04-15T18:15:49Z)
Thinking While Moving: Deep Reinforcement Learning with Concurrent Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文参考訳（メタデータ） (2020-04-13T17:49:29Z)
Online Constrained Model-based Reinforcement Learning [13.362455603441552]
主要な要件は、限られた時間とリソース予算内に留まりながら、継続的な状態とアクションスペースを扱う能力である。本稿では,ガウス過程回帰と回帰水平制御を組み合わせたモデルに基づくアプローチを提案する。本研究では,自動走行作業におけるオンライン学習のメリットを実証する。
論文参考訳（メタデータ） (2020-04-07T15:51:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。