論文の概要: Chance-Constrained Control with Lexicographic Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2010.09468v1
- Date: Mon, 19 Oct 2020 13:09:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 21:13:36.285545
- Title: Chance-Constrained Control with Lexicographic Deep Reinforcement
Learning
- Title(参考訳): Lexicographic Deep Reinforcement Learning を用いたチャンス制約制御
- Authors: Alessandro Giuseppi, Antonio Pietrabissa
- Abstract要約: 本稿では,レキシックなDeep Reinforcement Learning(DeepRL)に基づく確率制約マルコフ決定プロセスを提案する。
有名なDeepRLアルゴリズムDQNの辞書版も提案され、シミュレーションによって検証されている。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a lexicographic Deep Reinforcement Learning
(DeepRL)-based approach to chance-constrained Markov Decision Processes, in
which the controller seeks to ensure that the probability of satisfying the
constraint is above a given threshold. Standard DeepRL approaches require i)
the constraints to be included as additional weighted terms in the cost
function, in a multi-objective fashion, and ii) the tuning of the introduced
weights during the training phase of the Deep Neural Network (DNN) according to
the probability thresholds. The proposed approach, instead, requires to
separately train one constraint-free DNN and one DNN associated to each
constraint and then, at each time-step, to select which DNN to use depending on
the system observed state. The presented solution does not require any
hyper-parameter tuning besides the standard DNN ones, even if the probability
thresholds changes. A lexicographic version of the well-known DeepRL algorithm
DQN is also proposed and validated via simulations.
- Abstract(参考訳): 本稿では,制約を満たす確率が与えられた閾値を超えていることを保証するために,確率制約付きマルコフ決定プロセスに対する語彙学的深層強化学習(deeprl)に基づくアプローチを提案する。
標準DeepRLアプローチの必要性
一 費用関数において、多目的方式で追加の重み付き用語として含めなければならない制約
二 Deep Neural Network(DNN)のトレーニング期間中に導入したウェイトを、確率閾値に応じて調整すること。
提案手法では,各制約に関連付けられた制約のないDNNと1つのDNNを個別に学習し,各タイミングでシステム観測状態に応じてどのDNNを使用するかを選択する必要がある。
提案したソリューションは、たとえ確率閾値が変化しても、標準のDNN以外のハイパーパラメータチューニングを必要としない。
有名なDeepRLアルゴリズムDQNの辞書版も提案され、シミュレーションによって検証されている。
関連論文リスト
- Achieving Constraints in Neural Networks: A Stochastic Augmented
Lagrangian Approach [49.1574468325115]
DNN(Deep Neural Networks)の正規化は、一般化性の向上とオーバーフィッティングの防止に不可欠である。
制約付き最適化問題としてトレーニングプロセスのフレーミングによるDNN正規化に対する新しいアプローチを提案する。
我々はAugmented Lagrangian (SAL) 法を用いて、より柔軟で効率的な正規化機構を実現する。
論文 参考訳(メタデータ) (2023-10-25T13:55:35Z) - Probabilistic Reach-Avoid for Bayesian Neural Networks [71.67052234622781]
最適合成アルゴリズムは、証明された状態の数を4倍以上に増やすことができることを示す。
このアルゴリズムは、平均的な到達回避確率を3倍以上に向上させることができる。
論文 参考訳(メタデータ) (2023-10-03T10:52:21Z) - Constrained Empirical Risk Minimization: Theory and Practice [2.4934936799100034]
本稿では,Deep Neural Networks (DNN) などのパラメータ化された関数集合に対する制約の厳格化を可能にするフレームワークを提案する。
我々は、幾何学的深層学習で使用される同変ネットワークの範囲外にある制約に焦点を当てる。
このフレームワークの主な例として、畳み込みニューラルネットワーク(CNN)のフィルタをウェーブレットに制限し、これらのウェーブレットネットワークを医療領域における輪郭予測のタスクに適用する。
論文 参考訳(メタデータ) (2023-02-09T16:11:58Z) - The #DNN-Verification Problem: Counting Unsafe Inputs for Deep Neural
Networks [94.63547069706459]
#DNN-Verification問題は、DNNの入力構成の数を数えることによって安全性に反する結果となる。
違反の正確な数を返す新しい手法を提案する。
安全クリティカルなベンチマークのセットに関する実験結果を示す。
論文 参考訳(メタデータ) (2023-01-17T18:32:01Z) - POLICE: Provably Optimal Linear Constraint Enforcement for Deep Neural
Networks [19.587273175563745]
本稿では,Deep Neural Networks (DNN) のための最初の証明可能なアフィン拘束法を提案する。
本手法はサンプリングを一切必要とせず,DNNが任意の点において与えられた入力空間の領域上のアフィン制約を満たすことを確実に保証する。
論文 参考訳(メタデータ) (2022-11-02T17:48:52Z) - Certification of Iterative Predictions in Bayesian Neural Networks [79.15007746660211]
我々は、BNNモデルの軌道が与えられた状態に到達する確率に対して、安全でない状態の集合を避けながら低い境界を計算する。
我々は、制御と強化学習の文脈において、下限を用いて、与えられた制御ポリシーの安全性保証を提供する。
論文 参考訳(メタデータ) (2021-05-21T05:23:57Z) - On the Turnpike to Design of Deep Neural Nets: Explicit Depth Bounds [0.0]
本稿では,Deep Neural Networks (DNN) において,どの層を考慮すべきかという質問に対する定量的回答を試みる。
基礎となる仮定は、層ごとのニューロンの数、すなわちDNNの幅が一定であることである。
我々は、仮定の到達可能性と訓練問題における正規化項の散逸誘導選択に基づいて、DNNの必要な深さの明示的な境界を証明する。
論文 参考訳(メタデータ) (2021-01-08T13:23:37Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z) - Simple and Principled Uncertainty Estimation with Deterministic Deep
Learning via Distance Awareness [24.473250414880454]
単一ディープニューラルネットワーク(DNN)のみを必要とする高品質不確実性推定の原理的アプローチについて検討する。
この不確実性定量化を最小限の学習問題として定式化することにより、まず入力空間内のトレーニングデータから試験例の距離を定量化する入力距離認識を同定する。
次に, スペクトル正規化ニューラルガウス過程 (SNGP) を提案する。
論文 参考訳(メタデータ) (2020-06-17T19:18:22Z) - Verifiable RNN-Based Policies for POMDPs Under Temporal Logic
Constraints [31.829932777445894]
RNNベースのポリシーの適用の大きな欠点は、行動仕様の満足度に関する正式な保証を提供することの難しさである。
形式的手法と機械学習の技法を統合することにより,RNNから有限状態制御器を自動的に抽出する手法を提案する。
論文 参考訳(メタデータ) (2020-02-13T16:38:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。