論文の概要: Deep Reinforcement Learning Based Networked Control with Network Delays
for Signal Temporal Logic Specifications
- arxiv url: http://arxiv.org/abs/2108.01317v1
- Date: Tue, 3 Aug 2021 06:33:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 13:48:59.373410
- Title: Deep Reinforcement Learning Based Networked Control with Network Delays
for Signal Temporal Logic Specifications
- Title(参考訳): 信号時間論理仕様のためのネットワーク遅延を用いた深層強化学習に基づくネットワーク制御
- Authors: Junya Ikemoto and Toshimitsu Ushio
- Abstract要約: 本稿では,信号時間論理(STL)仕様のネットワーク遅延を考慮したネットワーク型制御器の深層強化学習に基づく設計を提案する。
STLの公式の満足度は、現在の状態だけでなくシステムの挙動にも基づくため、マルコフ決定プロセス(MDP)の拡張を提案する。
我々は$taudelta$-MDPに基づいて深層ニューラルネットワークを構築し,学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel deep reinforcement learning (DRL)-based design of a
networked controller with network delays for signal temporal logic (STL)
specifications. We consider the case in which both the system dynamics and
network delays are unknown. Because the satisfaction of an STL formula is based
not only on the current state but also on the behavior of the system, we
propose an extension of the Markov decision process (MDP), which is called a
$\tau\delta$-MDP, such that we can evaluate the satisfaction of the STL formula
under the network delays using the $\tau\delta$-MDP. Thereafter, we construct
deep neural networks based on the $\tau\delta$-MDP and propose a learning
algorithm. Through simulations, we also demonstrate the learning performance of
the proposed algorithm.
- Abstract(参考訳): 本稿では,信号時相論理(stl)仕様のためのネットワーク遅延を考慮したネットワーク制御系の設計について述べる。
システムダイナミクスとネットワーク遅延の両方が未知である場合を考える。
stlの公式の満足度は現在の状態だけでなくシステムの挙動にも基づいているため、マルコフ決定過程(英語版)(mdp)の拡張を提案し、これは$\tau\delta$-mdpと呼ばれ、$\tau\delta$-mdpを用いてネットワーク遅延下でstlの公式の満足度を評価することができる。
その後,$\tau\delta$-MDPに基づくディープニューラルネットワークを構築し,学習アルゴリズムを提案する。
また,シミュレーションにより,提案アルゴリズムの学習性能を実証する。
関連論文リスト
- Properties and Potential Applications of Random Functional-Linked Types
of Neural Networks [81.56822938033119]
ランダム関数リンクニューラルネットワーク(RFLNN)は、深い構造を学習する別の方法を提供する。
本稿では周波数領域の観点からRFLNNの特性について考察する。
本稿では,より優れた性能でBLSネットワークを生成する手法を提案し,ポゾン方程式を解くための効率的なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-03T13:25:22Z) - A Neurosymbolic Approach to the Verification of Temporal Logic
Properties of Learning enabled Control Systems [0.0]
本稿では,一般的なSTL仕様に対するニューラルネットワーク(NN)コントローラの検証モデルを提案する。
また、一般的なアクティベーション機能を持つニューラルネットワークコントローラに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-03-07T04:08:33Z) - Signal Detection in MIMO Systems with Hardware Imperfections: Message
Passing on Neural Networks [101.59367762974371]
本稿では,Multi-Input-multiple-output (MIMO)通信システムにおける信号検出について検討する。
パイロット信号が限られているディープニューラルネットワーク(DNN)のトレーニングは困難であり、実用化を妨げている。
我々は、ユニタリ近似メッセージパッシング(UAMP)アルゴリズムを利用して、効率的なメッセージパッシングに基づくベイズ信号検出器を設計する。
論文 参考訳(メタデータ) (2022-10-08T04:32:58Z) - Simulating Network Paths with Recurrent Buffering Units [4.7590500506853415]
我々は,送信者が提供する時間変化負荷に応じて,エンドツーエンドのパケット遅延値を生成するモデルを求める。
本稿では,リカレントバッファリングユニット(Recurrent Buffering Unit)と呼ばれる新しいRNNスタイルのアーキテクチャに物理ネットワークパスの意味を埋め込む,ネットワークシミュレーションのための新しいグレーボックスアプローチを提案する。
論文 参考訳(メタデータ) (2022-02-23T16:46:31Z) - Two-Timescale End-to-End Learning for Channel Acquisition and Hybrid
Precoding [94.40747235081466]
本研究では,ミリ波(mmWave)大規模マルチインプット多重出力(MIMO)システムのためのエンドツーエンドの深層学習に基づくジョイントトランスシーバ設計アルゴリズムを提案する。
我々は受信したパイロットを受信機でフィードバックビットにマッピングし、さらに送信機でハイブリッドプリコーダにフィードバックビットをマッピングするDNNアーキテクチャを開発した。
論文 参考訳(メタデータ) (2021-10-22T20:49:02Z) - Learning to Estimate RIS-Aided mmWave Channels [50.15279409856091]
そこでは,観測観測のために,既知の基地局とRIS位相制御行列を併用したアップリンクチャネル推定手法を提案する。
推定性能を向上し, トレーニングオーバーヘッドを低減するため, 深部展開法において, mmWaveチャネルの固有チャネル幅を生かした。
提案したディープ・アンフォールディング・ネットワーク・アーキテクチャは,トレーニングオーバーヘッドが比較的小さく,オンライン計算の複雑さも比較的小さく,最小二乗法(LS)法より優れていることが確認された。
論文 参考訳(メタデータ) (2021-07-27T06:57:56Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Model-Based Safe Policy Search from Signal Temporal Logic Specifications
Using Recurrent Neural Networks [1.005130974691351]
本稿では,STL (Signal Temporal Logic) の仕様からコントローラを学習するためのポリシー探索手法を提案する。
システムモデルは未知であり、制御ポリシとともに学習される。
その結果,本手法は非常に少ないシステム実行で所定の仕様を満たせることが明らかとなり,オンライン制御に活用できる可能性が示唆された。
論文 参考訳(メタデータ) (2021-03-29T20:21:55Z) - Proactive and AoI-aware Failure Recovery for Stateful NFV-enabled
Zero-Touch 6G Networks: Model-Free DRL Approach [0.0]
ゼロタッチPFR(ZT-PFR)と呼ばれるモデルフリー深部強化学習(DRL)に基づくアクティブ障害回復フレームワークを提案する。
ZT-PFRは、ネットワーク機能仮想化(NFV)対応ネットワークにおける組み込みステートフル仮想ネットワーク機能(VNF)用です。
論文 参考訳(メタデータ) (2021-02-02T21:40:35Z) - Deep Neural Networks using a Single Neuron: Folded-in-Time Architecture
using Feedback-Modulated Delay Loops [0.0]
本稿では、任意の大きさのディープニューラルネットワークを、複数の時間遅延フィードバックループを持つ単一ニューロンに折り畳む方法を提案する。
本発明の単一ニューロン深部ニューラルネットワークは、単一の非線形性のみを含み、フィードバック信号の調整を適切に調整する。
Folded-in-time DNN(Fit-DNN)と呼ばれる新しい手法は、ベンチマークタスクのセットで有望な性能を示す。
論文 参考訳(メタデータ) (2020-11-19T21:45:58Z) - Neural Architecture Search For LF-MMI Trained Time Delay Neural Networks [61.76338096980383]
TDNN(State-of-the-the-art Factored Time delay Neural Network)の2種類のハイパーパラメータを自動的に学習するために、さまざまなニューラルネットワークサーチ(NAS)技術が使用されている。
DARTSメソッドはアーキテクチャ選択とLF-MMI(格子のないMMI)TDNNトレーニングを統合する。
300時間のSwitchboardコーパスで行われた実験では、自動構成システムはベースラインLF-MMI TDNNシステムより一貫して優れていることが示唆された。
論文 参考訳(メタデータ) (2020-07-17T08:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。