論文の概要: Distributed Online System Identification for LTI Systems Using Reverse
Experience Replay
- arxiv url: http://arxiv.org/abs/2207.01062v1
- Date: Sun, 3 Jul 2022 15:03:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 13:00:37.253939
- Title: Distributed Online System Identification for LTI Systems Using Reverse
Experience Replay
- Title(参考訳): 逆体験リプレイを用いたLTIシステムの分散オンラインシステム同定
- Authors: Ting-Jui Chang and Shahin Shahrampour
- Abstract要約: マルチエージェントネットワーク上での線形時間不変(LTI)システムの分散オンラインシステム同定について検討した。
本稿では,SGD-RERアルゴリズムの分散変種であるDSGD-RERを提案する。
- 参考スコア(独自算出の注目度): 14.924672048447334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identification of linear time-invariant (LTI) systems plays an important role
in control and reinforcement learning. Both asymptotic and finite-time offline
system identification are well-studied in the literature. For online system
identification, the idea of stochastic-gradient descent with reverse experience
replay (SGD-RER) was recently proposed, where the data sequence is stored in
several buffers and the stochastic-gradient descent (SGD) update performs
backward in each buffer to break the time dependency between data points.
Inspired by this work, we study distributed online system identification of LTI
systems over a multi-agent network. We consider agents as identical LTI
systems, and the network goal is to jointly estimate the system parameters by
leveraging the communication between agents. We propose DSGD-RER, a distributed
variant of the SGD-RER algorithm, and theoretically characterize the
improvement of the estimation error with respect to the network size. Our
numerical experiments certify the reduction of estimation error as the network
size grows.
- Abstract(参考訳): 線形時間不変系(LTI)の同定は制御と強化学習において重要な役割を果たす。
漸近的および有限時間オフラインシステムの識別は、文献でよく研究されている。
オンラインシステム同定のために、データシーケンスを複数のバッファに格納し、sgd(stochastic-gradient descent)アップデートが各バッファで後方に実行され、データポイント間の時間依存性を損なう、リバースエクスペリエンスリプレイ(sgd-rer)を用いた確率的勾配降下(sgd-rer)のアイデアが最近提案されている。
本研究では,マルチエージェントネットワーク上でのLTIシステムの分散オンライン識別について検討した。
我々はエージェントを同一のLTIシステムとみなし、エージェント間の通信を利用してシステムパラメータを共同で推定することを目的とする。
本研究では,sgd-rerアルゴリズムの分散型であるdsgd-rerを提案し,ネットワークサイズに対する推定誤差の改善を理論的に特徴付ける。
我々の数値実験は,ネットワークサイズが大きくなるにつれて推定誤差の低減を証明している。
関連論文リスト
- Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - CMFDFormer: Transformer-based Copy-Move Forgery Detection with Continual
Learning [52.72888626663642]
コピーモーブ偽造検出は、疑わしい偽画像中の重複領域を検出することを目的としている。
深層学習に基づく複写偽造検出手法が最上位にある。
CMFDFormer という名称の Transformer-style copy-move forgery ネットワークを提案する。
また、CMFDFormerが新しいタスクを処理できるように、新しいPCSD連続学習フレームワークを提供する。
論文 参考訳(メタデータ) (2023-11-22T09:27:46Z) - Online Self-Supervised Deep Learning for Intrusion Detection Systems [1.2952596966415793]
本稿では, 完全オンライン深層学習(DL)に基づく侵入検知システム(IDS)を実現する, SSID(Self-Supervised Intrusion Detection)フレームワークを提案する。
提案フレームワークは,IDS自体の判断に基づいて,受信するトラフィックパケットを分析し,ラベル付けする。
このアプローチは、データラベリングにおけるヒューマンエラーや、モデルトレーニングとデータ収集の人的労力と計算コストを回避する。
論文 参考訳(メタデータ) (2023-06-22T16:46:35Z) - Faulty Branch Identification in Passive Optical Networks using Machine
Learning [0.0]
パッシブ光ネットワーク(PON)は有望なブロードバンドアクセスネットワークソリューションとなっている。
PONシステムはネットワークの障害を素早く特定し、ローカライズするために、常に監視されなければならない。
機械学習(ML)ベースのアプローチは、PONシステムにおける光学的欠陥を管理する大きな可能性を示している。
論文 参考訳(メタデータ) (2023-04-03T20:59:16Z) - Deep Metric Learning for Unsupervised Remote Sensing Change Detection [60.89777029184023]
リモートセンシング変化検出(RS-CD)は、マルチテンポラルリモートセンシング画像(MT-RSI)から関連する変化を検出することを目的とする。
既存のRS-CD法の性能は、大規模な注釈付きデータセットのトレーニングによるものである。
本稿では,これらの問題に対処可能なディープメトリック学習に基づく教師なしCD手法を提案する。
論文 参考訳(メタデータ) (2023-03-16T17:52:45Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Regret Analysis of Distributed Online LQR Control for Unknown LTI
Systems [8.832969171530056]
線形時間不変(LTI)系に対する分散オンライン線形2次レギュレータ(LQR)問題について研究する。
本稿では,各エージェントが探索段階でシステム推定を計算するオンラインlqrアルゴリズムの分散型を提案する。
我々は,提案アルゴリズムが$tildeO(T2/3)$をスケールしていることを証明する。
論文 参考訳(メタデータ) (2021-05-15T23:02:58Z) - State and Topology Estimation for Unobservable Distribution Systems
using Deep Neural Networks [8.673621107750652]
リアルタイムオブザーバビリティが制限されているため,再構成可能な分散ネットワークの時間同期状態推定は困難である。
本論文では,深層学習(DL)に基づくトポロジー同定(TI)と不均衡な3相分布系状態推定(DSSE)の手法を定式化する。
2つのディープニューラルネットワーク(DNN)は、同期失調症測定装置(SMD)によって不完全に観察されるシステムに対して、TIおよびDSSEを実装するために順次動作するように訓練されます。
論文 参考訳(メタデータ) (2021-04-15T02:46:50Z) - Non-Episodic Learning for Online LQR of Unknown Linear Gaussian System [0.0]
単一の軌道からシステムに関する知識を得るオンライン非分離アルゴリズムを提案する。
識別と制御のほぼ確実に収束する割合を特徴付け、探索と搾取の間の最適なトレードオフを明らかにする。
論文 参考訳(メタデータ) (2021-03-24T15:51:28Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - Solving Sparse Linear Inverse Problems in Communication Systems: A Deep
Learning Approach With Adaptive Depth [51.40441097625201]
疎信号回復問題に対するエンドツーエンドの訓練可能なディープラーニングアーキテクチャを提案する。
提案手法は,出力するレイヤ数を学習し,各タスクのネットワーク深さを推論フェーズで動的に調整する。
論文 参考訳(メタデータ) (2020-10-29T06:32:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。