論文の概要: Neural Network-based Control for Multi-Agent Systems from
Spatio-Temporal Specifications
- arxiv url: http://arxiv.org/abs/2104.02737v1
- Date: Tue, 6 Apr 2021 18:08:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 12:39:22.528019
- Title: Neural Network-based Control for Multi-Agent Systems from
Spatio-Temporal Specifications
- Title(参考訳): 時空間仕様を用いたマルチエージェントシステムのニューラルネットワーク制御
- Authors: Suhail Alsalehi, Noushin Mehdipour, Ezio Bartocci and Calin Belta
- Abstract要約: 仕様言語としてSTREL(Spatio-Temporal Reach and Escape Logic)を使用します。
STREL仕様を用いた制御合成問題のマッピングを行い,勾配法と勾配法の組み合わせによる解法を提案する。
我々はオフライン最適化の結果を用いてニューラルネットワークをトレーニングし、制御が現在の状態を入力する機械学習技術を開発した。
- 参考スコア(独自算出の注目度): 0.757024681220677
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a framework for solving control synthesis problems for multi-agent
networked systems required to satisfy spatio-temporal specifications. We use
Spatio-Temporal Reach and Escape Logic (STREL) as a specification language. For
this logic, we define smooth quantitative semantics, which captures the degree
of satisfaction of a formula by a multi-agent team. We use the novel
quantitative semantics to map control synthesis problems with STREL
specifications to optimization problems and propose a combination of heuristic
and gradient-based methods to solve such problems. As this method might not
meet the requirements of a real-time implementation, we develop a machine
learning technique that uses the results of the off-line optimizations to train
a neural network that gives the control inputs at current states. We illustrate
the effectiveness of the proposed framework by applying it to a model of a
robotic team required to satisfy a spatial-temporal specification under
communication constraints.
- Abstract(参考訳): 時空間仕様を満たすために必要なマルチエージェントネットワークシステムの制御合成問題を解くためのフレームワークを提案する。
仕様言語としてspatio-Temporal ReachとEscape Logic(STREL)を用いる。
この論理は,多エージェントチームによる公式の満足度を捉えるスムーズな定量的意味論を定義する。
本稿では,新しい量的意味論を用いて,STREL仕様の制御合成問題を最適化し,ヒューリスティック法と勾配法を組み合わせた手法を提案する。
本手法はリアルタイム実装の要件を満たしない可能性があるため,オフライン最適化の結果を用いてニューラルネットワークをトレーニングし,現在の状態における制御入力を与える機械学習技術を開発した。
通信制約下での時空間仕様を満たすために必要なロボットチームのモデルに適用し,提案手法の有効性について述べる。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Neural Horizon Model Predictive Control -- Increasing Computational Efficiency with Neural Networks [0.0]
予測制御をモデル化するための機械学習支援手法を提案する。
安全保証を維持しつつ,問題地平線の一部を近似することを提案する。
提案手法は,迅速な制御応答を必要とするアプリケーションを含む,幅広いアプリケーションに適用可能である。
論文 参考訳(メタデータ) (2024-08-19T08:13:37Z) - Learning for Semantic Knowledge Base-Guided Online Feature Transmission
in Dynamic Channels [41.59960455142914]
本稿では,エンドツーエンド通信システムにおける動的チャネル条件とデバイスモビリティの課題に対処する,オンライン最適化フレームワークを提案する。
提案手法は,多レベル特徴伝達を駆動するための意味的知識ベースを活用することによって,既存の手法に基づいている。
オンライン最適化の課題を解決するために,リアルタイム意思決定のための報酬関数を慎重に設計した,ソフトアクターに基づく深層強化学習システムの設計を行った。
論文 参考訳(メタデータ) (2023-11-30T07:35:56Z) - Neural Harmonium: An Interpretable Deep Structure for Nonlinear Dynamic
System Identification with Application to Audio Processing [4.599180419117645]
解釈可能性(Interpretability)は、モデルを一般化し、その限界を明らかにする能力を理解するのに役立ちます。
本稿では,動的システムモデリングのための因果解釈可能な深部構造を提案する。
提案モデルは,時間周波数領域におけるシステムモデリングによる調和解析を利用する。
論文 参考訳(メタデータ) (2023-10-10T21:32:15Z) - Neural Fields with Hard Constraints of Arbitrary Differential Order [61.49418682745144]
我々は、ニューラルネットワークに厳しい制約を課すための一連のアプローチを開発する。
制約は、ニューラルネットワークとそのデリバティブに適用される線形作用素として指定することができる。
私たちのアプローチは、広範囲の現実世界のアプリケーションで実証されています。
論文 参考訳(メタデータ) (2023-06-15T08:33:52Z) - Learning Robust and Correct Controllers from Signal Temporal Logic
Specifications Using BarrierNet [5.809331819510702]
我々は,STL定量的セマンティクスを利用して,ロバスト満足度の概念を定義した。
本研究では,STLのフラグメント内の式を満足させる訓練可能な高次制御バリア関数(HOCBF)を構築する。
我々は、他のニューラルネットワークパラメータとともにHOCBFをトレーニングし、コントローラの堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2023-04-12T21:12:15Z) - Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Learning Equality Constraints for Motion Planning on Manifolds [10.65436139155865]
深層ニューラルネットワークを用いた実演から制約の表現を学習する問題について考察する。
鍵となる考え方は、制約付きサンプリングベースのモーションプランナに統合に適した制約のレベルセット関数を学習することである。
学習した制約と分析的に記述された制約の両方をプランナーに組み合わせ、プロジェクションベースの戦略を使って有効点を見つけます。
論文 参考訳(メタデータ) (2020-09-24T17:54:28Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。