論文の概要: Discrete fully probabilistic design: a tool to design control policies
from examples
- arxiv url: http://arxiv.org/abs/2112.11210v1
- Date: Tue, 21 Dec 2021 13:44:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 20:10:23.372403
- Title: Discrete fully probabilistic design: a tool to design control policies
from examples
- Title(参考訳): 離散的完全確率的設計:例から制御ポリシーを設計するためのツール
- Authors: Enrico Ferrentino, Pasquale Chiacchio, Giovanni Russo
- Abstract要約: 本稿では,Gagliardi と Russo (2021) で最近導入されたアルゴリズムを用いて,制御ポリシを合成する離散化設計を提案する。
制約は、潜在的にノイズの多いサンプルデータで満たされる必要はなく、その制約は、制御対象と異なるシステムから収集される可能性がある。
- 参考スコア(独自算出の注目度): 2.6749261270690425
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a discretized design that expounds an algorithm recently
introduced in Gagliardi and Russo (2021) to synthesize control policies from
examples for constrained, possibly stochastic and nonlinear, systems. The
constraints do not need to be fulfilled in the possibly noisy example data,
which in turn might be collected from a system that is different from the one
under control. For this discretized design, we discuss a number of properties
and give a design pipeline. The design, which we term as discrete fully
probabilistic design, is benchmarked numerically on an example that involves
controlling an inverted pendulum with actuation constraints starting from data
collected from a physically different pendulum that does not satisfy the
system-specific actuation constraints.
- Abstract(参考訳): 本稿では,Gagliardi と Russo (2021) で最近導入されたアルゴリズムを用いて,制約付き,確率的,非線形なシステムの例から制御ポリシを合成する。
制約は、潜在的に騒がしい例データで満たす必要はなく、それは、制御されているものとは異なるシステムから収集される可能性がある。
この離散化された設計のために、我々は多くのプロパティを議論し、設計パイプラインを与える。
離散完全確率設計と呼ばれるこの設計は、システム固有のアクティベーション制約を満たさない物理的に異なる振り子から収集されたデータから始まるアクティベーション制約を持つ逆振子の制御を含む例で、数値的にベンチマークされる。
関連論文リスト
- Denoising Diffusion-Based Control of Nonlinear Systems [3.4530027457862]
本稿では,非線形力学系を制御するために,拡散確率モデル(DDPM)に基づく新しい手法を提案する。
DDPMは様々なサンプリングタスクで成功を収めた生成モデルの最先端技術である。
様々な非線形システムに対する我々のアプローチを数値的に研究し、理論的結果を検証する。
論文 参考訳(メタデータ) (2024-02-03T23:19:26Z) - Multitask Kernel-based Learning with First-Order Logic Constraints [13.70920563542248]
オブジェクトの集合上で定義された複数の述語を例から共用的に学習するマルチタスク学習方式を考える。
FOL節をカーネルベースの述語によって計算された出力に対処できる連続的な実装に変換するための一般的なアプローチが提示される。
論文 参考訳(メタデータ) (2023-11-06T18:44:55Z) - Dimensionless Policies based on the Buckingham $\pi$ Theorem: Is This a
Good Way to Generalize Numerical Results? [66.52698983694613]
本稿では,バッキンガムの$pi$定理を,物理系の制御ポリシを汎用的な知識形式にエンコードするツールとして活用する。
本研究では,(1) パラメータの削減,(2) 特定のシステムに対して数値的に生成された制御ポリシを,入力変数と出力変数を適切にスケーリングすることにより,次元的に類似したシステムのサブセットに正確に転送可能であることを示す。
より複雑な高次元問題に対するポリシーを一般化するために、このアプローチがいかに実用的であるかは、まだわからないが、初期の結果は、それがaであることを示している。
論文 参考訳(メタデータ) (2023-07-29T00:51:26Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Approximating Constraint Manifolds Using Generative Models for
Sampling-Based Constrained Motion Planning [8.924344714683814]
本稿では,制約付き動作計画問題に対する学習に基づくサンプリング戦略を提案する。
本研究では,条件変数自動エンコーダ(CVAE)と条件生成適応ネット(CGAN)を用いて制約条件を満たすサンプル構成を生成する。
これら2つの生成モデルの有効性を,サンプリング精度とサンプリング分布のカバレッジの観点から評価した。
論文 参考訳(メタデータ) (2022-04-14T07:08:30Z) - Learning Stochastic Parametric Differentiable Predictive Control
Policies [2.042924346801313]
本稿では、ニューラルネットワークポリシーの教師なし学習のための、パラメトリック微分可能予測制御(SP-DPC)と呼ばれるスケーラブルな代替手法を提案する。
SP-DPCはパラメトリック制約最適制御問題に対する決定論的近似として定式化される。
閉ループ制約と確率満足度に関するSP-DPC法を用いて学習したポリシーに関する理論的確率的保証を提供する。
論文 参考訳(メタデータ) (2022-03-02T22:46:32Z) - Neuro-Symbolic Entropy Regularization [78.16196949641079]
構造化予測では、目的は構造化されたオブジェクトをエンコードする多くの出力変数を共同で予測することである。
エントロピー正則化(Entropy regularization)という1つのアプローチは、決定境界が低確率領域にあるべきであることを示唆している。
我々は、モデルが有効対象を確実に予測することを奨励する損失、ニューロシンボリックエントロピー正規化を提案する。
論文 参考訳(メタデータ) (2022-01-25T06:23:10Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z) - Learning to Satisfy Unknown Constraints in Iterative MPC [3.306595429364865]
本稿では,未知の多面体状態制約を満たすために繰り返し学習する線形時間不変系の制御設計法を提案する。
繰り返しタスクの各イテレーションにおいて、収集された閉ループ軌跡データを用いて未知の環境制約を推定する。
MPCコントローラは、推定された制約セットを確実に満たすように設計されている。
論文 参考訳(メタデータ) (2020-06-09T05:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。