論文の概要: Discrete fully probabilistic design: a tool to design control policies
from examples
- arxiv url: http://arxiv.org/abs/2112.11210v1
- Date: Tue, 21 Dec 2021 13:44:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 20:10:23.372403
- Title: Discrete fully probabilistic design: a tool to design control policies
from examples
- Title(参考訳): 離散的完全確率的設計:例から制御ポリシーを設計するためのツール
- Authors: Enrico Ferrentino, Pasquale Chiacchio, Giovanni Russo
- Abstract要約: 本稿では,Gagliardi と Russo (2021) で最近導入されたアルゴリズムを用いて,制御ポリシを合成する離散化設計を提案する。
制約は、潜在的にノイズの多いサンプルデータで満たされる必要はなく、その制約は、制御対象と異なるシステムから収集される可能性がある。
- 参考スコア(独自算出の注目度): 2.6749261270690425
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a discretized design that expounds an algorithm recently
introduced in Gagliardi and Russo (2021) to synthesize control policies from
examples for constrained, possibly stochastic and nonlinear, systems. The
constraints do not need to be fulfilled in the possibly noisy example data,
which in turn might be collected from a system that is different from the one
under control. For this discretized design, we discuss a number of properties
and give a design pipeline. The design, which we term as discrete fully
probabilistic design, is benchmarked numerically on an example that involves
controlling an inverted pendulum with actuation constraints starting from data
collected from a physically different pendulum that does not satisfy the
system-specific actuation constraints.
- Abstract(参考訳): 本稿では,Gagliardi と Russo (2021) で最近導入されたアルゴリズムを用いて,制約付き,確率的,非線形なシステムの例から制御ポリシを合成する。
制約は、潜在的に騒がしい例データで満たす必要はなく、それは、制御されているものとは異なるシステムから収集される可能性がある。
この離散化された設計のために、我々は多くのプロパティを議論し、設計パイプラインを与える。
離散完全確率設計と呼ばれるこの設計は、システム固有のアクティベーション制約を満たさない物理的に異なる振り子から収集されたデータから始まるアクティベーション制約を持つ逆振子の制御を含む例で、数値的にベンチマークされる。
関連論文リスト
- Refined Risk Bounds for Unbounded Losses via Transductive Priors [58.967816314671296]
線形回帰の逐次変分を2乗損失、ヒンジ損失の分類問題、ロジスティック回帰で再検討する。
我々の鍵となるツールは、慎重に選択された導出先を持つ指数重み付けアルゴリズムに基づいている。
論文 参考訳(メタデータ) (2024-10-29T00:01:04Z) - Plug-and-Play Controllable Generation for Discrete Masked Models [27.416952690340903]
本稿では、離散データ制御可能な生成モデリングのための離散マスクモデルについて述べる。
本稿では,条件付きスコアのトレーニングを回避した重要サンプリングに基づく新しいプラグアンドプレイフレームワークを提案する。
本フレームワークは,制御基準の選択に非依存であり,勾配情報を必要としないため,後方サンプリングやベイズ逆問題,制約生成などのタスクに適している。
論文 参考訳(メタデータ) (2024-10-03T02:00:40Z) - You-Only-Randomize-Once: Shaping Statistical Properties in Constraint-based PCG [3.581471126368696]
制約解法のための決定変数順序付け法であるYou-Only-Randomize-Once (YORO) プレロールを導入する。
本手法は,市販のSATソルバが生成するタイルグリッド出力の統計を効果的に制御することを示す。
論文 参考訳(メタデータ) (2024-09-01T20:43:55Z) - Denoising Diffusion-Based Control of Nonlinear Systems [3.4530027457862]
本稿では,非線形力学系を制御するために,拡散確率モデル(DDPM)に基づく新しい手法を提案する。
DDPMは様々なサンプリングタスクで成功を収めた生成モデルの最先端技術である。
様々な非線形システムに対する我々のアプローチを数値的に研究し、理論的結果を検証する。
論文 参考訳(メタデータ) (2024-02-03T23:19:26Z) - Dimensionless Policies based on the Buckingham $\pi$ Theorem: Is This a
Good Way to Generalize Numerical Results? [66.52698983694613]
本稿では,バッキンガムの$pi$定理を,物理系の制御ポリシを汎用的な知識形式にエンコードするツールとして活用する。
本研究では,(1) パラメータの削減,(2) 特定のシステムに対して数値的に生成された制御ポリシを,入力変数と出力変数を適切にスケーリングすることにより,次元的に類似したシステムのサブセットに正確に転送可能であることを示す。
より複雑な高次元問題に対するポリシーを一般化するために、このアプローチがいかに実用的であるかは、まだわからないが、初期の結果は、それがaであることを示している。
論文 参考訳(メタデータ) (2023-07-29T00:51:26Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Approximating Constraint Manifolds Using Generative Models for
Sampling-Based Constrained Motion Planning [8.924344714683814]
本稿では,制約付き動作計画問題に対する学習に基づくサンプリング戦略を提案する。
本研究では,条件変数自動エンコーダ(CVAE)と条件生成適応ネット(CGAN)を用いて制約条件を満たすサンプル構成を生成する。
これら2つの生成モデルの有効性を,サンプリング精度とサンプリング分布のカバレッジの観点から評価した。
論文 参考訳(メタデータ) (2022-04-14T07:08:30Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z) - Learning to Satisfy Unknown Constraints in Iterative MPC [3.306595429364865]
本稿では,未知の多面体状態制約を満たすために繰り返し学習する線形時間不変系の制御設計法を提案する。
繰り返しタスクの各イテレーションにおいて、収集された閉ループ軌跡データを用いて未知の環境制約を推定する。
MPCコントローラは、推定された制約セットを確実に満たすように設計されている。
論文 参考訳(メタデータ) (2020-06-09T05:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。