論文の概要: Dimensionless Policies based on the Buckingham $\pi$ Theorem: Is it a
good way to Generalize Numerical Results?
- arxiv url: http://arxiv.org/abs/2307.15852v1
- Date: Sat, 29 Jul 2023 00:51:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 19:04:17.758997
- Title: Dimensionless Policies based on the Buckingham $\pi$ Theorem: Is it a
good way to Generalize Numerical Results?
- Title(参考訳): Buckingham $\pi$ Theorem に基づく次元のないポリシー: 数値結果の一般化には良い方法か?
- Authors: Alexandre Girard
- Abstract要約: 本研究では,無次元変数を用いた問題定式化の修正により,最適制御則の再利用が可能であることを示す。
これは、トルク制限された倒立振子を揺動させる古典的な動作制御問題に対して、数値的に生成された最適制御器を用いて実証される。
- 参考スコア(独自算出の注目度): 91.96295735974765
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Yes if the context, the list of variables defining the motion control
problem, is dimensionally similar. Here we show that by modifying the problem
formulation using dimensionless variables, we can re-use the optimal control
law generated numerically for a specific system to a sub-space of dimensionally
similar systems. This is demonstrated, with numerically generated optimal
controllers, for the classic motion control problem of swinging-up a
torque-limited inverted pendulum. We also discuss the concept of regime, a
region in the space of context variables, that can help relax the condition on
dimensional similarity. Futhermore, we discuss how applying dimensionnal
scaling of the input and output of a context-specific policy is equivalent to
substituing the new systems parameters in an analytical equation for
dimentionnaly similar systems. It remains to be seen if this approach can also
help generalizing policies for more complex high-dimensional problems.
- Abstract(参考訳): そう、文脈、運動制御問題を定義する変数のリストは次元的に類似している。
ここでは,無次元変数を用いた問題定式化の修正により,特定の系に対して生成した最適制御則を次元的に類似した系の部分空間に数値的に再利用できることを示す。
これはトルク制限反転振子を揺動させる古典的な運動制御問題に対して、数値的に生成された最適制御器を用いて実証される。
また、文脈変数の空間における領域であるレジームの概念についても論じ、次元的類似性の条件を緩和するのに役立つ。
さらに、文脈特異的なポリシーの入力と出力の次元的スケーリングの適用は、ディメンショナリ類似系の解析方程式における新しいシステムパラメータの置換と等価かについて議論する。
このアプローチがより複雑な高次元問題に対するポリシーの一般化にも役立つかどうかは不明だ。
関連論文リスト
- Synthesizing Interpretable Control Policies through Large Language Model Guided Search [7.706225175516503]
Pythonのような標準言語のプログラムとしてコントロールポリシを表現しています。
シミュレーションで候補コントローラを評価し,事前学習したLLMを用いてそれらを進化させる。
本手法は,カップタスクにおける振り子の振り上げとボールの解釈可能な制御ポリシの合成への応用を通して述べる。
論文 参考訳(メタデータ) (2024-10-07T18:12:20Z) - Neural Time-Reversed Generalized Riccati Equation [60.92253836775246]
ハミルトン方程式は、コストテートとして知られる補助変数を通して最適性の解釈を提供する。
本稿では,前向きに作業することを目的とした,新しいニューラルベースによる最適制御手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T19:29:37Z) - Conformal Policy Learning for Sensorimotor Control Under Distribution
Shifts [61.929388479847525]
本稿では,センサコントローラの観測値の分布変化を検知・応答する問題に焦点をあてる。
鍵となる考え方は、整合量子を入力として取ることができるスイッチングポリシーの設計である。
本稿では, 基本方針を異なる特性で切り替えるために, 共形量子関数を用いてこのようなポリシーを設計する方法を示す。
論文 参考訳(メタデータ) (2023-11-02T17:59:30Z) - A Physics-informed Deep Learning Approach for Minimum Effort Stochastic
Control of Colloidal Self-Assembly [9.791617215182598]
制御目的は、所定の初期確率尺度から最小制御労力で所定の終端確率尺度へ状態PDFを操る観点から定式化される。
我々は、関連する最適制御問題に対する最適性の条件を導出する。
提案手法の性能は, ベンチマークコロイド自己集合問題に対する数値シミュレーションにより検証した。
論文 参考訳(メタデータ) (2022-08-19T07:01:57Z) - A Recursive Partitioning Approach for Dynamic Discrete Choice Modeling
in High Dimensional Settings [0.0]
動的離散選択モデルの推定は、しばしば計算集約的で高次元の設定では不可能である。
状態変数の高次元集合を含む動的離散選択モデルの半パラメトリック定式化を提案する。
論文 参考訳(メタデータ) (2022-08-02T14:13:25Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Continuous-Time Fitted Value Iteration for Robust Policies [93.25997466553929]
ハミルトン・ヤコビ・ベルマン方程式の解法は、制御、ロボティクス、経済学を含む多くの領域において重要である。
連続適合値反復(cFVI)とロバスト適合値反復(rFVI)を提案する。
これらのアルゴリズムは、多くの連続制御問題の非線形制御-アフィンダイナミクスと分離可能な状態とアクション報酬を利用する。
論文 参考訳(メタデータ) (2021-10-05T11:33:37Z) - Policy Optimization for Linear-Quadratic Zero-Sum Mean-Field Type Games [1.1852406625172216]
線形力学と二次効用を持つゼロサム平均場型ゲーム (ZSMFTG) について検討した。
政策勾配に依存する2つの政策最適化手法を提案する。
論文 参考訳(メタデータ) (2020-09-02T13:49:08Z) - Sparse Identification of Nonlinear Dynamical Systems via Reweighted
$\ell_1$-regularized Least Squares [62.997667081978825]
本研究は, 非線形系の制御方程式をノイズ状態測定から復元するための繰り返しスパース規則化回帰法を提案する。
本研究の目的は、状態測定ノイズの存在下での手法の精度とロバスト性を改善することである。
論文 参考訳(メタデータ) (2020-05-27T08:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。