論文の概要: Reinforcement Learning for Elliptical Cylinder Motion Control Tasks
- arxiv url: http://arxiv.org/abs/2603.12807v1
- Date: Fri, 13 Mar 2026 09:10:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.754973
- Title: Reinforcement Learning for Elliptical Cylinder Motion Control Tasks
- Title(参考訳): 楕円円柱運動制御タスクの強化学習
- Authors: Pawel Marczewski, Paulina Superczynska, Jakub Bernat, Szymon Szczesny,
- Abstract要約: 我々は楕円円柱とそのトルク制限下での運動に焦点を当てている。
この問題のインスピレーションは、入力トルクが制限された距離で動作しなければならない非テザリング磁気デバイスからである。
本研究の主な目的は,入力トルクに制限のある楕円シリンダの制御問題を定義し,強化学習によって解決することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The control of devices with limited input always bring attention to solve by research due to its difficulty and non-trival solution. For instance, the inverted pendulum is benchmarking problem in control theory and machine learning. In this work, we are focused on the elliptical cylinder and its motion under limited torque. The inspiration of the problem is from untethered magnetic devices, which due to distance have to operate with limited input torque. In this work, the main goal is to define the control problem of elliptic cylinder with limited input torque and solve it by Reinforcement Learning. As a classical baseline, we evaluate a two-stage controller composed of an energy-shaping swing-up law and a local Linear Quadratic Regulator (LQR) stabilizer around the target equilibrium. The swing-up controller increases the system's mechanical energy to drive the state toward a neighborhood of the desired equilibrium, a linearization of the nonlinear model yields an LQR that regulates the angle and angular-rate states to the target orientation with bounded input. This swing-up + LQR policy is a strong, interpretable reference for underactuated system and serves a point of comparison to the learned policy under identical limits and parameters. The solution shows that the learning is possible however, the different cases like stabilization in upward position or rotating of half turn are very difficult for increasing mass or ellipses with a strongly unequal perimeter ratio.
- Abstract(参考訳): 入力が限られているデバイスの制御は、その困難さと非トリバルなソリューションのために、常に研究によって解決される。
例えば、反転振り子(英語版)は制御理論と機械学習のベンチマーク問題である。
本研究は, 楕円円柱とそのトルク制限下での運動に着目したものである。
この問題のインスピレーションは、入力トルクが制限された距離で動作しなければならない非テザリング磁気デバイスからである。
本研究の主な目的は,入力トルクに制限のある楕円シリンダの制御問題を定義し,強化学習によって解決することである。
古典的ベースラインとして,エネルギー形状の揺動法則と,目標平衡付近の局所線形擬似レギュレータ (LQR) からなる2段制御器の評価を行った。
揺動制御器は、システムの機械的エネルギーを高めて、所望の平衡の近傍に向かって状態を駆動し、非線形モデルの線形化により、角度と角速度状態を有界入力で目標向きに調節するLQRを生成する。
このSwing-up + LQRポリシーは、不動系の強い解釈可能な参照であり、同じ制限とパラメータの下で学習されたポリシーと比較するためのポイントとなる。
しかし、この解は学習が可能であることを示し、上向きの位置の安定化や半回転の回転のような異なるケースは、強い不等周比で質量や楕円を増大させるのは非常に困難である。
関連論文リスト
- Gate-Based Initialization and Fidelity in Correlated Open Quantum Systems [11.446878921275163]
本稿では,ゲート操作によるオープン量子システムの初期化,システムバス相関処理,等足歩行における制御ダイナミクスについて述べる。
ゲートの忠実度は、スピンエコのような2pi$回転付近でのエラーの抑制を示し、エラーキャンセルの本質的なメカニズムを示している。
結果は、超高速パルスによって引き起こされる強い非マルコフ力学から長寿命のエキシトニックコヒーレンスが生じることを示した。
論文 参考訳(メタデータ) (2024-10-08T18:50:20Z) - Concomitant Entanglement and Control Criticality Driven by Collective Measurements [0.0]
本研究では、量子多体状態が測定と条件付きユニタリ演算によって制御される適応量子回路について検討する。
我々は、2つの遷移を共に駆動するためには、集合的測定によって媒介される長距離臨界性が不可欠であると推測する。
論文 参考訳(メタデータ) (2024-09-10T18:00:03Z) - Probing rotational decoherence with a trapped-ion planar rotor [0.4015179935608307]
2つのポールトリップイオンからなる4マイクロメートルの平面回転子を用いて回転デコヒーレンス力学のスケーリング法則を初めて観測した。
観測されたデコヒーレンスのスケーリング関係は、最近の理論的研究とよく一致しており、ローターベースの量子アプリケーションの発展に直接関係している。
論文 参考訳(メタデータ) (2023-10-20T05:52:04Z) - Optimization of Time-Dependent Decoherence Rates and Coherent Control
for a Qutrit System [77.34726150561087]
非コヒーレント制御は、特定の制御方法で時間に応じてデコヒーレンス率を決定する。
我々は、システムの最終状態$rho(T)$と与えられたターゲット状態$rho_rmターゲットとの間のヒルベルト・シュミットの重なりを最大化する問題を考察する。
論文 参考訳(メタデータ) (2023-08-08T01:28:50Z) - Dimensionless Policies based on the Buckingham $\pi$ Theorem: Is This a
Good Way to Generalize Numerical Results? [66.52698983694613]
本稿では,バッキンガムの$pi$定理を,物理系の制御ポリシを汎用的な知識形式にエンコードするツールとして活用する。
本研究では,(1) パラメータの削減,(2) 特定のシステムに対して数値的に生成された制御ポリシを,入力変数と出力変数を適切にスケーリングすることにより,次元的に類似したシステムのサブセットに正確に転送可能であることを示す。
より複雑な高次元問題に対するポリシーを一般化するために、このアプローチがいかに実用的であるかは、まだわからないが、初期の結果は、それがaであることを示している。
論文 参考訳(メタデータ) (2023-07-29T00:51:26Z) - Analogue Spin Simulators: How to keep the Amplitude Homogeneous [1.1797787239802762]
スピングラフの基底状態をシミュレートするセットアップでは、計算的にハードな最適化問題を効率的に解くことができる。
この目標に対する現在の光学的設定は、各実効スピンの振幅と位相自由度を分離することが困難である。
本稿では,光共振器を結合した光共振器方式を提案する。
論文 参考訳(メタデータ) (2023-06-09T08:20:28Z) - Optimal control for state preparation in two-qubit open quantum systems
driven by coherent and incoherent controls via GRAPE approach [77.34726150561087]
我々は、コヒーレントかつ非コヒーレントな時間依存制御によって駆動される2つの量子ビットのモデルを考える。
系の力学はゴリーニ=コサコフスキー=スダルシャン=リンドブラッドのマスター方程式によって支配される。
最適化制御の下で, フォン・ノイマンエントロピー, 純度, および1ビット還元密度行列の進化について検討した。
論文 参考訳(メタデータ) (2022-11-04T15:20:18Z) - Canonically consistent quantum master equation [68.8204255655161]
我々は、無限小弱い系-バス結合限界を超えた開量子系の状態を正しく再現する新しい量子マスター方程式を提唱した。
本手法は, 定常状態の減少に関する知識を力学に取り入れることに基づいている。
論文 参考訳(メタデータ) (2022-05-25T15:22:52Z) - On optimization of coherent and incoherent controls for two-level
quantum systems [77.34726150561087]
本稿では、閉かつオープンな2レベル量子系の制御問題について考察する。
閉系の力学は、コヒーレント制御を持つシュリンガー方程式によって支配される。
開系の力学はゴリーニ=コサコフスキー=スダルシャン=リンドブラッドのマスター方程式によって支配される。
論文 参考訳(メタデータ) (2022-05-05T09:08:03Z) - Numerical estimation of reachable and controllability sets for a
two-level open quantum system driven by coherent and incoherent controls [77.34726150561087]
この記事では、ゴリーニ-コサコフスキー--リンドブラッド--スダルシャンマスター方程式によって支配される2段階の開量子系を考える。
系の密度行列のブロッホパラメトリゼーションを用いて解析する。
論文 参考訳(メタデータ) (2021-06-18T14:23:29Z) - A homotopy approach to coherent quantum LQG control synthesis using
discounted performance criteria [2.0508733018954843]
本稿では,プラントとコヒーレント(測定不要)制御器のフィールド経由フィードバック接続に対する線形四重項ガウス制御について述べる。
制御の目的は、クローズドループシステムを内部的に安定させ、植物変数を含む無限水平コストを最小化することである。
論文 参考訳(メタデータ) (2020-02-06T18:52:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。