論文の概要: Self-optimizing adaptive optics control with Reinforcement Learning for
high-contrast imaging
- arxiv url: http://arxiv.org/abs/2108.11332v1
- Date: Tue, 24 Aug 2021 10:02:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-27 00:14:49.224684
- Title: Self-optimizing adaptive optics control with Reinforcement Learning for
high-contrast imaging
- Title(参考訳): 高コントラストイメージングのための強化学習による自己最適化適応光学制御
- Authors: Rico Landman, Sebastiaan Y. Haffert, Vikram M. Radhakrishnan,
Christoph U. Keller
- Abstract要約: 本稿では,モデルレス強化学習を用いて,閉ループ予測制御のためのリカレントニューラルネットワークコントローラを最適化する方法について述べる。
シミュレーションでは,我々のアルゴリズムが高次変形可能なミラーの制御にも適用可能であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current and future high-contrast imaging instruments require extreme adaptive
optics (XAO) systems to reach contrasts necessary to directly image exoplanets.
Telescope vibrations and the temporal error induced by the latency of the
control loop limit the performance of these systems. One way to reduce these
effects is to use predictive control. We describe how model-free Reinforcement
Learning can be used to optimize a Recurrent Neural Network controller for
closed-loop predictive control. First, we verify our proposed approach for
tip-tilt control in simulations and a lab setup. The results show that this
algorithm can effectively learn to mitigate vibrations and reduce the residuals
for power-law input turbulence as compared to an optimal gain integrator. We
also show that the controller can learn to minimize random vibrations without
requiring online updating of the control law. Next, we show in simulations that
our algorithm can also be applied to the control of a high-order deformable
mirror. We demonstrate that our controller can provide two orders of magnitude
improvement in contrast at small separations under stationary turbulence.
Furthermore, we show more than an order of magnitude improvement in contrast
for different wind velocities and directions without requiring online updating
of the control law.
- Abstract(参考訳): 現在および将来の高コントラスト撮像装置は、外惑星を直接撮像するために必要なコントラストに到達するために、極端適応光学系(XAO)を必要とする。
制御ループの遅延による望遠鏡振動と時間誤差は、これらのシステムの性能を制限する。
これらの効果を減らす一つの方法は予測制御を使用することである。
本稿では,モデルフリーの強化学習を用いて,閉ループ予測制御のためのリカレントニューラルネットワークコントローラの最適化について述べる。
まず,シミュレーションと実験室構成におけるチップティルト制御のアプローチを検証する。
その結果, このアルゴリズムは最適ゲイン積分器と比較して, 振動を効果的に緩和し, パワーロー入力乱流の残差を低減できることがわかった。
また,制御則のオンライン更新を必要とせずにランダム振動を最小化できることを示す。
次に,本アルゴリズムは高次変形可能なミラーの制御にも適用可能であることを示す。
我々は, 定常乱流下での小さな分離において, 制御器が2桁の等級改善を両立できることを実証する。
さらに,制御則のオンライン更新を必要とせず,異なる風速や方向に対して比較して,桁違いに改善が見られた。
関連論文リスト
- Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning [10.886819238167286]
本研究は、露光制御のためのエージェントの訓練に深層強化学習フレームワークを用いる。
トレーニングプロセスを容易にするために,軽量なイメージシミュレータを開発した。
VOシステムを強化するために異なるレベルの報酬関数が作成される。
論文 参考訳(メタデータ) (2024-08-30T04:37:52Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Structured Deep Neural Network-Based Backstepping Trajectory Tracking Control for Lagrangian Systems [9.61674297336072]
提案したコントローラは、任意の互換性のあるニューラルネットワークパラメータに対してクローズループ安定性を確保することができる。
モデル近似誤差や外乱の存在下では、閉ループ安定性と追従制御性能が保証されることが示されている。
論文 参考訳(メタデータ) (2024-03-01T09:09:37Z) - Spectrum Breathing: Protecting Over-the-Air Federated Learning Against Interference [73.63024765499719]
モバイルネットワークは、近隣のセルやジャマーからの干渉によって損なわれる可能性がある。
本稿では,帯域幅拡大を伴わない干渉を抑制するために,カスケード段階のプルーニングとスペクトル拡散を行うスペクトルブリーチングを提案する。
呼吸深度によって制御された勾配プルーニングと干渉誘発誤差の間には,性能的トレードオフが認められた。
論文 参考訳(メタデータ) (2023-05-10T07:05:43Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Two-step reinforcement learning for model-free redesign of nonlinear
optimal regulator [1.5624421399300306]
強化学習(Reinforcement Learning, RL)は、非線形力学系のための最適制御系をモデル無しで再設計できる、有望なアプローチの1つである。
未知の非線形システムに対する最適レギュレーション再設計問題において,RLの過渡学習性能を向上させるモデルフリー2段階設計手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T17:12:33Z) - Meta-Learning-Based Robust Adaptive Flight Control Under Uncertain Wind
Conditions [13.00214468719929]
リアルタイムモデル学習は、さまざまな風条件で飛行するドローンなどの複雑なダイナミクスシステムにとって困難です。
本稿では,ディープニューラルネットワークからの出力を基本関数の集合として扱うオンライン複合適応手法を提案する。
我々は,風条件の異なる空洞でドローンを飛ばし,挑戦的な軌道を飛行させることにより,我々のアプローチを検証する。
論文 参考訳(メタデータ) (2021-03-02T18:43:59Z) - Comparison of Model Predictive and Reinforcement Learning Methods for
Fault Tolerant Control [2.524528674141466]
階層的強化学習に基づく離散時間系に対する2つの適応型耐故障制御方式を提案する。
実験により、強化学習に基づく制御器は、故障下のモデル予測制御器、部分的に観測可能なシステムモデル、様々なセンサノイズレベルよりも堅牢に動作することが示されている。
論文 参考訳(メタデータ) (2020-08-10T20:22:15Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。