論文の概要: QI-MPC: A Hybrid Quantum-Inspired Model Predictive Control for Learning Optimal Policies
- arxiv url: http://arxiv.org/abs/2504.13041v1
- Date: Thu, 17 Apr 2025 15:55:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-25 18:02:46.384023
- Title: QI-MPC: A Hybrid Quantum-Inspired Model Predictive Control for Learning Optimal Policies
- Title(参考訳): QI-MPC: 最適政策学習のためのハイブリッド量子インスピレーションモデル予測制御
- Authors: Muhammad Al-Zafar Khan, Jamal Al-Karaki,
- Abstract要約: 本稿では、変分量子回路を用いてMPC問題における制御警察を学習するQIMPC(Quantum-Inspired Model Predictive Control)を提案する。
アプローチの生存性は、目標追跡制御戦略、エネルギー効率の高い建築気候制御、自律車体力学、単純な振り子、複合振り子という5つの実験で検証される。
- 参考スコア(独自算出の注目度): 0.276240219662896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present Quantum-Inspired Model Predictive Control (QIMPC), an approach that uses Variational Quantum Circuits (VQCs) to learn control polices in MPC problems. The viability of the approach is tested in five experiments: A target-tracking control strategy, energy-efficient building climate control, autonomous vehicular dynamics, the simple pendulum, and the compound pendulum. Three safety guarantees were established for the approach, and the experiments gave the motivation for two important theoretical results that, in essence, identify systems for which the approach works best.
- Abstract(参考訳): 本稿では、変分量子回路(VQC)を用いてMPC問題における制御警察の学習を行うQIMPC(Quantum-Inspired Model Predictive Control)を提案する。
アプローチの生存性は、目標追跡制御戦略、エネルギー効率の高い建築気候制御、自律車体力学、単純な振り子、複合振り子という5つの実験で検証される。
このアプローチに対して3つの安全性保証が確立され、実験は2つの重要な理論的結果の動機を与えた。
関連論文リスト
- Robust Quantum Control via a Model Predictive Control Strategy [4.197316670989004]
本稿では,有界不確実性を考慮した2レベル量子系のロバスト制御戦略を提案する。
TOMPCアルゴリズムの安定性を保証するための理論的結果を示す。
数値シミュレーションにより、不確実性が存在する場合、我々の量子TOMPCアルゴリズムはロバスト性を高め、その状態を高い忠実度で所望の状態に導出することを示した。
論文 参考訳(メタデータ) (2024-02-12T04:05:54Z) - Non-Markovian Quantum Control via Model Maximum Likelihood Estimation
and Reinforcement Learning [0.0]
環境の非マルコフ的性質を低次元有効貯留層に組み込む新しい手法を提案する。
従来のトモグラフィ法よりも効率的な量子力学の学習に機械学習技術を用いる。
このアプローチはモデルバイアスの問題を緩和するだけでなく、量子力学のより正確な表現を提供する。
論文 参考訳(メタデータ) (2024-02-07T18:37:17Z) - Control of open quantum systems via dynamical invariants [0.0]
動的不変量の理論を用いて環境影響下で量子システムを制御することの課題に対処する。
我々は,環境騒音や散逸に対して堅牢な制御プロトコルを開発するために,リバースエンジニアリングアプローチを採用している。
論文 参考訳(メタデータ) (2023-11-22T05:09:53Z) - Conformal Policy Learning for Sensorimotor Control Under Distribution
Shifts [61.929388479847525]
本稿では,センサコントローラの観測値の分布変化を検知・応答する問題に焦点をあてる。
鍵となる考え方は、整合量子を入力として取ることができるスイッチングポリシーの設計である。
本稿では, 基本方針を異なる特性で切り替えるために, 共形量子関数を用いてこのようなポリシーを設計する方法を示す。
論文 参考訳(メタデータ) (2023-11-02T17:59:30Z) - Augmenting Control over Exploration Space in Molecular Dynamics
Simulators to Streamline De Novo Analysis through Generative Control Policies [0.0]
分子動力学シミュレーション(MD)における強化学習(RL)を用いた制御, 有効性, 拡張性向上のための基礎的手法であるP5モデルを提案する。
我々の革新的な戦略は、標的となるポリマー鎖の配座のサンプリングを最適化し、37.1%以上の効率改善を図った。
論文 参考訳(メタデータ) (2023-06-26T13:54:52Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Model-Free Quantum Control with Reinforcement Learning [0.0]
本研究では,量子制御タスクにおける強化学習エージェントをモデル無しで学習するための回路ベースアプローチを提案する。
実験可能な観測機器の測定値を用いて学習エージェントに報奨を与える方法を示す。
このアプローチは、サンプル効率の観点から、広く使われているモデルフリーメソッドよりも大幅に優れている。
論文 参考訳(メタデータ) (2021-04-29T17:53:26Z) - Imitation Learning from MPC for Quadrupedal Multi-Gait Control [63.617157490920505]
本稿では,歩行ロボットの複数の歩行を模倣する単一ポリシーを学習する学習アルゴリズムを提案する。
モデル予測制御によって導かれる模擬学習のアプローチであるMPC-Netを使用し、拡張します。
ハードウェアに対する我々のアプローチを検証し、学習したポリシーが教師に取って代わって複数の歩留まりを制御できることを示します。
論文 参考訳(メタデータ) (2021-03-26T08:48:53Z) - Evolutionary Stochastic Policy Distillation [139.54121001226451]
本稿では,GCRS課題を解決するための進化的政策蒸留法(ESPD)を提案する。
ESPDは、政策蒸留(PD)技術により、ターゲットポリシーを一連の変種から学習することを可能にする
MuJoCo制御系に基づく実験により,提案手法の学習効率が向上した。
論文 参考訳(メタデータ) (2020-04-27T16:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。