Fugu-MT 論文翻訳(概要): Data/moment-driven approaches for fast predictive control of collective dynamics

論文の概要: Data/moment-driven approaches for fast predictive control of collective dynamics

arxiv url: http://arxiv.org/abs/2402.15611v1
Date: Fri, 23 Feb 2024 21:21:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-27 17:51:06.038721
Title: Data/moment-driven approaches for fast predictive control of collective dynamics
Title（参考訳）: データ/モーメント駆動による集団力学の高速予測制御
Authors: Giacomo Albi, Sara Bicego, Michael Herty, Yuyang Huang, Dante Kalise, Chiara Segala
Abstract要約: モデル予測制御(MPC)の2つの代替案が提案されている。まず,最適フィードバック法則のオフライン近似における教師あり学習手法の利用について述べる。次に,粒子アンサンブルの巨視的量に基づく力学の逐次線形化に基づく手順を概説する。
参考スコア（独自算出の注目度）: 1.0557437060274468
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Feedback control synthesis for large-scale particle systems is reviewed in the framework of model predictive control (MPC). The high-dimensional character of collective dynamics hampers the performance of traditional MPC algorithms based on fast online dynamic optimization at every time step. Two alternatives to MPC are proposed. First, the use of supervised learning techniques for the offline approximation of optimal feedback laws is discussed. Then, a procedure based on sequential linearization of the dynamics based on macroscopic quantities of the particle ensemble is reviewed. Both approaches circumvent the online solution of optimal control problems enabling fast, real-time, feedback synthesis for large-scale particle systems. Numerical experiments assess the performance of the proposed algorithms.
Abstract（参考訳）: 大規模粒子系のフィードバック制御合成についてモデル予測制御(mpc)の枠組みで概説する。集団動力学の高次元特性は、各ステップ毎の高速オンライン動的最適化に基づく従来のmpcアルゴリズムの性能を阻害する。 mpcの代替案が2つ提案されている。まず,最適フィードバック法則のオフライン近似における教師あり学習手法の利用について述べる。次に,粒子アンサンブルのマクロ量に基づく力学の逐次線形化に基づく手順について検討する。どちらのアプローチも、大規模粒子システムのための高速でリアルタイムなフィードバック合成を可能にする最適制御問題のオンラインソリューションを回避する。提案アルゴリズムの性能を評価する数値実験を行った。

関連論文リスト

Benchmarking Optimization Algorithms for Automated Calibration of Quantum Devices [0.0347577906896546]
本稿では,量子デバイスの校正のための最適化アルゴリズムの総合的な研究結果を紹介する。我々のベンチマークには、Nelder-Meadや最先端のCovariance Matrix Adaptation Evolution Strategy (CMA-ES)のような広く使われているアルゴリズムが含まれている。この結果に基づき,CMA-ESアルゴリズムを推奨し,全てのテストシナリオにおいて優れた性能を示す実証的証拠を提供する。
論文参考訳（メタデータ） (2025-09-10T13:00:40Z)
Intersection of Reinforcement Learning and Bayesian Optimization for Intelligent Control of Industrial Processes: A Safe MPC-based DPG using Multi-Objective BO [0.0]
Model Predictive Control (MPC)ベースのReinforcement Learning (RL)は、Deep Neural Network (DNN)ベースのRL手法の、構造化された解釈可能な代替手段を提供する。標準MPC-RLアプローチは、収束の遅さ、パラメータ化の制限による最適条件学習、オンライン適応時の安全性の問題に悩まされることが多い。 MPC-RLと多目的ベイズ最適化(MOBO)を統合した新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-14T02:31:52Z)
Predictive Lagrangian Optimization for Constrained Reinforcement Learning [15.082498910832529]
制約付き最適化は、複雑な制御タスクに対処するための強化学習で一般的に見られる。本稿では,制約付き最適化とフィードバック制御システムとの接続を構築するための,より汎用的な等価フレームワークを提案する。
論文参考訳（メタデータ） (2025-01-25T13:39:45Z)
Receding Hamiltonian-Informed Optimal Neural Control and State Estimation for Closed-Loop Dynamical Systems [4.05766189327054]
Hamiltonian-Informed Optimal Neural (Hion) コントローラは、動的システムのためのニューラルネットワークベースの新しいクラスである。ヒオンコントローラは将来の状態を推定し、ポントリャーギンの原理を用いて最適制御入力を計算する。
論文参考訳（メタデータ） (2024-11-02T16:06:29Z)
Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文参考訳（メタデータ） (2024-06-04T17:15:25Z)
Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文参考訳（メタデータ） (2023-12-19T21:45:38Z)
Socio-cognitive Optimization of Time-delay Control Problems using Evolutionary Metaheuristics [89.24951036534168]
メタヒューリスティックス(Metaheuristics)は、古典的なアプローチでは解決できない難解な問題を解くために使用される普遍的な最適化アルゴリズムである。本稿では,キャストに基づく新しい社会認知メタヒューリスティックの構築を目標とし,このアルゴリズムのいくつかのバージョンを時間遅延システムモデルの最適化に適用する。
論文参考訳（メタデータ） (2022-10-23T22:21:10Z)
Towards Robust and Accurate Myoelectric Controller Design based on Multi-objective Optimization using Evolutionary Computation [0.22835610890984162]
我々は、カーネル化されたSVM分類器を考慮し、エネルギー効率の良いEMGベースのコントローラを設計する手法を提案している。 EMGをベースとした制御器の最適化性能を達成するため,分類器設計の主な戦略は,システム全体の誤動作を低減することである。エリート的多目的進化アルゴリズムの$-$は、非支配的なソート遺伝的アルゴリズムNSGA-II (Non-dominated sorting genetic algorithm II) であり、SVMのハイパーパラメータをチューニングするために使われている。
論文参考訳（メタデータ） (2022-04-02T06:13:01Z)
Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文参考訳（メタデータ） (2022-02-23T18:11:19Z)
Quadratic mutual information regularization in real-time deep CNN models [51.66271681532262]
擬似相互情報による正規化手法を提案する。種々の二項分類問題の実験を行い,提案モデルの有効性を示した。
論文参考訳（メタデータ） (2021-08-26T13:14:24Z)
Policy Analysis using Synthetic Controls in Continuous-Time [101.35070661471124]
因果推論における手法開発において, 合成制御を用いた因果推定は最も成功した手法の1つである。本稿では,制御された微分方程式の定式化を明示的に用い,潜在反事実経路をモデル化する連続時間代替法を提案する。
論文参考訳（メタデータ） (2021-02-02T16:07:39Z)
Contextual Latent-Movements Off-Policy Optimization for Robotic Manipulation Skills [41.140532647789456]
本稿では,低次元非線形潜在力学の獲得のために,実験軌道の扱いに関する新しい考え方を提案する。 LAAMPO (Latent-Movements Policy Optimization) と呼ばれる新しい文脈外RLアルゴリズムを導入する。 LAMPOは、文献における一般的なアプローチに対するサンプル効率のよいポリシーを提供する。
論文参考訳（メタデータ） (2020-10-26T17:53:30Z)
Single-step deep reinforcement learning for open-loop control of laminar and turbulent flows [0.0]
本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
論文参考訳（メタデータ） (2020-06-04T16:11:26Z)
Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文参考訳（メタデータ） (2019-12-31T00:29:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。