論文の概要: Timescale Separation Enables Deep Reinforcement Learning Control of Rotating Detonation Engine Mode Transitions
- arxiv url: http://arxiv.org/abs/2604.14398v1
- Date: Wed, 15 Apr 2026 20:27:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.597666
- Title: Timescale Separation Enables Deep Reinforcement Learning Control of Rotating Detonation Engine Mode Transitions
- Title(参考訳): 回転デトネーションエンジンモード遷移の深部強化学習制御を可能にするタイムスケール分離
- Authors: Kristian Holme, Jean Rabault, Ricardo Vinuesa, Mikael Mortensen,
- Abstract要約: 深層強化学習(DRL)は複雑な非線形力学を制御するための有望な手法である。
DRLコントローラを1次元の低次RDEモデルで空間分割注入圧を変調するように訓練する。
様々なアクティベーション期間、初期状態、ターゲットモードにおいて、移動フレームで訓練されたコントローラは、静止フレームで訓練されたコントローラよりも確実に学習する。
- 参考スコア(独自算出の注目度): 2.747173908186719
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rotating detonation engines (RDEs) are a promising propulsion concept that may offer higher thermodynamic efficiency and specific impulse than conventional systems, but nonlinear phenomena, including transitions to oscillatory or chaotic propagation modes, can hinder practical operation. Deep Reinforcement Learning (DRL) has emerged as a promising method for controlling complex nonlinear dynamics such as those observed in RDEs. However, the multi-timescale nature of the RDE system makes direct application of DRL challenging. We address this challenge by reformulating the DRL problem in a moving reference frame that follows the detonation-wave pattern, making the wave structure appear quasi-steady to the agent. This reformulation enables scale separation between fast detonation propagation and slower operating-mode dynamics. We train DRL controllers to modulate spatially segmented injection pressure in a one-dimensional reduced-order RDE model and induce rapid transitions between different mode-locked states. Across a range of actuation periods, initial states, and target modes, controllers trained in the moving frame learn more reliably than those trained in a stationary frame and remain effective over a broader range of actuation periods. These results suggest that symmetry-aware moving reference frame formulations may be useful for related multiscale flow-control problems and that scale separation should be exploited whenever possible to enable DRL control of multi-timescale systems.
- Abstract(参考訳): 回転デトネーションエンジン(RDE)は、従来のシステムよりも高い熱力学的効率と特定のインパルスを提供するという有望な推進概念であるが、振動モードやカオス伝播モードへの移行を含む非線形現象は実用的な動作を妨げる。
深層強化学習(Dreep Reinforcement Learning, DRL)は, RDEで観測されるような複雑な非線形力学を制御するための有望な手法である。
しかし、RDEシステムのマルチ時間特性はDRLの直接適用を困難にしている。
この課題に対処するために、DRL問題を起爆波パターンに従う移動参照フレームで修正し、その波の構造をエージェントに準定常に見せる。
この改質により、高速デトネーション伝播と遅い動作モードダイナミクスのスケール分離が可能となる。
我々はDRLコントローラを訓練し、1次元の低次RDEモデルで空間分割注入圧を変調し、異なるモードロック状態間の急激な遷移を誘導する。
様々なアクティベーション期間、初期状態、ターゲットモードにおいて、移動フレームで訓練されたコントローラは、静止フレームで訓練されたコントローラよりも確実に学習し、より広い範囲のアクティベーション期間にわたって有効である。
これらの結果は, 対称性を考慮した移動参照フレームの定式化は, 関連するマルチスケールフロー制御問題に有効であり, スケール分離を可能な限り活用して, マルチスケールシステムのDRL制御を可能にすることを示唆している。
関連論文リスト
- Efficient Dilated Squeeze and Excitation Neural Operator for Differential Equations [2.5796735709994643]
D-SENOは、幅広い偏微分方程式を効率的に解くための軽量な演算子学習フレームワークである。
D-SENOは拡張畳み込み(DC)ブロックと圧縮励起(SE)モジュールを組み合わせることで、広い受容場とダイナミクスを共同で捉える。
論文 参考訳(メタデータ) (2026-01-24T10:38:06Z) - SDAR: A Synergistic Diffusion-AutoRegression Paradigm for Scalable Sequence Generation [62.14510717860079]
本稿では, 自己回帰モデルの学習効率を, 拡散の並列推論能力で統一するSynergistic Diffusion-Autoregressionパラダイムを提案する。
SDARは、十分に訓練された自己回帰モデル(AR)を、簡潔でデータ効率のよい適応を通じてブロックワイズ拡散モデルに変換する、軽量なパラダイム変換を実行する。
この知見に基づいて、SDARは最小コストで効率的なAR-拡散変換を実現し、並列生成を可能にしながら、ARレベルのパフォーマンスを維持する。
論文 参考訳(メタデータ) (2025-10-07T17:29:28Z) - Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking [39.407739937584104]
深部強化学習制御器の頑健性を改善するため,頑健なモデル独立有界限界探索(ES)フィードバック制御について検討した。
ロスアラモス中性子科学センター線形粒子加速器における低エネルギービーム輸送部の自動チューニングのための一般時変系とES-DRL制御器の数値的研究を行った。
論文 参考訳(メタデータ) (2025-10-02T18:53:02Z) - Interpretable and Efficient Data-driven Discovery and Control of Distributed Systems [1.5195865840919498]
強化学習(Reinforcement Learning, RL)は、高次元非線形力学を持つシステムにおいて、有望な制御パラダイムとして登場した。
PDE制御のためのデータ効率,解釈可能,スケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-06T18:26:19Z) - Iterative Learning Control of Fast, Nonlinear, Oscillatory Dynamics (Preprint) [0.0]
非線形でカオス的で、しばしばアクティブな制御方式では速すぎる。
そこで我々は,反復的,軌道最適化,パラメータ調整による代替能動制御システムを開発した。
特定の要件を満たす限り、コントローラは情報不足や制御不能なパラメータに対して堅牢であることを示す。
論文 参考訳(メタデータ) (2024-05-30T13:27:17Z) - Compressing Deep Reinforcement Learning Networks with a Dynamic
Structured Pruning Method for Autonomous Driving [63.155562267383864]
深部強化学習(DRL)は複雑な自律運転シナリオにおいて顕著な成功を収めている。
DRLモデルは、必然的に高いメモリ消費と計算をもたらし、リソース限定の自動運転デバイスへの広範な展開を妨げる。
そこで本研究では,DRLモデルの非重要なニューロンを段階的に除去する,新しい動的構造化プルーニング手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T09:00:30Z) - Turbulence control in plane Couette flow using low-dimensional neural
ODE-based models and deep reinforcement learning [0.0]
DManD-RL (data-driven manifold dynamics-RL) は,データ駆動型低次元モデルを生成する。
我々はRL制御エージェントを訓練し、数値シミュレーションで440倍のスピードアップを達成した。
エージェントは900時間以内の未確認DNSテストトラジェクトリの84%をラミナライズするポリシーを学習する。
論文 参考訳(メタデータ) (2023-01-28T05:47:10Z) - Deep Explicit Duration Switching Models for Time Series [84.33678003781908]
状態依存型と時間依存型の両方のスイッチングダイナミクスを識別できるフレキシブルモデルを提案する。
状態依存スイッチングは、リカレントな状態-スイッチ接続によって実現される。
時間依存スイッチング動作を改善するために、明示的な期間カウント変数が使用される。
論文 参考訳(メタデータ) (2021-10-26T17:35:21Z) - Dynamic Mode Decomposition in Adaptive Mesh Refinement and Coarsening
Simulations [58.720142291102135]
動的モード分解(DMD)はコヒーレントなスキームを抽出する強力なデータ駆動方式である。
本稿では,異なるメッシュトポロジと次元の観測からDMDを抽出する戦略を提案する。
論文 参考訳(メタデータ) (2021-04-28T22:14:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。