論文の概要: Autonomous Adaptive Solver Selection for Chemistry Integration via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2604.00264v1
- Date: Tue, 31 Mar 2026 21:44:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.737486
- Title: Autonomous Adaptive Solver Selection for Chemistry Integration via Reinforcement Learning
- Title(参考訳): 強化学習による化学統合のための自律的適応型溶媒選択
- Authors: Eloghosa Ikponmwoba, Opeoluwa Owoyele,
- Abstract要約: 本稿では,化学統合中に暗黙的BDF積分器(CVODE)と準定常解器(QSS)を自律的に選択する制約付き強化学習(RL)フレームワークを提案する。
0D同質の原子炉条件全体では、RL適応政策は平均速度が約3倍、速度が1.11倍から10.58倍になる。
再訓練なしでは、0D訓練された政策は1D逆流拡散炎に10ドル-2000mathrms-1$で移行し、一貫した$approx 2.2を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The computational cost of stiff chemical kinetics remains a dominant bottleneck in reacting-flow simulation, yet hybrid integration strategies are typically driven by hand-tuned heuristics or supervised predictors that make myopic decisions from instantaneous local state. We introduce a constrained reinforcement learning (RL) framework that autonomously selects between an implicit BDF integrator (CVODE) and a quasi-steady-state (QSS) solver during chemistry integration. Solver selection is cast as a Markov decision process. The agent learns trajectory-aware policies that account for how present solver choices influence downstream error accumulation, while minimizing computational cost under a user-prescribed accuracy tolerance enforced through a Lagrangian reward with online multiplier adaptation. Across sampled 0D homogeneous reactor conditions, the RL-adaptive policy achieves a mean speedup of approximately $3\times$, with speedups ranging from $1.11\times$ to $10.58\times$, while maintaining accurate ignition delays and species profiles for a 106-species \textit{n}-dodecane mechanism and adding approximately $1\%$ inference overhead. Without retraining, the 0D-trained policy transfers to 1D counterflow diffusion flames over strain rates $10$--$2000~\mathrm{s}^{-1}$, delivering consistent $\approx 2.2\times$ speedup relative to CVODE while preserving near-reference temperature accuracy and selecting CVODE at only $12$--$15\%$ of space-time points. Overall, the results demonstrate the potential of the proposed reinforcement learning framework to learn problem-specific integration strategies while respecting accuracy constraints, thereby opening a pathway toward adaptive, self-optimizing workflows for multiphysics systems with spatially heterogeneous stiffness.
- Abstract(参考訳): 固い化学運動学の計算コストは、反応流シミュレーションにおいて主要なボトルネックとなっているが、ハイブリッド統合戦略は、通常は手動のヒューリスティックや、瞬時に局所状態から筋電図決定を行う教師付き予測器によって駆動される。
本稿では,化学統合中に暗黙的BDF積分器(CVODE)と準定常解器(QSS)を自律的に選択する制約付き強化学習(RL)フレームワークを提案する。
ソルバー選択はマルコフ決定プロセスとしてキャストされる。
このエージェントは、オンライン乗算器適応によるラグランジアン報酬によって実施される、ユーザが規定した精度の許容条件下での計算コストを最小化しつつ、現在の解法選択が下流の誤差蓄積に与える影響を考慮に入れた軌道対応ポリシーを学習する。
サンプル化された0D同質の原子炉条件全体にわたって、RL適応政策は平均速度が約$3\times$で、1.11\times$から10.58\times$で、正確な着火遅延と106種の種プロファイルを維持し、約$1\%の推論オーバーヘッドを加算する。
再トレーニングなしでは、0Dトレーニングされたポリシーは1D逆流拡散炎に10ドル-2000〜\mathrm{s}^{-1}$で変換され、ほぼ参照温度の精度を維持しながらCVODEに対して一貫した$\approx 2.2\times$スピードアップを提供するとともに、CVODEをわずか12ドル-15ドル%の時空点で選択する。
その結果,空間的不均一な剛性を有する多物理系に対する適応的自己最適化ワークフローへの道を開いた。
関連論文リスト
- Operator Learning Using Weak Supervision from Walk-on-Spheres [81.26322147849918]
トレーニング型PDEソルバは、高価なデータ生成や不安定な物理インフォームドニューラルネットワーク(PINN)によってボトルネックされることが多い
モンテカルロ法を用いてPDEの解をトレーニング中の弱監督過程として推定する手法を提案する。
論文 参考訳(メタデータ) (2026-03-01T17:23:39Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - Optimal Unconstrained Self-Distillation in Ridge Regression: Strict Improvements, Precise Asymptotics, and One-Shot Tuning [61.07540493350384]
自己蒸留(英: Self-distillation, SD)とは、教師自身の予測と地道の混合で学生を訓練する過程である。
任意の予測リスクに対して、各正規化レベルにおいて、最適に混合された学生がリッジ教師に改善されることが示される。
本稿では,グリッド探索やサンプル分割,再構成なしに$star$を推定する一貫したワンショットチューニング手法を提案する。
論文 参考訳(メタデータ) (2026-02-19T17:21:15Z) - Latent Generative Solvers for Generalizable Long-Term Physics Simulation [12.894423121609526]
Latent Generative Solvers (LGS) は、様々なPDE状態を事前訓練されたVAEで共有された潜在物理空間にマッピングするフレームワークである。
我々の重要なメカニズムは、トレーニングと推論中に潜伏入力を摂動する不確実性ノブであり、解法にオフマニフォールドロールアウトドリフトを補正するように教える。
LGSは短地平線上での強力な決定論的ニューラルネットワークベースラインと一致し、長い地平線上でのロールアウトドリフトを大幅に低減する。
論文 参考訳(メタデータ) (2026-02-11T15:34:52Z) - Constraint-Aware Discrete-Time PID Gain Optimization for Robotic Joint Control Under Actuator Saturation [18.71390061417015]
実効ループは離散時間実行、アクチュエータ飽和、小さな遅延と測定の不完全さによって連続時間理論から逸脱する。
飽和離散時間ジョイント制御のための実装認識分析およびチューニングワークフローを提案する。
論文 参考訳(メタデータ) (2026-01-26T16:11:05Z) - SADA: Stability-guided Adaptive Diffusion Acceleration [24.250318487331228]
拡散モデルは生成的タスクにおいて顕著な成功を収めたが、高い計算コストに悩まされている。
既存のトレーニングフリー加速戦略は、ステップごとの計算コストを削減しつつ、サンプリング時間を効果的に削減し、信頼性を低下させる。
本稿では, ODE に基づく生成モデルのサンプリングを高速化する新しいパラダイムとして, 安定誘導型適応拡散加速法 (SADA) を提案する。
論文 参考訳(メタデータ) (2025-07-23T02:15:45Z) - Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - COmoving Computer Acceleration (COCA): $N$-body simulations in an emulated frame of reference [0.0]
我々は,ハイブリッドフレームワークであるComoving Computer Acceleration (COCA)を紹介した。
正確な運動方程式は、基準のエミュレートされたフレームで解き、任意のエミュレーション誤差を設計によって補正する。
COCAは、粒子軌道におけるエミュレーション誤差を効率的に低減し、MLなしで対応するシミュレーションを実行するよりもはるかに少ない力評価を必要とする。
論文 参考訳(メタデータ) (2024-09-03T17:27:12Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。