論文の概要: Real-Time Auto-Optimization in Unknown Environments via Structure-Exploiting Dual Control for Exploration and Exploitation
- arxiv url: http://arxiv.org/abs/2605.22431v1
- Date: Thu, 21 May 2026 12:55:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.260502
- Title: Real-Time Auto-Optimization in Unknown Environments via Structure-Exploiting Dual Control for Exploration and Exploitation
- Title(参考訳): 構造展開デュアル制御による未知環境のリアルタイム自動最適化
- Authors: Shiying Dong, Haoyang Yang, Qiwei Liu, Wen-Hua Chen,
- Abstract要約: 本稿では,探索と利用のための高速な数値二重制御法を開発した。
未知の環境における自動最適化問題に対処する。
約1桁のスピードアップを実現し、典型的な車両組み込みCPU上では、マイクロ秒レベルの最大時間は83秒に過ぎない。
- 参考スコア(独自算出の注目度): 5.005890380363851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper develops a fast numerical dual control for exploration and exploitation (DCEE) method to address auto-optimization problems in unknown environments. In auto-optimization problems, the optimal operating condition is unknown a priori and may vary with the environment. As in classical dual control techniques, computational burden remains a major concern in DCEE for active learning. Existing DCEE methods provide a principled exploration-exploitation objective, but mainly realized through standard optimization packages or explicit gradient-type update laws, where the numerical structure of the DCEE has not been fully exploited. This paper shows that the reward function in DCEE has an inherent convex-over-nonlinear structure, where the exploitation and exploration terms form a unified nonlinear residual map equipped with a convex outer loss. Benefiting from this structure, a structure-exploiting numerical method is developed by linearizing only the nonlinear residual map while preserving the convex outer loss. Thus, each subproblem is transformed into a structured convex form that can be solved reliably. The resulting generalized Gauss-Newton Hessian approximation is positive semidefinite and depends only on first-order derivatives, thereby supporting fast online computation. The proposed method is evaluated on a vehicle cruising auto-optimization problem and compared with existing methods. Simulation and hardware-in-the-loop experimental results show that the proposed method improves control performance and achieves a speedup of approximately one order of magnitude, with a microsecond-level maximum computation time of only 83 μs on a typical vehicle embedded CPU.
- Abstract(参考訳): 本稿では,未知環境における自動最適化問題に対処するために,高速な数値二重制御法(DCEE)を開発した。
自動最適化問題では、最適動作条件は事前に不明であり、環境によって異なる可能性がある。
古典的二重制御技術と同様に、DCEEのアクティブラーニングにおける計算負担は依然として大きな関心事である。
既存のDCEE法は探索探索の目的を提供するが、主に標準最適化パッケージや、DCEEの数値構造が十分に活用されていない明示的な勾配型更新法によって実現されている。
本稿では,DCEE の報酬関数が本質的に凸-非直線構造を持つことを示す。
この構造から, 凸外損失を保ちながら, 非線形残留写像のみを線形化することにより, 構造露光数値法を開発した。
したがって、各サブプロブレムは、確実に解ける構造化凸形式に変換される。
一般化されたガウス・ニュートン・ヘッセン近似は正の半定値であり、一階微分にのみ依存し、高速オンライン計算をサポートする。
提案手法は,車両の走行自動最適化問題に対して評価し,既存手法と比較した。
シミュレーションとハードウェア・イン・ザ・ループ実験の結果、提案手法は制御性能を向上し、典型的な車両組込みCPU上では83μsのマイクロ秒レベルの最大計算時間で約1桁の高速化を実現することが示された。
関連論文リスト
- SVD-Preconditioned Gradient Descent Method for Solving Nonlinear Least Squares Problems [27.21342746802453]
本稿では,非線形最小二乗問題に対する新しい最適化アルゴリズムを提案する。
この方法は、ジャコビアンの特異値分解(SVD)を用いて勾配降下方向をプレコンディションすることで導出される。
提案手法の標準正則性仮定の下での局所線形収束を確立し、適切な条件下でアルゴリズムの修正版に対する大域収束を証明した。
論文 参考訳(メタデータ) (2026-02-07T18:53:00Z) - Variational Entropic Optimal Transport [67.76725267984578]
本稿では,ドメイン翻訳問題に対する変分エントロピー最適輸送(VarEOT)を提案する。
VarEOTは、補助正の正規化子上のトラクタブルな一般化として、log-partition $log mathbbE[exp(cdot)$の正確な変分再構成に基づいている。
合成データと画像と画像の変換に関する実験は、競争力のあるか、あるいはより良い翻訳品質を示す。
論文 参考訳(メタデータ) (2026-02-02T15:48:44Z) - Monotone Optimisation with Learned Projections [0.0]
モノトーン最適化問題は、Polyblock Outer Approximation (POA)アルゴリズムのような特殊な大域的解法を許容する。
本稿では,学習モデルをPOAに統合するアルゴリズム認識学習手法を提案する。
論文 参考訳(メタデータ) (2026-01-28T19:32:04Z) - Event-Aided Time-to-Collision Estimation for Autonomous Driving [28.13397992839372]
ニューロモルフィックなイベントベースカメラを用いて衝突時刻を推定する新しい手法を提案する。
提案アルゴリズムは, 事象データに適合する幾何モデルに対して, 効率的かつ高精度な2段階のアプローチで構成する。
合成データと実データの両方の実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-10T02:37:36Z) - Efficiently Training Deep-Learning Parametric Policies using Lagrangian Duality [55.06411438416805]
制約付きマルコフ決定プロセス(CMDP)は、多くの高度な応用において重要である。
本稿では,パラメトリックアクターポリシーを効率的に訓練するための2段階深度決定規則(TS-DDR)を提案する。
現状の手法と比較して, 解の質を高め, 数桁の計算時間を削減できることが示されている。
論文 参考訳(メタデータ) (2024-05-23T18:19:47Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Large-Scale OD Matrix Estimation with A Deep Learning Method [70.78575952309023]
提案手法は,ディープラーニングと数値最適化アルゴリズムを統合し,行列構造を推論し,数値最適化を導出する。
大規模合成データセットを用いて,提案手法の優れた一般化性能を実証するために実験を行った。
論文 参考訳(メタデータ) (2023-10-09T14:30:06Z) - An Operator-Splitting Method for the Gaussian Curvature Regularization
Model with Applications in Surface Smoothing and Imaging [6.860238280163609]
一般ガウス曲率モデルの演算子分割法を提案する。
提案手法は,パラメータの選択,効率,性能に敏感ではない。
論文 参考訳(メタデータ) (2021-08-04T08:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。