論文の概要: Data-driven rules for multidimensional reflection problems
- arxiv url: http://arxiv.org/abs/2311.06639v1
- Date: Sat, 11 Nov 2023 18:36:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 17:29:11.378087
- Title: Data-driven rules for multidimensional reflection problems
- Title(参考訳): 多次元反射問題に対するデータ駆動ルール
- Authors: S\"oren Christensen, Asbj{\o}rn Holk Thomsen and Lukas Trottner
- Abstract要約: 反射型制御を伴う可逆拡散に対する多変量特異制御問題について検討する。
与えられた拡散力学に対して、最適な領域が強い星型であると仮定し、ポリトープ近似に基づく勾配降下アルゴリズムを提案し、コスト最小化領域を数値的に決定する。
最後に,制御器に拡散力学が未知な場合のデータ駆動型解について検討する。
- 参考スコア(独自算出の注目度): 1.0742675209112622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the recent past data-driven algorithms for solving stochastic optimal
control problems in face of model uncertainty have become an increasingly
active area of research. However, for singular controls and underlying
diffusion dynamics the analysis has so far been restricted to the scalar case.
In this paper we fill this gap by studying a multivariate singular control
problem for reversible diffusions with controls of reflection type. Our
contributions are threefold. We first explicitly determine the long-run average
costs as a domain-dependent functional, showing that the control problem can be
equivalently characterized as a shape optimization problem. For given diffusion
dynamics, assuming the optimal domain to be strongly star-shaped, we then
propose a gradient descent algorithm based on polytope approximations to
numerically determine a cost-minimizing domain. Finally, we investigate
data-driven solutions when the diffusion dynamics are unknown to the
controller. Using techniques from nonparametric statistics for stochastic
processes, we construct an optimal domain estimator, whose static regret is
bounded by the minimax optimal estimation rate of the unreflected process'
invariant density. In the most challenging situation, when the dynamics must be
learned simultaneously to controlling the process, we develop an episodic
learning algorithm to overcome the emerging exploration-exploitation dilemma
and show that given the static regret as a baseline, the loss in its sublinear
regret per time unit is of natural order compared to the one-dimensional case.
- Abstract(参考訳): 近年,モデル不確実性に直面した確率論的最適制御問題を解くためのデータ駆動アルゴリズムが研究の活発な領域となっている。
しかし、特異制御と基底拡散ダイナミクスについては、解析はスカラーの場合に限られている。
本稿では,反射型制御を持つ可逆拡散に対する多変量特異制御問題の研究により,このギャップを埋める。
私たちの貢献は3倍です。
まず, 制御問題を形状最適化問題として同等に特徴付けることができることを示すため, 長期平均コストをドメイン依存機能として明確に決定する。
任意の拡散ダイナミクスにおいて、最適領域が強星型であると仮定すると、ポリトープ近似に基づく勾配降下アルゴリズムを提案し、コスト最小化領域を数値的に決定する。
最後に,制御器に拡散力学が未知な場合のデータ駆動型解について検討する。
確率過程の非パラメトリック統計学の手法を用いて、静的な後悔が非反射過程の不変密度の極小最適推定速度によって束縛される最適領域推定器を構築する。
最も困難な状況では、プロセスを制御するために同時にダイナミクスを学ばなければならないとき、新たな探索・探索ジレンマを克服するためのエピソディック学習アルゴリズムを開発し、静的な後悔をベースラインとして考えると、時間単位あたりのサブリニア後悔の損失は1次元の場合と比較して自然秩序であることを示す。
関連論文リスト
- Total Uncertainty Quantification in Inverse PDE Solutions Obtained with Reduced-Order Deep Learning Surrogate Models [50.90868087591973]
機械学習サロゲートモデルを用いて得られた逆PDE解の総不確かさを近似したベイズ近似法を提案する。
非線型拡散方程式に対する反復的アンサンブルスムーズおよび深層アンサンブル法との比較により,提案手法を検証した。
論文 参考訳(メタデータ) (2024-08-20T19:06:02Z) - Flow-based Distributionally Robust Optimization [23.232731771848883]
We present a framework, called $textttFlowDRO$, for solve flow-based distributionally robust optimization (DRO) problem with Wasserstein uncertainty set。
我々は、連続した最悪のケース分布(Last Favorable Distribution, LFD)とそれからのサンプルを見つけることを目指している。
本稿では、逆学習、分布論的に堅牢な仮説テスト、およびデータ駆動型分布摂動差分プライバシーの新しいメカニズムを実証する。
論文 参考訳(メタデータ) (2023-10-30T03:53:31Z) - Solving Inverse Problems with Latent Diffusion Models via Hard Data Consistency [7.671153315762146]
画素空間におけるトレーニング拡散モデルは、データ集約的かつ計算的に要求される。
非常に低次元空間で動作する潜在拡散モデルは、これらの課題に対する解決策を提供する。
我々は,事前学習した潜在拡散モデルを用いて,一般的な逆問題を解決するアルゴリズムであるtextitReSampleを提案する。
論文 参考訳(メタデータ) (2023-07-16T18:42:01Z) - Multistage Stochastic Optimization via Kernels [3.7565501074323224]
我々は,多段階最適化問題に対する非パラメトリック,データ駆動,トラクタブルアプローチを開発した。
本稿では,提案手法が最適に近い平均性能で決定ルールを生成することを示す。
論文 参考訳(メタデータ) (2023-03-11T23:19:32Z) - Decomposed Diffusion Sampler for Accelerating Large-Scale Inverse
Problems [64.29491112653905]
本稿では, 拡散サンプリング法とクリロフ部分空間法を相乗的に組み合わせた, 新規で効率的な拡散サンプリング手法を提案する。
具体的には、ツイーディの公式による分母化標本における接空間がクリロフ部分空間を成すならば、その分母化データによるCGは、接空間におけるデータの整合性更新を確実に維持する。
提案手法は,従来の最先端手法よりも80倍以上高速な推論時間を実現する。
論文 参考訳(メタデータ) (2023-03-10T07:42:49Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - Structured Optimal Variational Inference for Dynamic Latent Space Models [16.531262817315696]
動的ネットワークの潜在空間モデルについて検討し、その目的は、ペアの内積と潜在位置のインターセプトを推定することである。
後部推論と計算スケーラビリティのバランスをとるために、構造的平均場変動推論フレームワークを検討する。
論文 参考訳(メタデータ) (2022-09-29T22:10:42Z) - Extension of Dynamic Mode Decomposition for dynamic systems with
incomplete information based on t-model of optimal prediction [69.81996031777717]
動的モード分解は、動的データを研究するための非常に効率的な手法であることが証明された。
このアプローチの適用は、利用可能なデータが不完全である場合に問題となる。
本稿では,森-Zwanzig分解の1次近似を考察し,対応する最適化問題を記述し,勾配に基づく最適化法を用いて解く。
論文 参考訳(メタデータ) (2022-02-23T11:23:59Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - The Neural Network shifted-Proper Orthogonal Decomposition: a Machine
Learning Approach for Non-linear Reduction of Hyperbolic Equations [0.0]
本研究では,統計的学習フレームワークにおいて,正しい前処理変換を自動的に検出する問題にアプローチする。
純粋にデータ駆動方式により、線形部分空間操作の既存のアプローチを未知の対流場を持つ非線形双曲問題に一般化することができる。
提案アルゴリズムは、その性能をベンチマークするために単純なテストケースに対して検証され、その後、多相シミュレーションに成功している。
論文 参考訳(メタデータ) (2021-08-14T15:13:35Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。