論文の概要: Markov Kernels, Distances and Optimal Control: A Parable of Linear Quadratic Non-Gaussian Distribution Steering
- arxiv url: http://arxiv.org/abs/2504.15753v1
- Date: Tue, 22 Apr 2025 10:07:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 21:09:53.343415
- Title: Markov Kernels, Distances and Optimal Control: A Parable of Linear Quadratic Non-Gaussian Distribution Steering
- Title(参考訳): マルコフカーネル, 距離, 最適制御: 線形擬似非ガウス分布ステアリングのパーラ
- Authors: Alexis M. H. Teter, Wenqing Wang, Sachin Shivakumar, Abhishek Halder,
- Abstract要約: Ito Markovfusion $mathrmdboldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t=boldsymbolx_t
- 参考スコア(独自算出の注目度): 3.497013356387396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For a controllable linear time-varying (LTV) pair $(\boldsymbol{A}_t,\boldsymbol{B}_t)$ and $\boldsymbol{Q}_{t}$ positive semidefinite, we derive the Markov kernel for the It\^{o} diffusion ${\mathrm{d}}\boldsymbol{x}_{t}=\boldsymbol{A}_{t}\boldsymbol{x}_t {\mathrm{d}} t + \sqrt{2}\boldsymbol{B}_{t}{\mathrm{d}}\boldsymbol{w}_{t}$ with an accompanying killing of probability mass at rate $\frac{1}{2}\boldsymbol{x}^{\top}\boldsymbol{Q}_{t}\boldsymbol{x}$. This Markov kernel is the Green's function for an associated linear reaction-advection-diffusion partial differential equation. Our result generalizes the recently derived kernel for the special case $\left(\boldsymbol{A}_t,\boldsymbol{B}_t\right)=\left(\boldsymbol{0},\boldsymbol{I}\right)$, and depends on the solution of an associated Riccati matrix ODE. A consequence of this result is that the linear quadratic non-Gaussian Schr\"{o}dinger bridge is exactly solvable. This means that the problem of steering a controlled LTV diffusion from a given non-Gaussian distribution to another over a fixed deadline while minimizing an expected quadratic cost can be solved using dynamic Sinkhorn recursions performed with the derived kernel. Our derivation for the $\left(\boldsymbol{A}_t,\boldsymbol{B}_t,\boldsymbol{Q}_t\right)$-parametrized kernel pursues a new idea that relies on finding a state-time dependent distance-like functional given by the solution of a deterministic optimal control problem. This technique breaks away from existing methods, such as generalizing Hermite polynomials or Weyl calculus, which have seen limited success in the reaction-diffusion context. Our technique uncovers a new connection between Markov kernels, distances, and optimal control. This connection is of interest beyond its immediate application in solving the linear quadratic Schr\"{o}dinger bridge problem.
- Abstract(参考訳): LTV) 対 $(\boldsymbol{A}_t,\boldsymbol{B}_t)$ および $\boldsymbol{Q}_{t}$ 正半有限に対して、I\^{o} 拡散に対するマルコフ核を導出する。
このマルコフ核は、関連する線形反応-対流-拡散偏微分方程式のグリーン函数である。
この結果は、特殊ケース $\left(\boldsymbol{A}_t,\boldsymbol{B}_t\right)=\left(\boldsymbol{0},\boldsymbol{I}\right)$ に対して最近導出されたカーネルを一般化し、関連する Riccati 行列ODE の解に依存する。
この結果の結果として、線型二次非ガウス的シュルンディンガー橋は正確に解ける。
このことは、制御されたLTV拡散を与えられた非ガウス分布から固定された期限で他へ操り、期待される二次コストを最小化する問題は、派生したカーネルで実行される動的シンクホーン再帰を用いて解決できることを意味している。
我々が導出した$\left(\boldsymbol{A}_t,\boldsymbol{B}_t,\boldsymbol{Q}_t\right)$-parametrized kernelは、決定論的最適制御問題の解によって与えられる状態時間依存距離のような関数を見つけることに依存する新しいアイデアを追求する。
この手法は、エルミート多項式やワイル積分の一般化のような既存の方法とはかけ離れており、反応拡散の文脈ではほとんど成功しなかった。
本手法は,マルコフカーネル,距離,最適制御の新たな接続を明らかにする。
この接続は、線型二次的シュル「{o}dinger bridge problem」の解法における直近の応用を越えて興味がある。
関連論文リスト
- On the Hopf-Cole Transform for Control-affine Schrödinger Bridge [0.4972323953932129]
ホップ・コール変換が汎用制御-アフィン・シュル・オーディンガー橋問題に対する最適条件に適用されたことを示す。
結果のPDEを非線形逆流拡散-拡散-反応方程式として解釈する方法を説明する。
論文 参考訳(メタデータ) (2025-03-22T04:08:10Z) - Resilience of Rademacher chaos of low degree [5.3390449198644445]
ラデマッハカオスのレジリエンスは、カオスが持続できる敵のサインフリップの最大数である。
我々はRadecherカオスの弾力性に関する確率的低バウンド保証を提供する。
次数2のラデマッハカオスと次数2のラデマッハカオスは,同じ概念的枠組みで確立されているが,大きな違いがある。
論文 参考訳(メタデータ) (2024-02-16T08:27:55Z) - Provably learning a multi-head attention layer [55.2904547651831]
マルチヘッドアテンション層は、従来のフィードフォワードモデルとは分離したトランスフォーマーアーキテクチャの重要な構成要素の1つである。
本研究では,ランダムな例から多面的注意層を実証的に学習する研究を開始する。
最悪の場合、$m$に対する指数的依存は避けられないことを示す。
論文 参考訳(メタデータ) (2024-02-06T15:39:09Z) - Convergence of a Normal Map-based Prox-SGD Method under the KL
Inequality [0.0]
我々は、$symbol$k$収束問題に対して、新しいマップベースのアルゴリズム(mathsfnorMtext-mathsfSGD$)を提案する。
論文 参考訳(メタデータ) (2023-05-10T01:12:11Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - On the Self-Penalization Phenomenon in Feature Selection [69.16452769334367]
カーネル群に基づく暗黙の空間性誘導機構について述べる。
アプリケーションとしては、この疎結合誘導機構を使用して、特徴選択に一貫性のあるアルゴリズムを構築します。
論文 参考訳(メタデータ) (2021-10-12T09:36:41Z) - Extensions to the Proximal Distance Method of Constrained Optimization [7.813460653362097]
損失 $f(boldsymbolx)$ を S$ の $boldsymbolx の形に制約する問題について検討する。
融合制約は、滑らかさ、疎さ、あるいはより一般的な制約パターンをキャプチャすることができる。
論文 参考訳(メタデータ) (2020-09-02T03:32:41Z) - Nonparametric Learning of Two-Layer ReLU Residual Units [22.870658194212744]
本稿では,線形整列ユニット(ReLU)を活性化した2層残基を学習するアルゴリズムについて述べる。
解析最小化器はそのパラメータと非線形性の観点から、正確な地上構造ネットワークを表現できる機能として層ワイドな目的を設計する。
我々は,アルゴリズムの統計的強い一貫性を証明し,実験によるアルゴリズムの堅牢性とサンプル効率を実証する。
論文 参考訳(メタデータ) (2020-08-17T22:11:26Z) - Optimal Combination of Linear and Spectral Estimators for Generalized
Linear Models [59.015960528781115]
最適に $hatboldsymbol xrm L$ と $hatboldsymbol xrm s$ を組み合わせる方法を示す。
我々は,$(boldsymbol x, hatboldsymbol xrm L, hatboldsymbol xrm s)$の制限分布を確立するために,Adroximate Message Passing (AMP)アルゴリズムの設計と解析を行う。
論文 参考訳(メタデータ) (2020-08-07T18:20:05Z) - GO Hessian for Expectation-Based Objectives [73.06986780804269]
GOグラデーションは、最近予測に基づく目的に対して$mathbbE_q_boldsymboldsymboldsymbolgamma(boldsymboly) [f(boldsymboly)]$として提案された。
GO勾配に基づいて、$mathbbE_q_boldsymboldsymboldsymbolgamma(boldsymboly) [f(boldsymboly)]$ an unbiased low-variance Hessian estimator, named GO Hessian を示す。
論文 参考訳(メタデータ) (2020-06-16T02:20:41Z) - Linear Time Sinkhorn Divergences using Positive Features [51.50788603386766]
エントロピー正則化で最適な輸送を解くには、ベクトルに繰り返し適用される$ntimes n$ kernel matrixを計算する必要がある。
代わりに、$c(x,y)=-logdotpvarphi(x)varphi(y)$ ここで$varphi$は、地上空間から正のorthant $RRr_+$への写像であり、$rll n$である。
論文 参考訳(メタデータ) (2020-06-12T10:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。