論文の概要: Turnpike in optimal control of PDEs, ResNets, and beyond
- arxiv url: http://arxiv.org/abs/2202.04097v1
- Date: Tue, 8 Feb 2022 19:02:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 15:48:06.210210
- Title: Turnpike in optimal control of PDEs, ResNets, and beyond
- Title(参考訳): PDE、ResNet等の最適制御におけるターンパイク
- Authors: Borjan Geshkovski and Enrique Zuazua
- Abstract要約: 現代のマクロ経済学におけるエンフターンパイクの性質は、経済プランナーが一つの資本レベルから別の資本レベルに経済を移そうとするなら、プランナーが十分な時間を持っている限り、最も効率的な経路は、ストックを最適な定常経路または一定経路に近いレベルに素早く移動させることであると主張している。
資源配分戦略としての性質から、ここ10年の間、ターンパイクの性質は、力学で生じる偏微分方程式のいくつかのクラスに保たれていることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The \emph{turnpike property} in contemporary macroeconomics asserts that if
an economic planner seeks to move an economy from one level of capital to
another, then the most efficient path, as long as the planner has enough time,
is to rapidly move stock to a level close to the optimal stationary or constant
path, then allow for capital to develop along that path until the desired term
is nearly reached, at which point the stock ought to be moved to the final
target. Motivated in part by its nature as a resource allocation strategy, over
the past decade, the turnpike property has also been shown to hold for several
classes of partial differential equations arising in mechanics. When formalized
mathematically, the turnpike theory corroborates the insights from economics:
for an optimal control problem set in a finite-time horizon, optimal controls
and corresponding states, are close (often exponentially), during most of the
time, except near the initial and final time, to the optimal control and
corresponding state for the associated stationary optimal control problem. In
particular, the former are mostly constant over time. This fact provides a
rigorous meaning to the asymptotic simplification that some optimal control
problems appear to enjoy over long time intervals, allowing the consideration
of the corresponding stationary problem for computing and applications. We
review a slice of the theory developed over the past decade --the
controllability of the underlying system is an important ingredient, and can
even be used to devise simple turnpike-like strategies which are nearly
optimal--, and present several novel applications, including, among many
others, the characterization of Hamilton-Jacobi-Bellman asymptotics, and
stability estimates in deep learning via residual neural networks.
- Abstract(参考訳): 現代のマクロ経済学における \emph{turnpike property} は、経済プランナーが経済をある資本のレベルから別のレベルへ移動しようとすると、プランナーが十分な時間を持っている限り、最も効率的な経路は、最適な定常経路や一定経路に近いレベルに急速に在庫を移動させ、望ましい期間が近づくまでその経路に沿って資本が発展し、その時点で在庫を最終目標に移動させるべきであると主張する。
資源配分戦略としての性質に動機づけられ、過去10年間にわたって、ターンパイクの性質は力学で生じる偏微分方程式のいくつかのクラスにも保持されていることが示されている。
ターンパイク理論は、数学的に定式化されたとき、経済学からの洞察を裏付ける: 有限時間地平線に設定された最適制御問題に対して、最適制御と対応する状態は、ほとんどの時間において、初期時と最終時の間、関連する定常最適制御問題の最適制御と対応する状態とに近接する(しばしば指数関数的に)。
特に、前者は時間とともにほぼ一定である。
この事実は、いくつかの最適制御問題が長い間隔で楽しむように見えるという漸近的な単純化に厳密な意味を与え、計算とアプリケーションに対する対応する定常問題を考慮できる。
我々は,過去10年間に開発された理論のスライスを概観する。基盤となるシステムの制御性は重要な要素であり,ほぼ最適に近い単純なターンパイクのような戦略を考案するためにも利用できる。また,ハミルトン・ヤコビ・ベルマン漸近性の特徴付けや,残留ニューラルネットワークによるディープラーニングにおける安定性推定など,いくつかの新しい応用例も紹介する。
関連論文リスト
- A Fully Analog Pipeline for Portfolio Optimization [0.0]
ポートフォリオ最適化問題を解くために,エネルギー効率,高速,完全アナログパイプラインを提案する。
バックプロパゲーションのアナログである平衡伝播を用いて線形自己エンコーダニューラルネットワークを訓練する。
そして、アナログ連続ホップフィールドネットワークは、所望の戻り値に対して最小分散ポートフォリオを出力する。
論文 参考訳(メタデータ) (2024-11-10T19:09:16Z) - Stochastic Approximation with Delayed Updates: Finite-Time Rates under Markovian Sampling [73.5602474095954]
マルコフサンプリングの遅延更新による近似スキームの非漸近的性能について検討した。
我々の理論的な発見は、幅広いアルゴリズムの遅延の有限時間効果に光を当てた。
論文 参考訳(メタデータ) (2024-02-19T03:08:02Z) - SCOP: Schrodinger Control Optimal Planning for Goal-Based Wealth
Management [0.0]
我々は、退職などの財政目標に向けて、働く個人のような金融プランナーの貢献を最適化する問題を考察する。
プランナーの目的は、目標に向かって設定された投資ポートフォリオへの定期的な導入の最適かつ実現可能なスケジュールを見つけることである。
ポートフォリオのリターンはランダムであるため、問題の実用的なバージョンは、ゴールが与えられた信頼度レベルで満たされるように最適なコントリビューションスキームを見つけることにある。
論文 参考訳(メタデータ) (2023-09-12T02:58:59Z) - Diabatic Quantum Annealing for the Frustrated Ring Model [0.7046417074932257]
断熱的な進化は、システムサイズと指数関数的にスケールする進化の時間につながる可能性がある。
最適化されたアニーリングスケジュールによる非断熱的進化は、この指数的な減速を回避できることを示す。
論文 参考訳(メタデータ) (2022-12-05T22:16:17Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - Quantization for decentralized learning under subspace constraints [61.59416703323886]
エージェントがサブスペース制約を最小化するために個々のコスト関数を持つ分散最適化問題を考察する。
本稿では,エージェントが確率化量子化器を用いて推定値を圧縮する適応分散型戦略を提案し,検討する。
この分析は、量子化ノイズのいくつかの一般的な条件下では、平均二乗誤差と平均ビットレートの両方で戦略が安定であることを示している。
論文 参考訳(メタデータ) (2022-09-16T09:38:38Z) - Sequential Information Design: Markov Persuasion Process and Its
Efficient Reinforcement Learning [156.5667417159582]
本稿では,逐次情報設計の新たなモデル,すなわちマルコフ説得過程(MPP)を提案する。
MPPのプランニングは、ミオピックレシーバーに同時に説得されるシグナルポリシーを見つけ、送信者の最適な長期累積ユーティリティを誘導する、というユニークな課題に直面している。
我々は,楽観主義と悲観主義の両原理の新たな組み合わせを特徴とする,実証可能な効率のよい非回帰学習アルゴリズム,Optimism-Pessimism Principle for Persuasion Process (OP4) を設計する。
論文 参考訳(メタデータ) (2022-02-22T05:41:43Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z) - Deep $\mathcal{L}^1$ Stochastic Optimal Control Policies for Planetary
Soft-landing [9.714390258486569]
本稿では,PDG(Powered-Descent Guidance)問題に対する新たなディープラーニングベースのソリューションを提案する。
我々のSOCは、最小限の燃料消費のために予め規定された$mathcalL1制約を実質的に扱える。
制御器は燃料消費を最小限に抑えつつ、逆円錐の底部に全軌道を安全に着陸させることができることを実証した。
論文 参考訳(メタデータ) (2021-09-01T04:28:38Z) - Time-optimal control of a dissipative qubit [9.035958018596155]
時間-最適プロトコルを決定するためにポントリャーギンの最大原理に基づく形式主義を適用する。
散逸は通常、システムを最大混合状態に駆動する。
しかし、ある特定の散逸チャネルでは、最適制御はシステムを無限に長いエントロピー状態から遠ざけることができる。
論文 参考訳(メタデータ) (2020-02-18T15:43:29Z) - Time-local optimal control for parameter estimation in the Gaussian
regime [68.8204255655161]
瞬時制御ユニタリは、オープンダイナミクスによって引き起こされる情報の減少を軽減するために用いられる。
このような制御に対して、局所的に最適な(時間内での)選択は、量子フィッシャー情報の時間微分を最大化するものである。
論文 参考訳(メタデータ) (2020-01-10T16:24:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。