論文の概要: Online Learning to Transport via the Minimal Selection Principle
- arxiv url: http://arxiv.org/abs/2202.04732v1
- Date: Wed, 9 Feb 2022 21:25:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-11 15:17:33.369986
- Title: Online Learning to Transport via the Minimal Selection Principle
- Title(参考訳): 最小選択原理によるオンライン学習と輸送
- Authors: Wenxuan Guo, YoonHaeng Hur, Tengyuan Liang, Christopher Ryan
- Abstract要約: 決定変数が凸, 三次元オブジェクトであるオンライン学習輸送(OLT)問題について検討する。
我々は、平均場と離散化技術を用いてORT問題を解決するために、最小選択探索法(SoMLT)と呼ばれる新しい手法を導出した。
- 参考スコア(独自算出の注目度): 2.3857747529378917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by robust dynamic resource allocation in operations research, we
study the Online Learning to Transport (OLT) problem where the decision
variable is a probability measure, an infinite-dimensional object. We draw
connections between online learning, optimal transport, and partial
differential equations through an insight called the minimal selection
principle, originally studied in the Wasserstein gradient flow setting by
Ambrosio et al. (2005). This allows us to extend the standard online learning
framework to the infinite-dimensional setting seamlessly. Based on our
framework, we derive a novel method called the minimal selection or exploration
(MSoE) algorithm to solve OLT problems using mean-field approximation and
discretization techniques. In the displacement convex setting, the main
theoretical message underpinning our approach is that minimizing transport cost
over time (via the minimal selection principle) ensures optimal cumulative
regret upper bounds. On the algorithmic side, our MSoE algorithm applies beyond
the displacement convex setting, making the mathematical theory of optimal
transport practically relevant to non-convex settings common in dynamic
resource allocation.
- Abstract(参考訳): 操作研究におけるロバストな動的資源配分を動機として、決定変数が確率測度であるオンライン学習輸送(OLT)問題(無限次元オブジェクト)を研究する。
オンライン学習,最適移動,偏微分方程式間の関係を最小選択原理(minimum selection principle)という洞察を通じて導き,ambrosio et al. (2005) によるwassersteingradient flow set で研究した。
これにより、標準オンライン学習フレームワークを無限次元設定にシームレスに拡張できます。
我々は,この枠組みに基づいて最小選択探索法(MSoE)と呼ばれる新しい手法を導出し,平均場近似と離散化手法を用いてORT問題を解く。
変位凸設定において、我々のアプローチを裏付ける主要な理論的メッセージは、(最小選択原理を介して)時間とともに輸送コストを最小化し、最適累積後悔上限を保証することである。
アルゴリズム側では,MSoEアルゴリズムは変位凸設定を超えて適用され,動的資源割り当てに共通する非凸設定と実際に関係する最適輸送の数学的理論が成立する。
関連論文リスト
- Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds [59.875550175217874]
本稿では,オンラインとオフラインのRL設定において,モデルベース強化学習方式が強い後悔とサンプル境界を実現することを示す。
我々のアルゴリズムは単純で、かなり標準的であり、実際にRLの文献で広く研究されている。
論文 参考訳(メタデータ) (2024-08-16T19:52:53Z) - SOMTP: Self-Supervised Learning-Based Optimizer for MPC-Based Safe Trajectory Planning Problems in Robotics [13.129654942805846]
モデル予測制御(MP)に基づく軌道計画が広く使われており、制御バリア(CBF)はその制約を改善することができる。
本稿では,CBF-MPC軌道計画のための自己教師付き学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-15T09:38:52Z) - Learning Constrained Optimization with Deep Augmented Lagrangian Methods [54.22290715244502]
機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。
本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。
これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文 参考訳(メタデータ) (2024-03-06T04:43:22Z) - LeTO: Learning Constrained Visuomotor Policy with Differentiable Trajectory Optimization [1.1602089225841634]
本稿では,制約付きビジュモータポリシーの学習手法であるLeTOを紹介した。
シミュレーションおよび実ロボットにおけるLeTOの定量的評価を行った。
論文 参考訳(メタデータ) (2024-01-30T23:18:35Z) - Application of deep and reinforcement learning to boundary control
problems [0.6906005491572401]
目的は、囲まれたドメインが所望の状態値に達するように、ドメイン境界に対する最適な値を見つけることである。
本研究は,ディープラーニングと強化学習による境界制御問題の解決の可能性を探る。
論文 参考訳(メタデータ) (2023-10-21T10:56:32Z) - A Computational Framework for Solving Wasserstein Lagrangian Flows [48.87656245464521]
一般に、最適密度経路は未知であり、これらの変動問題の解法は計算的に困難である。
本稿では,これらすべての問題に統一的な視点からアプローチする,新しいディープラーニングベースのフレームワークを提案する。
提案手法は, 単セル軌道推定における従来の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-10-16T17:59:54Z) - Energy-Guided Continuous Entropic Barycenter Estimation for General Costs [95.33926437521046]
任意のOTコスト関数に対して連続的エントロピーOT(EOT)バリセンタを近似する新しいアルゴリズムを提案する。
本手法は、弱いOTに基づくEOT問題の二重再構成に基づいている。
論文 参考訳(メタデータ) (2023-10-02T11:24:36Z) - Entropic Neural Optimal Transport via Diffusion Processes [105.34822201378763]
本稿では,連続確率分布間のエントロピー最適輸送(EOT)計画を計算するための新しいアルゴリズムを提案する。
提案アルゴリズムは,シュリンガーブリッジ問題(Schr"odinger Bridge problem)として知られるEOTの動的バージョンのサドル点再構成に基づく。
大規模EOTの従来の手法とは対照的に,我々のアルゴリズムはエンドツーエンドであり,単一の学習ステップで構成されている。
論文 参考訳(メタデータ) (2022-11-02T14:35:13Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。