論文の概要: Online Learning to Transport via the Minimal Selection Principle
- arxiv url: http://arxiv.org/abs/2202.04732v1
- Date: Wed, 9 Feb 2022 21:25:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-11 15:17:33.369986
- Title: Online Learning to Transport via the Minimal Selection Principle
- Title(参考訳): 最小選択原理によるオンライン学習と輸送
- Authors: Wenxuan Guo, YoonHaeng Hur, Tengyuan Liang, Christopher Ryan
- Abstract要約: 決定変数が凸, 三次元オブジェクトであるオンライン学習輸送(OLT)問題について検討する。
我々は、平均場と離散化技術を用いてORT問題を解決するために、最小選択探索法(SoMLT)と呼ばれる新しい手法を導出した。
- 参考スコア(独自算出の注目度): 2.3857747529378917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivated by robust dynamic resource allocation in operations research, we
study the Online Learning to Transport (OLT) problem where the decision
variable is a probability measure, an infinite-dimensional object. We draw
connections between online learning, optimal transport, and partial
differential equations through an insight called the minimal selection
principle, originally studied in the Wasserstein gradient flow setting by
Ambrosio et al. (2005). This allows us to extend the standard online learning
framework to the infinite-dimensional setting seamlessly. Based on our
framework, we derive a novel method called the minimal selection or exploration
(MSoE) algorithm to solve OLT problems using mean-field approximation and
discretization techniques. In the displacement convex setting, the main
theoretical message underpinning our approach is that minimizing transport cost
over time (via the minimal selection principle) ensures optimal cumulative
regret upper bounds. On the algorithmic side, our MSoE algorithm applies beyond
the displacement convex setting, making the mathematical theory of optimal
transport practically relevant to non-convex settings common in dynamic
resource allocation.
- Abstract(参考訳): 操作研究におけるロバストな動的資源配分を動機として、決定変数が確率測度であるオンライン学習輸送(OLT)問題(無限次元オブジェクト)を研究する。
オンライン学習,最適移動,偏微分方程式間の関係を最小選択原理(minimum selection principle)という洞察を通じて導き,ambrosio et al. (2005) によるwassersteingradient flow set で研究した。
これにより、標準オンライン学習フレームワークを無限次元設定にシームレスに拡張できます。
我々は,この枠組みに基づいて最小選択探索法(MSoE)と呼ばれる新しい手法を導出し,平均場近似と離散化手法を用いてORT問題を解く。
変位凸設定において、我々のアプローチを裏付ける主要な理論的メッセージは、(最小選択原理を介して)時間とともに輸送コストを最小化し、最適累積後悔上限を保証することである。
アルゴリズム側では,MSoEアルゴリズムは変位凸設定を超えて適用され,動的資源割り当てに共通する非凸設定と実際に関係する最適輸送の数学的理論が成立する。
関連論文リスト
- Learning Constrained Optimization with Deep Augmented Lagrangian Methods [60.94111369773497]
機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。
本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。
これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文 参考訳(メタデータ) (2024-03-06T04:43:22Z) - Application of deep and reinforcement learning to boundary control
problems [0.6906005491572401]
目的は、囲まれたドメインが所望の状態値に達するように、ドメイン境界に対する最適な値を見つけることである。
本研究は,ディープラーニングと強化学習による境界制御問題の解決の可能性を探る。
論文 参考訳(メタデータ) (2023-10-21T10:56:32Z) - A Computational Framework for Solving Wasserstein Lagrangian Flows [51.32751290160936]
本稿では,これらすべての問題に統一的な視点からアプローチする,新しいディープラーニングベースのフレームワークを提案する。
本手法では, 学習力学の軌跡をシミュレーション・バックプロパゲートする必要はない。
提案手法は, 単セル軌道推定における従来の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-10-16T17:59:54Z) - Energy-Guided Continuous Entropic Barycenter Estimation for General
Costs [98.51150518987954]
任意のOTコスト関数に対して連続的エントロピーOT(EOT)バリセンタを近似する新しいアルゴリズムを提案する。
本手法は、弱いOTに基づくEOT問題の二重再構成に基づいている。
論文 参考訳(メタデータ) (2023-10-02T11:24:36Z) - Re-basin via implicit Sinkhorn differentiation [9.827002225566073]
本研究では,特定の目的に適した交通計画を得る能力を備えたシンクホーン・リベースネットワークを提案する。
現在の最先端技術とは異なり、我々の手法は微分可能であり、深層学習領域内のどんなタスクにも容易に適応できる。
論文 参考訳(メタデータ) (2022-12-22T21:25:06Z) - Introduction to Online Nonstochastic Control [65.18774760752588]
オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文 参考訳(メタデータ) (2022-11-17T16:12:45Z) - Entropic Neural Optimal Transport via Diffusion Processes [105.34822201378763]
本稿では,連続確率分布間のエントロピー最適輸送(EOT)計画を計算するための新しいアルゴリズムを提案する。
提案アルゴリズムは,シュリンガーブリッジ問題(Schr"odinger Bridge problem)として知られるEOTの動的バージョンのサドル点再構成に基づく。
大規模EOTの従来の手法とは対照的に,我々のアルゴリズムはエンドツーエンドであり,単一の学習ステップで構成されている。
論文 参考訳(メタデータ) (2022-11-02T14:35:13Z) - Constrained Mass Optimal Transport [0.0]
本稿では,制約付き最適輸送の問題を紹介する。
アルゴリズムの族は制約付きサドル点問題のクラスを解くために導入された。
収束証明と数値結果を示す。
論文 参考訳(メタデータ) (2022-06-05T06:47:25Z) - Dynamic Origin-Destination Matrix Estimation in Urban Traffic Networks [0.05735035463793007]
この問題を二段階最適化問題としてモデル化する。
内部レベルでは、暫定的な旅行需要を前提として、動的な交通割当問題を解決し、利用者の出身地と目的地間のルーティングを決定する。
外層部では,交通ネットワーク内のセンサによって測定された車両数と内層部で発生したカウンタの差を最小限に抑えることを目的として,旅行数とその出発点および目的地の調整を行う。
論文 参考訳(メタデータ) (2022-01-31T21:33:46Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。