Fugu-MT 論文翻訳(概要): Online Learning to Transport via the Minimal Selection Principle

論文の概要: Online Learning to Transport via the Minimal Selection Principle

arxiv url: http://arxiv.org/abs/2202.04732v1
Date: Wed, 9 Feb 2022 21:25:58 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-11 15:17:33.369986
Title: Online Learning to Transport via the Minimal Selection Principle
Title（参考訳）: 最小選択原理によるオンライン学習と輸送
Authors: Wenxuan Guo, YoonHaeng Hur, Tengyuan Liang, Christopher Ryan
Abstract要約: 決定変数が凸, 三次元オブジェクトであるオンライン学習輸送(OLT)問題について検討する。我々は、平均場と離散化技術を用いてORT問題を解決するために、最小選択探索法(SoMLT)と呼ばれる新しい手法を導出した。
参考スコア（独自算出の注目度）: 2.3857747529378917
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Motivated by robust dynamic resource allocation in operations research, we study the Online Learning to Transport (OLT) problem where the decision variable is a probability measure, an infinite-dimensional object. We draw connections between online learning, optimal transport, and partial differential equations through an insight called the minimal selection principle, originally studied in the Wasserstein gradient flow setting by Ambrosio et al. (2005). This allows us to extend the standard online learning framework to the infinite-dimensional setting seamlessly. Based on our framework, we derive a novel method called the minimal selection or exploration (MSoE) algorithm to solve OLT problems using mean-field approximation and discretization techniques. In the displacement convex setting, the main theoretical message underpinning our approach is that minimizing transport cost over time (via the minimal selection principle) ensures optimal cumulative regret upper bounds. On the algorithmic side, our MSoE algorithm applies beyond the displacement convex setting, making the mathematical theory of optimal transport practically relevant to non-convex settings common in dynamic resource allocation.
Abstract（参考訳）: 操作研究におけるロバストな動的資源配分を動機として、決定変数が確率測度であるオンライン学習輸送(OLT)問題(無限次元オブジェクト)を研究する。オンライン学習,最適移動,偏微分方程式間の関係を最小選択原理(minimum selection principle)という洞察を通じて導き,ambrosio et al. (2005) によるwassersteingradient flow set で研究した。これにより、標準オンライン学習フレームワークを無限次元設定にシームレスに拡張できます。我々は,この枠組みに基づいて最小選択探索法(MSoE)と呼ばれる新しい手法を導出し,平均場近似と離散化手法を用いてORT問題を解く。変位凸設定において、我々のアプローチを裏付ける主要な理論的メッセージは、(最小選択原理を介して)時間とともに輸送コストを最小化し、最適累積後悔上限を保証することである。アルゴリズム側では,MSoEアルゴリズムは変位凸設定を超えて適用され,動的資源割り当てに共通する非凸設定と実際に関係する最適輸送の数学的理論が成立する。

関連論文リスト

A statistical physics framework for optimal learning [1.243080988483032]
我々は、ニューラルネットワークモデルにおける最適なプロトコルを特定するために、統計物理学と制御理論を統合理論の枠組みで組み合わせる。本稿では,動的順序パラメータに基づいて,学習プロトコルを最適制御問題として定式化する。このフレームワークには、さまざまな学習シナリオ、最適化制約、制御予算が含まれています。
論文参考訳（メタデータ） (2025-07-10T16:39:46Z)
Training Deep Learning Models with Norm-Constrained LMOs [56.00317694850397]
正規球上の線形最小化オラクル(LMO)を利用する最適化手法について検討する。この問題の幾何学に適応するためにLMOを用いた新しいアルゴリズム群を提案し, 意外なことに, 制約のない問題に適用可能であることを示す。
論文参考訳（メタデータ） (2025-02-11T13:10:34Z)
Learning for Cross-Layer Resource Allocation in MEC-Aided Cell-Free Networks [71.30914500714262]
移動エッジコンピューティング(MEC)を援用したセルフリーネットワーク上でのクロスレイヤリソース割り当ては、データレートを促進するために、送信およびコンピューティングリソースを十分に活用することができる。深層学習の観点からMEC支援セルフリーネットワークのサブキャリア配置とビームフォーミング最適化について検討した。
論文参考訳（メタデータ） (2024-12-21T10:18:55Z)
Go With the Flow: Fast Diffusion for Gaussian Mixture Models [13.03355083378673]
Schr"odinger Bridges (SB) は、適切なコスト関数を最小化しながら、有限時間で与えられた初期分布を他の最終状態に分配する拡散過程である。本稿では,ある分布から別の分布へシステムをステアリングするための一組のSBポリシーの潜在メトリゼーションを提案する。オートエンコーダの空間における画像から画像への変換のような低次元問題におけるこのアプローチの可能性を示す。
論文参考訳（メタデータ） (2024-12-12T08:40:22Z)
Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds [59.875550175217874]
本稿では,オンラインとオフラインのRL設定において,モデルベース強化学習方式が強い後悔とサンプル境界を実現することを示す。我々のアルゴリズムは単純で、かなり標準的であり、実際にRLの文献で広く研究されている。
論文参考訳（メタデータ） (2024-08-16T19:52:53Z)
SOMTP: Self-Supervised Learning-Based Optimizer for MPC-Based Safe Trajectory Planning Problems in Robotics [13.129654942805846]
モデル予測制御(MP)に基づく軌道計画が広く使われており、制御バリア(CBF)はその制約を改善することができる。本稿では,CBF-MPC軌道計画のための自己教師付き学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-15T09:38:52Z)
Learning Constrained Optimization with Deep Augmented Lagrangian Methods [54.22290715244502]
機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文参考訳（メタデータ） (2024-03-06T04:43:22Z)
LeTO: Learning Constrained Visuomotor Policy with Differentiable Trajectory Optimization [1.1602089225841634]
本稿では,制約付きビジュモータポリシーの学習手法であるLeTOを紹介した。シミュレーションおよび実ロボットにおけるLeTOの定量的評価を行った。
論文参考訳（メタデータ） (2024-01-30T23:18:35Z)
Application of deep and reinforcement learning to boundary control problems [0.6906005491572401]
目的は、囲まれたドメインが所望の状態値に達するように、ドメイン境界に対する最適な値を見つけることである。本研究は,ディープラーニングと強化学習による境界制御問題の解決の可能性を探る。
論文参考訳（メタデータ） (2023-10-21T10:56:32Z)
A Computational Framework for Solving Wasserstein Lagrangian Flows [48.87656245464521]
一般に、最適密度経路は未知であり、これらの変動問題の解法は計算的に困難である。本稿では,これらすべての問題に統一的な視点からアプローチする,新しいディープラーニングベースのフレームワークを提案する。提案手法は, 単セル軌道推定における従来の手法より優れていることを示す。
論文参考訳（メタデータ） (2023-10-16T17:59:54Z)
Energy-Guided Continuous Entropic Barycenter Estimation for General Costs [95.33926437521046]
任意のOTコスト関数に対して連続的エントロピーOT(EOT)バリセンタを近似する新しいアルゴリズムを提案する。本手法は、弱いOTに基づくEOT問題の二重再構成に基づいている。
論文参考訳（メタデータ） (2023-10-02T11:24:36Z)
Entropic Neural Optimal Transport via Diffusion Processes [105.34822201378763]
本稿では,連続確率分布間のエントロピー最適輸送(EOT)計画を計算するための新しいアルゴリズムを提案する。提案アルゴリズムは,シュリンガーブリッジ問題(Schr"odinger Bridge problem)として知られるEOTの動的バージョンのサドル点再構成に基づく。大規模EOTの従来の手法とは対照的に,我々のアルゴリズムはエンドツーエンドであり,単一の学習ステップで構成されている。
論文参考訳（メタデータ） (2022-11-02T14:35:13Z)
Resource Allocation via Model-Free Deep Learning in Free Space Optical Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-07-27T17:38:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。