論文の概要: Deep Learning for Mean Field Optimal Transport
- arxiv url: http://arxiv.org/abs/2302.14739v1
- Date: Tue, 28 Feb 2023 16:41:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 15:19:41.989697
- Title: Deep Learning for Mean Field Optimal Transport
- Title(参考訳): 平均場最適輸送のための深層学習
- Authors: Sebastian Baudelet, Brieuc Fr\'enais, Mathieu Lauri\`ere, Amal
Machtalay, Yuchen Zhu
- Abstract要約: 戦略エージェントの大量集団における社会的最適性を研究するために,平均場制御(MFC)問題が導入されている。
これらの問題はマッキーン・ブラソフ力学の最適制御問題と見なすことができる。
彼らは経済学、金融学、社会科学、工学など幅広い分野の応用を見出した。
- 参考スコア(独自算出の注目度): 0.5833117322405447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mean field control (MFC) problems have been introduced to study social optima
in very large populations of strategic agents. The main idea is to consider an
infinite population and to simplify the analysis by using a mean field
approximation. These problems can also be viewed as optimal control problems
for McKean-Vlasov dynamics. They have found applications in a wide range of
fields, from economics and finance to social sciences and engineering. Usually,
the goal for the agents is to minimize a total cost which consists in the
integral of a running cost plus a terminal cost. In this work, we consider MFC
problems in which there is no terminal cost but, instead, the terminal
distribution is prescribed. We call such problems mean field optimal transport
problems since they can be viewed as a generalization of classical optimal
transport problems when mean field interactions occur in the dynamics or the
running cost function. We propose three numerical methods based on neural
networks. The first one is based on directly learning an optimal control. The
second one amounts to solve a forward-backward PDE system characterizing the
solution. The third one relies on a primal-dual approach. We illustrate these
methods with numerical experiments conducted on two families of examples.
- Abstract(参考訳): 戦略エージェントの大量集団における社会的最適性を研究するために,平均場制御(MFC)問題が導入されている。
主なアイデアは、無限の人口を考慮し、平均場近似を用いて解析を単純化することである。
これらの問題はマッキーン・ブラソフ力学の最適制御問題と見なすこともできる。
彼らは経済学、金融学、社会科学、工学など幅広い分野の応用を見出した。
通常、エージェントの目標は、ランニングコストとターミナルコストの積分からなる総コストを最小化することである。
本研究では,端末コストが存在しないmfc問題を考えるが,その代わりに端末分布が規定される。
このような問題は、ダイナミクスやランニングコスト関数で平均場相互作用が発生するとき、古典的な最適輸送問題の一般化と見なすことができるので、場最適輸送問題(英語版)と呼ぶ。
ニューラルネットワークに基づく3つの数値解法を提案する。
1つ目は、最適な制御を直接学習することに基づく。
2つ目は、その解を特徴づける前方PDEシステムの解法である。
3つ目は、原始双対アプローチである。
本稿では,2種類の実例を用いて数値実験を行った。
関連論文リスト
- Deep Learning Algorithms for Mean Field Optimal Stopping in Finite Space and Discrete Time [3.350071725971209]
本研究は, エージェント数が無限に近づくにつれて得られる平均場最適停止(MFOS)問題を考察する。
本研究では,2つの深層学習手法を提案する。一方は最適決定を学習するために全軌道をシミュレートし,他方は逆方向誘導でDPPを利用する。
空間次元最大300の6つの異なる問題に対する数値実験により,これらの手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-10-11T14:27:17Z) - Estimating Barycenters of Distributions with Neural Optimal Transport [93.28746685008093]
本稿では,Wasserstein Barycenter問題を解くための新しいスケーラブルなアプローチを提案する。
我々の手法は最近のNeural OTソルバをベースとしている。
また,提案手法の理論的誤差境界も確立する。
論文 参考訳(メタデータ) (2024-02-06T09:17:07Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - TransPath: Learning Heuristics For Grid-Based Pathfinding via
Transformers [64.88759709443819]
探索の効率を顕著に向上させると考えられる,インスタンス依存のプロキシを学習することを提案する。
私たちが最初に学ぶことを提案するプロキシは、補正係数、すなわち、インスタンスに依存しないコスト・ツー・ゴの見積もりと完璧な見積もりの比率である。
第2のプロキシはパス確率であり、グリッドセルが最も短いパスに横たわっている可能性を示している。
論文 参考訳(メタデータ) (2022-12-22T14:26:11Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Reinforcement Learning for Mean Field Games, with Applications to
Economics [0.0]
平均場ゲーム(MFG)および平均場制御問題(平均場制御問題、平均場制御問題、平均場制御問題、平均場制御問題、平均場制御問題、平均場制御問題、平均場制御問題)は、エージェントの連続体を持つゲームにおいてナッシュ平衡または社会的最適性を研究するためのフレームワークである。
本稿では,MFGとMFCのためのRLを用いた2つの時間スケールアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-25T16:45:04Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Joint Wasserstein Distribution Matching [89.86721884036021]
JDM問題(Joint Distribution matching)は、2つのドメインの関節分布を一致させるために双方向マッピングを学習することを目的としており、多くの機械学習およびコンピュータビジョンアプリケーションで発生している。
2つの領域における関節分布のワッサーシュタイン距離を最小化することにより、JDM問題に対処することを提案する。
そこで我々は,難解な問題を簡単な最適化問題に還元する重要な定理を提案し,その解法を開発した。
論文 参考訳(メタデータ) (2020-03-01T03:39:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。