論文の概要: Deep Generalized Schr\"odinger Bridge
- arxiv url: http://arxiv.org/abs/2209.09893v1
- Date: Tue, 20 Sep 2022 17:47:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 18:10:53.442881
- Title: Deep Generalized Schr\"odinger Bridge
- Title(参考訳): 深部一般schr\"odinger橋
- Authors: Guan-Horng Liu, Tianrong Chen, Oswin So, Evangelos A. Theodorou
- Abstract要約: 平均フィールドゲーム(Mean-Field Game)は、個々のエージェントの集合的振る舞いをモデル化する重要な数学的枠組みとして機能する。
エントロピー規則化された最適輸送モデルとして、Schr"odinger Bridgeは平均場構造を受け入れるために一般化可能であることを示す。
我々の手法はDeep Generalized Schr"odinger Bridge (DeepGSB) と呼ばれ、古典的な集団ナビゲーションMFGの解法よりも優れている。
- 参考スコア(独自算出の注目度): 26.540105544872958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mean-Field Game (MFG) serves as a crucial mathematical framework in modeling
the collective behavior of individual agents interacting stochastically with a
large population. In this work, we aim at solving a challenging class of MFGs
in which the differentiability of these interacting preferences may not be
available to the solver, and the population is urged to converge exactly to
some desired distribution. These setups are, despite being well-motivated for
practical purposes, complicated enough to paralyze most (deep) numerical
solvers. Nevertheless, we show that Schr\"odinger Bridge - as an
entropy-regularized optimal transport model - can be generalized to accepting
mean-field structures, hence solving these MFGs. This is achieved via the
application of Forward-Backward Stochastic Differential Equations theory,
which, intriguingly, leads to a computational framework with a similar
structure to Temporal Difference learning. As such, it opens up novel
algorithmic connections to Deep Reinforcement Learning that we leverage to
facilitate practical training. We show that our proposed objective function
provides necessary and sufficient conditions to the mean-field problem. Our
method, named Deep Generalized Schr\"odinger Bridge (DeepGSB), not only
outperforms prior methods in solving classical population navigation MFGs, but
is also capable of solving 1000-dimensional opinion depolarization, setting a
new state-of-the-art numerical solver for high-dimensional MFGs. Our code will
be made available at https://github.com/ghliu/DeepGSB.
- Abstract(参考訳): Mean-Field Game (MFG) は、多数の集団と確率的に相互作用する個々のエージェントの集団的振る舞いをモデル化する重要な数学的枠組みである。
本研究は,これらの相互作用する選好の相違性を解決できないようなMFGの難解なクラスを解くことを目的としており,人口は,所望の分布に正確に収束するよう促されている。
これらの設定は、実用的な目的のために十分に動機づけられているにもかかわらず、ほとんどの(深い)数値解法を麻痺させるほど複雑である。
それにもかかわらず、Shr\"odinger Bridge - エントロピー規則化された最適輸送モデルとして、平均場構造を受け入れるように一般化できることを示し、これらのMFGを解く。
これはForward-Backward Stochastic Differential Equations理論の適用によって達成され、これは興味深いことに、時間差分学習に類似した構造を持つ計算フレームワークに導かれる。
これにより,Deep Reinforcement Learning(深層強化学習)への新たなアルゴリズム接続が開き,実践的なトレーニングを容易にする。
提案する目的関数が平均場問題に必要かつ十分な条件を提供することを示す。
提案手法はDeep Generalized Schr\"odinger Bridge (DeepGSB) と名付けられ,従来のMFGの解法に勝るだけでなく,1000次元の意見非分極を解き,高次元のMFGに対する新しい数値解法を構築することができる。
私たちのコードはhttps://github.com/ghliu/DeepGSB.comで公開されます。
関連論文リスト
- Towards Universal Mesh Movement Networks [13.450178050669964]
我々はUniversal Mesh Movement Network (UM2N)を紹介する。
UM2Nは、異なるサイズ分布と構造を持つメッシュを動かすために、非侵入的ゼロショット方式で適用することができる。
本研究では, 実世界の津波シミュレーション事例とともに, 対流法とナビエ・ストークス法に基づく実例について検討した。
論文 参考訳(メタデータ) (2024-06-29T09:35:12Z) - Scalable Mechanism Design for Multi-Agent Path Finding [87.40027406028425]
MAPF (Multi-Agent Path Finding) は、複数のエージェントが同時に移動し、与えられた目標地点に向かって共有領域を通って衝突しない経路を決定する。
最適解を見つけることは、しばしば計算不可能であり、近似的な準最適アルゴリズムを用いることが不可欠である。
本稿では、MAPFのスケーラブルな機構設計の問題を紹介し、MAPFアルゴリズムを近似した3つの戦略防御機構を提案する。
論文 参考訳(メタデータ) (2024-01-30T14:26:04Z) - Generalized Schrödinger Bridge Matching [54.171931505066]
一般化Schr"odinger Bridge (GSB) 問題設定は、機械学習の内外を問わず、多くの科学領域で一般的である。
我々は最近の進歩に触発された新しいマッチングアルゴリズムである一般化シュリンガーブリッジマッチング(GSBM)を提案する。
このような一般化は条件最適制御の解法として、変分近似を用いることができることを示す。
論文 参考訳(メタデータ) (2023-10-03T17:42:11Z) - Monotone deep Boltzmann machines [86.50247625239406]
ディープボルツマンマシン(Deep Boltzmann Machine、DBM)は、双対エネルギー関数によって制御される多層確率モデルである。
我々は,各層で任意の自己接続が可能な新しい制限モデルであるモノトンDBMを開発した。
アクティベーションの特定の選択が、変動平均場解を与える固定点反復をもたらすことを示す。
論文 参考訳(メタデータ) (2023-07-11T03:02:44Z) - Bridging Mean-Field Games and Normalizing Flows with Trajectory
Regularization [11.517089115158225]
平均場ゲーム(MFG)は、多数の相互作用エージェントを持つシステムのモデリングフレームワークである。
正規化フロー(NFs)は、可逆写像を用いてデータ可能性を計算する深層生成モデルのファミリーである。
本研究では,NF の学習を MFG の解法としてコンテキスト化することにより,MFG と NF の関係を明らかにする。
論文 参考訳(メタデータ) (2022-06-30T02:44:39Z) - FiLM-Ensemble: Probabilistic Deep Learning via Feature-wise Linear
Modulation [69.34011200590817]
本稿では,特徴量線形変調の概念に基づく暗黙のアンサンブル手法であるFiLM-Ensembleを紹介する。
単一ディープネットワークのネットワークアクティベーションをFiLMで変調することにより、高多様性のモデルアンサンブルを得る。
我々は、FiLM-Ensembleが他の暗黙のアンサンブル法よりも優れており、ネットワークの明示的なアンサンブルの上限に非常に近いことを示す。
論文 参考訳(メタデータ) (2022-05-31T18:33:15Z) - Learning High-Dimensional McKean-Vlasov Forward-Backward Stochastic
Differential Equations with General Distribution Dependence [6.253771639590562]
本稿では,MV-FBSDEを平均場相互作用の一般形式で計算するための新しいディープラーニング手法を提案する。
我々は、高次元MV-FBSDEを解くために、ディープニューラルネットワークを用いて標準BSDEと近似係数関数を解く。
論文 参考訳(メタデータ) (2022-04-25T18:59:33Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。