論文の概要: A PDE approach for regret bounds under partial monitoring
- arxiv url: http://arxiv.org/abs/2209.01256v1
- Date: Fri, 2 Sep 2022 20:04:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 15:30:04.631458
- Title: A PDE approach for regret bounds under partial monitoring
- Title(参考訳): 部分モニタリングによる後悔境界に対するPDE法
- Authors: Erhan Bayraktar, Ibrahim Ekren, Xin Zhang
- Abstract要約: 予測器が部分的な情報を観測する学習問題について検討する。
本研究では, 適切なスムーズなサブ/スーパーサーボ解を求めることで, 後悔境界と効率的なアルゴリズムを得るという課題に取り組むことができることを示す。
- 参考スコア(独自算出の注目度): 8.277466108000203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study a learning problem in which a forecaster only
observes partial information. By properly rescaling the problem, we
heuristically derive a limiting PDE on Wasserstein space which characterizes
the asymptotic behavior of the regret of the forecaster. Using a verification
type argument, we show that the problem of obtaining regret bounds and
efficient algorithms can be tackled by finding appropriate smooth
sub/supersolutions of this parabolic PDE.
- Abstract(参考訳): 本稿では,予測者が部分的情報のみを観測する学習問題について検討する。
問題を適切に再スケーリングすることにより、予測者の後悔の漸近的振る舞いを特徴づけるワーッサーシュタイン空間上の極限 PDE をヒューリスティックに導出する。
検証型引数を用いて,このパラボリックPDEのスムーズな部分/超解を求めることで,残差と効率的なアルゴリズムの獲得の問題に取り組むことができることを示す。
関連論文リスト
- Data-Driven Discovery of PDEs via the Adjoint Method [4.511923587827301]
本稿では、与えられたデータに基づいて、基礎となる支配的偏微分方程式(PDE)を発見する方法を提案する。
特に、パラメータ化された非線形PDEの族に対して、対応する随伴方程式を導出する方法を示す。
随伴法の精度は、PDE-FINDとして知られる有名なPDE関数同定法に匹敵する。
論文 参考訳(メタデータ) (2024-01-30T17:10:42Z) - Deep Equilibrium Based Neural Operators for Steady-State PDEs [100.88355782126098]
定常PDEに対する重み付けニューラルネットワークアーキテクチャの利点について検討する。
定常PDEの解を直接解くFNOアーキテクチャの深い平衡変種であるFNO-DEQを提案する。
論文 参考訳(メタデータ) (2023-11-30T22:34:57Z) - Weak-PDE-LEARN: A Weak Form Based Approach to Discovering PDEs From
Noisy, Limited Data [0.0]
Weak-PDE-LEARNは,非線形PDEを雑音から同定し,その解を限定的に測定する探索アルゴリズムである。
いくつかのベンチマークPDEを学習し,Weak-PDE-LEARNの有効性を示す。
論文 参考訳(メタデータ) (2023-09-09T06:45:15Z) - Neural Control of Parametric Solutions for High-dimensional Evolution
PDEs [6.649496716171139]
我々は進化偏微分方程式(PDE)の解演算子を近似する新しい計算フレームワークを開発する。
パラメータ空間における制御ベクトル場を学習することにより,PDEの解演算子を近似する。
これにより計算コストを大幅に削減し、任意の初期条件で進化PDEを解くことができる。
論文 参考訳(メタデータ) (2023-01-31T19:26:25Z) - Learning to Solve PDE-constrained Inverse Problems with Graph Networks [51.89325993156204]
科学と工学にまたがる多くの応用分野において、偏微分方程式(PDE)によって定義される制約で逆問題を解決することに興味がある。
ここでは、これらのPDE制約された逆問題を解決するために、GNNを探索する。
GNNを用いて計算速度を最大90倍に向上させる。
論文 参考訳(メタデータ) (2022-06-01T18:48:01Z) - A Dimensionality Reduction Method for Finding Least Favorable Priors
with a Focus on Bregman Divergence [108.28566246421742]
そこで本研究では,次元に明示的な有界な有限次元設定に最適化を移動させることができる次元削減法を開発した。
この問題を進展させるため、比較的大きな損失関数、すなわちブレグマンの発散によって引き起こされるベイズ的リスクに限定する。
論文 参考訳(メタデータ) (2022-02-23T16:22:28Z) - Lie Point Symmetry Data Augmentation for Neural PDE Solvers [69.72427135610106]
本稿では,ニューラルPDEソルバサンプルの複雑性を改善することにより,この問題を部分的に緩和する手法を提案する。
PDEの文脈では、データ変換の完全なリストを定量的に導き出せることが分かりました。
神経性PDEソルバサンプルの複雑さを桁違いに改善するために、どのように容易に展開できるかを示す。
論文 参考訳(メタデータ) (2022-02-15T18:43:17Z) - Regret Analysis in Deterministic Reinforcement Learning [78.31410227443102]
本稿では,最適学習アルゴリズムの分析と設計の中心となる後悔の問題を考察する。
本稿では,システムパラメータに明示的に依存する対数問題固有の後悔の下位境界について述べる。
論文 参考訳(メタデータ) (2021-06-27T23:41:57Z) - A Fully Problem-Dependent Regret Lower Bound for Finite-Horizon MDPs [117.82903457289584]
有限水平マルコフ決定過程(MDPs)における新たな問題依存的下界を導出する。
我々の下界は一般の場合よりもかなり小さく、最小の作用ギャップでスケールしないことが示される。
この最後の結果($poly(H)$の条件で、$H$は地平線である)は、楽観的なアルゴリズムのポリシーギャップに基づいて、後悔の意を表すことによって達成可能であることを示す。
論文 参考訳(メタデータ) (2021-06-24T13:46:09Z) - Bayesian Numerical Methods for Nonlinear Partial Differential Equations [4.996064986640264]
非線形偏微分方程式(PDE)は、相対的な視点から大きな課題を呈する。
本稿では、線形PDEに関する初期の研究を、非線形PDEによって指定された初期値問題の一般クラスに拡張する。
PDEの解の適切な先行モデルが、Mat'ern過程のサンプル経路特性の新しい理論的解析を用いて同定される。
論文 参考訳(メタデータ) (2021-04-22T14:02:10Z) - Error bounds for PDE-regularized learning [0.6445605125467573]
偏微分方程式(PDE)による教師付き学習問題の正規化について考察する。
得られた近似の誤差境界を PDE 誤差項とデータ誤差項で導出する。
論文 参考訳(メタデータ) (2020-03-14T00:51:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。