論文の概要: Numerical solution of a PDE arising from prediction with expert advice
- arxiv url: http://arxiv.org/abs/2406.05754v1
- Date: Sun, 9 Jun 2024 12:17:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 18:17:07.614644
- Title: Numerical solution of a PDE arising from prediction with expert advice
- Title(参考訳): 専門家による予測に基づくPDEの数値解法
- Authors: Jeff Calder, Nadejda Drenska, Drisana Mosaphir,
- Abstract要約: 本研究は,エキスパート・アドバイスを用いたオンライン機械学習における予測問題について,対向的な環境で検討する。
このゲームの多くのステップに対する連続極限は、この解が両方のプレイヤーにとって最適な戦略を符号化する退化楕円型方程式である。
- 参考スコア(独自算出の注目度): 2.048226951354646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work investigates the online machine learning problem of prediction with expert advice in an adversarial setting through numerical analysis of, and experiments with, a related partial differential equation. The problem is a repeated two-person game involving decision-making at each step informed by $n$ experts in an adversarial environment. The continuum limit of this game over a large number of steps is a degenerate elliptic equation whose solution encodes the optimal strategies for both players. We develop numerical methods for approximating the solution of this equation in relatively high dimensions ($n\leq 10$) by exploiting symmetries in the equation and the solution to drastically reduce the size of the computational domain. Based on our numerical results we make a number of conjectures about the optimality of various adversarial strategies, in particular about the non-optimality of the COMB strategy.
- Abstract(参考訳): 本研究は,関係する偏微分方程式の数値解析,実験を通じて,専門家のアドバイスによるオンライン機械学習問題について,対角的環境下での予測問題について検討する。
問題は、相手の環境において、nドルの専門家に通知された各ステップで意思決定を行う2対1のゲームである。
このゲームの多くのステップに対する連続極限は、この解が両方のプレイヤーにとって最適な戦略を符号化する退化楕円型方程式である。
我々は,この方程式の解を比較的高次元(n\leq 10$)で近似するための数値計算法を開発した。
数値的な結果に基づいて、様々な敵戦略の最適性、特にCOMB戦略の非最適性について、多くの予想を立てる。
関連論文リスト
- Online Convex Optimization with Memory and Limited Predictions [19.7248150754102]
メモリと予測によるオンライン凸最適化の問題点を水平線上で検討する。
本稿では,この問題を解くアルゴリズムを提案し,予測ウィンドウ長とともにアルゴリズムの動的後悔が指数関数的に減衰することを示す。
論文 参考訳(メタデータ) (2024-10-31T02:33:47Z) - DNA-SE: Towards Deep Neural-Nets Assisted Semiparametric Estimation [39.48526221316346]
半パラメトリック統計学は、欠落データ、因果推論、転帰学習など、幅広い領域において重要な役割を担っている。
我々は,Deep Neural-Nets Assisted Semiparametric Estimation (DNA-SE) と呼ばれるスケーラブルなアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-08-04T14:45:26Z) - Constrained or Unconstrained? Neural-Network-Based Equation Discovery from Data [0.0]
我々はPDEをニューラルネットワークとして表現し、物理情報ニューラルネットワーク(PINN)に似た中間状態表現を用いる。
本稿では,この制約付き最適化問題を解くために,ペナルティ法と広く利用されている信頼領域障壁法を提案する。
バーガーズ方程式とコルトヴェーグ・ド・ヴライス方程式に関する我々の結果は、後者の制約付き手法がペナルティ法より優れていることを示している。
論文 参考訳(メタデータ) (2024-05-30T01:55:44Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Efficient PDE-Constrained optimization under high-dimensional
uncertainty using derivative-informed neural operators [6.296120102486062]
大規模偏微分方程式(PDE)を高次元ランダムパラメータで解くための新しい枠組みを提案する。
我々は、そのようなニューラル演算子をマルチインプット還元ベースインフォメーションニューラル演算子(MR-DINO)と呼ぶ。
MR-DINOは103ドル~107ドルで実行時間を短縮し,標準PDEソリューションと同等の精度のOUUソリューションを生成可能であることを示す。
論文 参考訳(メタデータ) (2023-05-31T17:26:20Z) - Numerical Methods for Convex Multistage Stochastic Optimization [86.45244607927732]
最適化プログラミング(SP)、最適制御(SOC)、決定プロセス(MDP)に焦点を当てる。
凸多段マルコフ問題の解決の最近の進歩は、動的プログラミング方程式のコスト対ゴー関数の切断面近似に基づいている。
切削平面型法は多段階問題を多段階的に扱えるが、状態(決定)変数は比較的少ない。
論文 参考訳(メタデータ) (2023-03-28T01:30:40Z) - Automated differential equation solver based on the parametric
approximation optimization [77.34726150561087]
本稿では,最適化アルゴリズムを用いてパラメータ化近似を用いた解を求める手法を提案する。
アルゴリズムのパラメータを変更することなく、幅広い種類の方程式を自動で解くことができる。
論文 参考訳(メタデータ) (2022-05-11T10:06:47Z) - Amortized Implicit Differentiation for Stochastic Bilevel Optimization [53.12363770169761]
決定論的条件と決定論的条件の両方において、二段階最適化問題を解決するアルゴリズムのクラスについて検討する。
厳密な勾配の推定を補正するために、ウォームスタート戦略を利用する。
このフレームワークを用いることで、これらのアルゴリズムは勾配の偏りのない推定値にアクセス可能な手法の計算複雑性と一致することを示す。
論文 参考訳(メタデータ) (2021-11-29T15:10:09Z) - Divide and Learn: A Divide and Conquer Approach for Predict+Optimize [50.03608569227359]
予測+最適化問題は、予測係数を使用する最適化プロブレムと、確率係数の機械学習を組み合わせる。
本稿では, 予測係数を1次線形関数として, 最適化問題の損失を直接表現する方法を示す。
本稿では,この制約を伴わずに最適化問題に対処し,最適化損失を用いてその係数を予測する新しい分割アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-04T00:26:56Z) - Comparison of Distal Teacher Learning with Numerical and Analytical
Methods to Solve Inverse Kinematics for Rigid-Body Mechanisms [67.80123919697971]
私たちは、逆キネマティクス(DT)に対する最初の機械学習(ML)ソリューションの1つとして、微分可能なプログラミングライブラリを組み合わせると、実際には十分よいと論じています。
我々は,解答率,精度,サンプル効率,スケーラビリティを解析する。
十分なトレーニングデータと緩和精度の要求により、DTはより優れた解法率を持ち、15-DoF機構のための最先端の数値解法よりも高速である。
論文 参考訳(メタデータ) (2020-02-29T09:55:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。