Fugu-MT 論文翻訳(概要): Optimal Stopping via Randomized Neural Networks

論文の概要: Optimal Stopping via Randomized Neural Networks

arxiv url: http://arxiv.org/abs/2104.13669v1
Date: Wed, 28 Apr 2021 09:47:21 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-29 18:24:35.741291
Title: Optimal Stopping via Randomized Neural Networks
Title（参考訳）: ランダムニューラルネットワークによる最適停止
Authors: Calypso Herrera, Florian Krack, Pierre Ruyssen, Josef Teichmann
Abstract要約: 本稿では,最適停止問題の解を近似する新しい機械学習手法を提案する。重要なアイデアは、隠れた層がランダムに生成され、最後の層のみが訓練されるニューラルネットワークを使用することです。我々のアプローチは、既存のアプローチがますます現実的でない高次元問題に適用できる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents new machine learning approaches to approximate the solution of optimal stopping problems. The key idea of these methods is to use neural networks, where the hidden layers are generated randomly and only the last layer is trained, in order to approximate the continuation value. Our approaches are applicable for high dimensional problems where the existing approaches become increasingly impractical. In addition, since our approaches can be optimized using a simple linear regression, they are very easy to implement and theoretical guarantees can be provided. In Markovian examples our randomized reinforcement learning approach and in non-Markovian examples our randomized recurrent neural network approach outperform the state-of-the-art and other relevant machine learning approaches.
Abstract（参考訳）: 本稿では,最適停止問題の解を近似する新しい機械学習手法を提案する。これらの方法の重要なアイデアは、隠れた層がランダムに生成され、最後の層のみがトレーニングされるニューラルネットワークを使用することで、継続値を近似する。我々のアプローチは、既存のアプローチがますます現実的でない高次元問題に適用できる。さらに,本手法は単純な線形回帰法を用いて最適化できるため,実装は非常に容易であり,理論的保証も提供できる。マルコフの例では、ランダム化された強化学習アプローチと非マルコフの例では、ランダム化されたリカレントニューラルネットワークアプローチが最先端や他の関連する機械学習アプローチより優れている。

関連論文リスト

Understanding Inverse Reinforcement Learning under Overparameterization: Non-Asymptotic Analysis and Global Optimality [52.906438147288256]
我々のアルゴリズムは,特定のニューラルネットワーク構造の下で,最適報酬とポリシーを識別できることが示される。これは、国際的最適性を確実に達成する非漸近収束保証を持つ最初のIRLアルゴリズムである。
論文参考訳（メタデータ） (2025-03-22T21:16:08Z)
The Unreasonable Effectiveness of Solving Inverse Problems with Neural Networks [24.766470360665647]
逆問題に対する解を学ぶために訓練されたニューラルネットワークは、トレーニングセット上でも古典よりも優れた解を見つけることができることを示す。高速な推論のために新しいデータに一般化するのではなく、既知のデータに対するより良い解決策を見つけるためにも使用できる。
論文参考訳（メタデータ） (2024-08-15T12:38:10Z)
LinSATNet: The Positive Linear Satisfiability Neural Networks [116.65291739666303]
本稿では,ニューラルネットワークに人気の高い正の線形満足度を導入する方法について検討する。本稿では,古典的なシンクホーンアルゴリズムを拡張し,複数の辺分布の集合を共同で符号化する,最初の微分可能満足層を提案する。
論文参考訳（メタデータ） (2024-07-18T22:05:21Z)
Improving Generalization of Deep Neural Networks by Optimum Shifting [33.092571599896814]
本稿では,ニューラルネットワークのパラメータを最小値からフラット値に変化させる,近位シフトと呼ばれる新しい手法を提案する。本手法は,ニューラルネットワークの入力と出力が固定された場合,ネットワーク内の行列乗算を,未決定線形方程式系として扱うことができることを示す。
論文参考訳（メタデータ） (2024-05-23T02:31:55Z)
The Convex Landscape of Neural Networks: Characterizing Global Optima and Stationary Points via Lasso Models [75.33431791218302]
ディープニューラルネットワーク(DNN)モデルは、プログラミング目的に使用される。本稿では,凸型神経回復モデルについて検討する。定常的非次元目的物はすべて,グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。また, 静止非次元目的物はすべて, グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
論文参考訳（メタデータ） (2023-12-19T23:04:56Z)
Globally Optimal Training of Neural Networks with Threshold Activation Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文参考訳（メタデータ） (2023-03-06T18:59:13Z)
Sample-Then-Optimize Batch Neural Thompson Sampling [50.800944138278474]
我々はトンプソンサンプリング(TS)ポリシーに基づくブラックボックス最適化のための2つのアルゴリズムを提案する。入力クエリを選択するには、NNをトレーニングし、トレーニングされたNNを最大化してクエリを選択するだけです。我々のアルゴリズムは、大きなパラメータ行列を逆転する必要性を助長するが、TSポリシーの妥当性は保たれている。
論文参考訳（メタデータ） (2022-10-13T09:01:58Z)
Neural Network Pruning Through Constrained Reinforcement Learning [3.2880869992413246]
本稿では,ニューラルネットワークを解析するための一般的な手法を提案する。提案手法は、事前に定義された計算予算を尊重するためにニューラルネットワークを創出することができる。標準画像分類データセットにおける最先端手法との比較により,提案手法の有効性を実証する。
論文参考訳（メタデータ） (2021-10-16T11:57:38Z)
Online Limited Memory Neural-Linear Bandits with Likelihood Matching [53.18698496031658]
本研究では,探索学習と表現学習の両方が重要な役割を果たす課題を解決するために,ニューラルネットワークの帯域について検討する。破滅的な忘れ込みに対して耐性があり、完全にオンラインである可能性の高いマッチングアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-02-07T14:19:07Z)
Byzantine-Resilient Non-Convex Stochastic Gradient Descent [61.6382287971982]
敵対的レジリエントな分散最適化。機械は独立して勾配を計算し協力することができます私達のアルゴリズムは新しい集中の技術およびサンプル複雑性に基づいています。それは非常に実用的です:それはないときすべての前の方法の性能を改善します。セッティングマシンがあります。
論文参考訳（メタデータ） (2020-12-28T17:19:32Z)
Fast semidefinite programming with feedforward neural networks [0.0]
本稿では,ニューラルネットワークを用いた実現可能性半定プログラムを提案する。半確定プログラムを一度でも正確に解くことなく、ネットワークをトレーニングする。トレーニングされたニューラルネットワークは、従来の解法と比較して、桁違いにスピードが向上することを示している。
論文参考訳（メタデータ） (2020-11-11T14:01:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。