論文の概要: Optimal Stopping via Randomized Neural Networks
- arxiv url: http://arxiv.org/abs/2104.13669v1
- Date: Wed, 28 Apr 2021 09:47:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 18:24:35.741291
- Title: Optimal Stopping via Randomized Neural Networks
- Title(参考訳): ランダムニューラルネットワークによる最適停止
- Authors: Calypso Herrera, Florian Krack, Pierre Ruyssen, Josef Teichmann
- Abstract要約: 本稿では,最適停止問題の解を近似する新しい機械学習手法を提案する。
重要なアイデアは、隠れた層がランダムに生成され、最後の層のみが訓練されるニューラルネットワークを使用することです。
我々のアプローチは、既存のアプローチがますます現実的でない高次元問題に適用できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents new machine learning approaches to approximate the
solution of optimal stopping problems. The key idea of these methods is to use
neural networks, where the hidden layers are generated randomly and only the
last layer is trained, in order to approximate the continuation value. Our
approaches are applicable for high dimensional problems where the existing
approaches become increasingly impractical. In addition, since our approaches
can be optimized using a simple linear regression, they are very easy to
implement and theoretical guarantees can be provided. In Markovian examples our
randomized reinforcement learning approach and in non-Markovian examples our
randomized recurrent neural network approach outperform the state-of-the-art
and other relevant machine learning approaches.
- Abstract(参考訳): 本稿では,最適停止問題の解を近似する新しい機械学習手法を提案する。
これらの方法の重要なアイデアは、隠れた層がランダムに生成され、最後の層のみがトレーニングされるニューラルネットワークを使用することで、継続値を近似する。
我々のアプローチは、既存のアプローチがますます現実的でない高次元問題に適用できる。
さらに,本手法は単純な線形回帰法を用いて最適化できるため,実装は非常に容易であり,理論的保証も提供できる。
マルコフの例では、ランダム化された強化学習アプローチと非マルコフの例では、ランダム化されたリカレントニューラルネットワークアプローチが最先端や他の関連する機械学習アプローチより優れている。
関連論文リスト
- The Unreasonable Effectiveness of Solving Inverse Problems with Neural Networks [24.766470360665647]
逆問題に対する解を学ぶために訓練されたニューラルネットワークは、トレーニングセット上でも古典よりも優れた解を見つけることができることを示す。
高速な推論のために新しいデータに一般化するのではなく、既知のデータに対するより良い解決策を見つけるためにも使用できる。
論文 参考訳(メタデータ) (2024-08-15T12:38:10Z) - LinSATNet: The Positive Linear Satisfiability Neural Networks [116.65291739666303]
本稿では,ニューラルネットワークに人気の高い正の線形満足度を導入する方法について検討する。
本稿では,古典的なシンクホーンアルゴリズムを拡張し,複数の辺分布の集合を共同で符号化する,最初の微分可能満足層を提案する。
論文 参考訳(メタデータ) (2024-07-18T22:05:21Z) - Improving Generalization of Deep Neural Networks by Optimum Shifting [33.092571599896814]
本稿では,ニューラルネットワークのパラメータを最小値からフラット値に変化させる,近位シフトと呼ばれる新しい手法を提案する。
本手法は,ニューラルネットワークの入力と出力が固定された場合,ネットワーク内の行列乗算を,未決定線形方程式系として扱うことができることを示す。
論文 参考訳(メタデータ) (2024-05-23T02:31:55Z) - The Convex Landscape of Neural Networks: Characterizing Global Optima
and Stationary Points via Lasso Models [75.33431791218302]
ディープニューラルネットワーク(DNN)モデルは、プログラミング目的に使用される。
本稿では,凸型神経回復モデルについて検討する。
定常的非次元目的物はすべて,グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
また, 静止非次元目的物はすべて, グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
論文 参考訳(メタデータ) (2023-12-19T23:04:56Z) - Globally Optimal Training of Neural Networks with Threshold Activation
Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。
ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文 参考訳(メタデータ) (2023-03-06T18:59:13Z) - Sample-Then-Optimize Batch Neural Thompson Sampling [50.800944138278474]
我々はトンプソンサンプリング(TS)ポリシーに基づくブラックボックス最適化のための2つのアルゴリズムを提案する。
入力クエリを選択するには、NNをトレーニングし、トレーニングされたNNを最大化してクエリを選択するだけです。
我々のアルゴリズムは、大きなパラメータ行列を逆転する必要性を助長するが、TSポリシーの妥当性は保たれている。
論文 参考訳(メタデータ) (2022-10-13T09:01:58Z) - Neural Network Pruning Through Constrained Reinforcement Learning [3.2880869992413246]
本稿では,ニューラルネットワークを解析するための一般的な手法を提案する。
提案手法は、事前に定義された計算予算を尊重するためにニューラルネットワークを創出することができる。
標準画像分類データセットにおける最先端手法との比較により,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-10-16T11:57:38Z) - Online Limited Memory Neural-Linear Bandits with Likelihood Matching [53.18698496031658]
本研究では,探索学習と表現学習の両方が重要な役割を果たす課題を解決するために,ニューラルネットワークの帯域について検討する。
破滅的な忘れ込みに対して耐性があり、完全にオンラインである可能性の高いマッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T14:19:07Z) - Byzantine-Resilient Non-Convex Stochastic Gradient Descent [61.6382287971982]
敵対的レジリエントな分散最適化。
機械は独立して勾配を計算し 協力することができます
私達のアルゴリズムは新しい集中の技術およびサンプル複雑性に基づいています。
それは非常に実用的です:それはないときすべての前の方法の性能を改善します。
セッティングマシンがあります。
論文 参考訳(メタデータ) (2020-12-28T17:19:32Z) - Fast semidefinite programming with feedforward neural networks [0.0]
本稿では,ニューラルネットワークを用いた実現可能性半定プログラムを提案する。
半確定プログラムを一度でも正確に解くことなく、ネットワークをトレーニングする。
トレーニングされたニューラルネットワークは、従来の解法と比較して、桁違いにスピードが向上することを示している。
論文 参考訳(メタデータ) (2020-11-11T14:01:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。