Fugu-MT 論文翻訳(概要): Complexity of Neural Network Training and ETR: Extensions with Effectively Continuous Functions

論文の概要: Complexity of Neural Network Training and ETR: Extensions with Effectively Continuous Functions

arxiv url: http://arxiv.org/abs/2305.11833v1
Date: Fri, 19 May 2023 17:17:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-22 13:09:08.807427
Title: Complexity of Neural Network Training and ETR: Extensions with Effectively Continuous Functions
Title（参考訳）: ニューラルネットワークトレーニングとETRの複雑さ:効果的な継続的機能拡張
Authors: Teemu Hankala, Miika Hannula, Juha Kontinen, Jonni Virtema
Abstract要約: 本稿では,様々なアクティベーション機能によって定義されるニューラルネットワークのトレーニングの複雑さについて検討する。我々は,シグモイドの活性化関数や他の効果的な連続関数に関して,問題の複雑さを考察する。
参考スコア（独自算出の注目度）: 0.5352699766206808
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study the complexity of the problem of training neural networks defined via various activation functions. The training problem is known to be existsR-complete with respect to linear activation functions and the ReLU activation function. We consider the complexity of the problem with respect to the sigmoid activation function and other effectively continuous functions. We show that these training problems are polynomial-time many-one bireducible to the existential theory of the reals extended with the corresponding activation functions. In particular, we establish that the sigmoid activation function leads to the existential theory of the reals with the exponential function. It is thus open, and equivalent with the decidability of the existential theory of the reals with the exponential function, whether training neural networks using the sigmoid activation function is algorithmically solvable. In contrast, we obtain that the training problem is undecidable if sinusoidal activation functions are considered. Finally, we obtain general upper bounds for the complexity of the training problem in the form of low levels of the arithmetical hierarchy.
Abstract（参考訳）: 様々な活性化関数によって定義されるニューラルネットワークの学習の複雑さについて検討する。トレーニング問題は線形アクティベーション関数とReLUアクティベーション関数に関して、存在R完全であることが知られている。我々は,シグモイド活性化関数と他の効果的な連続関数に関して,問題の複雑さを考える。これらのトレーニング問題は、対応するアクティベーション関数で拡張された実数の存在理論に適応する多項式時間多値双還元可能であることを示す。特に,シグモイド活性化関数は指数関数を持つ実数の存在論的理論に繋がることを示す。したがって、これはオープンであり、指数関数を持つ実数の存在論的理論の決定可能性と同値であり、sgmoidアクティベーション関数を用いたニューラルネットワークの訓練がアルゴリズム的に解くことができる。対照的に,正弦波活性化関数を考慮すれば,トレーニング問題は決定不能となる。最後に,算術階層の低レベル化という形で,学習問題の複雑性に対する一般的な上限を求める。

関連論文リスト

Provable In-Context Learning of Nonlinear Regression with Transformers [58.018629320233174]
In-context Learning (ICL) は、パラメータを更新することなくタスク固有のプロンプトを使用して見えないタスクを実行する能力である。最近の研究はICLの背後にあるトレーニングダイナミクスを積極的に探求している。本稿では、変換器が文脈内学習能力をいかに獲得するかを明らかにすることを目的として、より複雑な非線形回帰タスクについて検討する。
論文参考訳（メタデータ） (2025-07-28T00:09:28Z)
STL: A Signed and Truncated Logarithm Activation Function for Neural Networks [5.9622541907827875]
活性化関数はニューラルネットワークにおいて重要な役割を果たす。本稿では,アクティベーション関数として符号付きおよび切り離された対数関数を提案する。提案された活性化関数は、広範囲のニューラルネットワークに適用できる。
論文参考訳（メタデータ） (2023-07-31T03:41:14Z)
Promises and Pitfalls of the Linearized Laplace in Bayesian Optimization [73.80101701431103]
線形化ラプラス近似(LLA)はベイズニューラルネットワークの構築に有効で効率的であることが示されている。ベイズ最適化におけるLLAの有用性について検討し,その性能と柔軟性を強調した。
論文参考訳（メタデータ） (2023-04-17T14:23:43Z)
Globally Optimal Training of Neural Networks with Threshold Activation Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文参考訳（メタデータ） (2023-03-06T18:59:13Z)
Unification of popular artificial neural network activation functions [0.0]
本稿では,最も一般的なニューラルネットワーク活性化関数の統一表現について述べる。分数計算のMittag-Leffler関数を採用することにより、フレキシブルでコンパクトな関数形式を提案する。
論文参考訳（メタデータ） (2023-02-21T21:20:59Z)
Growing Cosine Unit: A Novel Oscillatory Activation Function That Can Speedup Training and Reduce Parameters in Convolutional Neural Networks [0.1529342790344802]
畳み込みニューラルネットワークは多くの社会的に重要で経済的に重要な問題を解くことに成功した。ディープネットワークのトレーニングを可能にする重要な発見は、Rectified Linear Unit (ReLU) アクティベーション機能の採用であった。新しい活性化関数 C(z) = z cos z は様々なアーキテクチャ上で Sigmoids, Swish, Mish, ReLU より優れる。
論文参考訳（メタデータ） (2021-08-30T01:07:05Z)
Adaptive Rational Activations to Boost Deep Reinforcement Learning [68.10769262901003]
我々は、合理的が適応可能なアクティベーション機能に適合する理由と、ニューラルネットワークへの含意が重要である理由を動機付けている。人気アルゴリズムに(繰り返しの)アクティベーションを組み込むことで,アタリゲームにおいて一貫した改善がもたらされることを実証する。
論文参考訳（メタデータ） (2021-02-18T14:53:12Z)
On Function Approximation in Reinforcement Learning: Optimism in the Face of Large State Spaces [208.67848059021915]
強化学習のコアにおける探索・探索トレードオフについて検討する。特に、関数クラス $mathcalF$ の複雑さが関数の複雑さを特徴づけていることを証明する。私たちの後悔の限界はエピソードの数とは無関係です。
論文参考訳（メタデータ） (2020-11-09T18:32:22Z)
UNIPoint: Universally Approximating Point Processes Intensities [125.08205865536577]
学習可能な関数のクラスが任意の有効な強度関数を普遍的に近似できることを示す。ニューラルポイントプロセスモデルであるUNIPointを実装し,各イベントの基底関数の和をパラメータ化するために,リカレントニューラルネットワークを用いた。
論文参考訳（メタデータ） (2020-07-28T09:31:56Z)
Measuring Model Complexity of Neural Networks with Curve Activation Functions [100.98319505253797]
本稿では,線形近似ニューラルネットワーク(LANN)を提案する。ニューラルネットワークのトレーニングプロセスを実験的に検討し、オーバーフィッティングを検出する。我々は、$L1$と$L2$正規化がモデルの複雑さの増加を抑制することを発見した。
論文参考訳（メタデータ） (2020-06-16T07:38:06Z)
A survey on modern trainable activation functions [0.0]
本稿では,訓練可能なアクティベーション関数の分類法を提案し,近年のモデルと過去のモデルの共通性と特異性を強調した。提案手法の多くは、固定的な(訓練不能な)アクティベーション関数を使用するニューロン層の追加と等価であることを示す。
論文参考訳（メタデータ） (2020-05-02T12:38:43Z)
Deep Neural Networks with Trainable Activations and Controlled Lipschitz Constant [26.22495169129119]
本稿では,深層ニューラルネットワークの活性化関数を学習するための変分フレームワークを提案する。我々の目的は、リプシッツ定数の上界を制御しながら、ネットワークの容量を増加させることである。提案手法を標準ReLUネットワークとその変種であるPRELUとLeakyReLUと比較する。
論文参考訳（メタデータ） (2020-01-17T12:32:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。