Fugu-MT 論文翻訳(概要): Hadamard Representations: Augmenting Hyperbolic Tangents in RL

論文の概要: Hadamard Representations: Augmenting Hyperbolic Tangents in RL

arxiv url: http://arxiv.org/abs/2406.09079v2
Date: Wed, 23 Oct 2024 08:05:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:33.586237
Title: Hadamard Representations: Augmenting Hyperbolic Tangents in RL
Title（参考訳）: アダマール表現:RLにおける双曲的タンジェントの増加
Authors: Jacob E. Kooi, Mark Hoogendoorn, Vincent François-Lavet,
Abstract要約: 活性化関数は、ディープニューラルネットワークの重要なコンポーネントの1つである。強化学習では、連続的な微分可能なアクティベーションの性能は、線形単位関数と比較して低下することが多い。我々は、より高速な学習、死んだ神経細胞の減少、深いQ-ネットワークによる効果的なランクの向上を示す。
参考スコア（独自算出の注目度）: 8.647614188619315
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Activation functions are one of the key components of a deep neural network. The most commonly used activation functions can be classed into the category of continuously differentiable (e.g. tanh) and linear-unit functions (e.g. ReLU), both having their own strengths and drawbacks with respect to downstream performance and representation capacity through learning (e.g. measured by the number of dead neurons and the effective rank). In reinforcement learning, the performance of continuously differentiable activations often falls short as compared to linear-unit functions. We provide insights into the vanishing gradients associated with the former, and show that the dying neuron problem is not exclusive to ReLU's. To alleviate vanishing gradients and the resulting dying neuron problem occurring with continuously differentiable activations, we propose a Hadamard representation. Using deep Q-networks and proximal policy optimization in the Atari domain, we show faster learning, a reduction in dead neurons and increased effective rank.
Abstract（参考訳）: 活性化関数は、ディープニューラルネットワークの重要なコンポーネントの1つである。最も一般的に使用される活性化関数は、連続的な微分可能(eg tanh)と線形単位関数(eg ReLU)のカテゴリに分類することができる。強化学習では、連続的な微分可能なアクティベーションの性能は、線形単位関数と比較して低下することが多い。我々は、前者に関連する消失する勾配に関する洞察を与え、その死するニューロン問題はReLUに排他的ではないことを示す。絶え間ない勾配と、連続的に異なるアクティベーションが生じる死に至るニューロン問題を緩和するために、アダマール表現を提案する。深部Q-networksとAtariドメインの近位ポリシー最適化を用いて,より高速な学習,致死性ニューロンの減少,有効ランクの増大を示す。

関連論文リスト

Fractional Spike Differential Equations Neural Network with Efficient Adjoint Parameters Training [63.3991315762955]
スパイキングニューラルネットワーク(SNN)は、生物学的ニューロンからインスピレーションを得て、脳に似た計算の現実的なモデルを作成する。既存のほとんどのSNNは、マルコフ特性を持つ一階常微分方程式(ODE)によってモデル化された、神経細胞膜電圧ダイナミクスの単一時間定数を仮定している。本研究では, 膜電圧およびスパイク列車の長期依存性を分数次力学により捉えるフラクタルSPIKE微分方程式ニューラルネットワーク (fspikeDE) を提案する。
論文参考訳（メタデータ） (2025-07-22T18:20:56Z)
Elephant Neural Networks: Born to Be a Continual Learner [7.210328077827388]
破滅的な忘れ物は、何十年にもわたって継続的な学習にとって重要な課題である。ニューラルネットワークのトレーニング力学におけるアクティベーション機能の役割と,その破滅的忘れに対する影響について検討した。古典的な活性化関数を象の活性化関数に置き換えることで、破滅的な忘れ物に対するニューラルネットワークのレジリエンスを大幅に改善できることを示す。
論文参考訳（メタデータ） (2023-10-02T17:27:39Z)
Linear Oscillation: A Novel Activation Function for Vision Transformer [0.0]
線形振動(LoC)活性化関数を$f(x) = x times sin(alpha x + beta)$と定義する。非線型性を主に導入する従来の活性化関数とは違い、LoCは線形軌道と振動偏差をシームレスにブレンドする。私たちの経験的研究によると、多様なニューラルネットワークに組み込むと、LoCアクティベーション機能は、ReLUやSigmoidといった確立したアーキテクチャよりも一貫して優れています。
論文参考訳（メタデータ） (2023-08-25T20:59:51Z)
TSSR: A Truncated and Signed Square Root Activation Function for Neural Networks [5.9622541907827875]
我々は、Trncated and Signed Square Root (TSSR) 関数と呼ばれる新しいアクティベーション関数を導入する。この関数は奇数、非線形、単調、微分可能であるため特異である。ニューラルネットワークの数値安定性を改善する可能性がある。
論文参考訳（メタデータ） (2023-08-09T09:40:34Z)
STL: A Signed and Truncated Logarithm Activation Function for Neural Networks [5.9622541907827875]
活性化関数はニューラルネットワークにおいて重要な役割を果たす。本稿では,アクティベーション関数として符号付きおよび切り離された対数関数を提案する。提案された活性化関数は、広範囲のニューラルネットワークに適用できる。
論文参考訳（メタデータ） (2023-07-31T03:41:14Z)
Complexity of Neural Network Training and ETR: Extensions with Effectively Continuous Functions [0.5352699766206808]
本稿では,様々なアクティベーション機能によって定義されるニューラルネットワークのトレーニングの複雑さについて検討する。我々は,シグモイドの活性化関数や他の効果的な連続関数に関して,問題の複雑さを考察する。
論文参考訳（メタデータ） (2023-05-19T17:17:00Z)
Globally Optimal Training of Neural Networks with Threshold Activation Functions [63.03759813952481]
しきい値アクティベートを伴うディープニューラルネットワークの重み劣化正規化学習問題について検討した。ネットワークの特定の層でデータセットを破砕できる場合に、簡易な凸最適化の定式化を導出する。
論文参考訳（メタデータ） (2023-03-06T18:59:13Z)
Synaptic Stripping: How Pruning Can Bring Dead Neurons Back To Life [0.0]
我々は、致命的な神経細胞問題に対処する手段として、シナプスストリッピングを導入する。トレーニング中に問題のある接続を自動的に取り除くことで、死んだ神経細胞を再生することができる。我々は,ネットワーク幅と深さの関数として,これらのダイナミクスを研究するために,いくつかのアブレーション研究を行っている。
論文参考訳（メタデータ） (2023-02-11T23:55:50Z)
Data-aware customization of activation functions reduces neural network error [0.35172332086962865]
本稿では,データ認識によるアクティベーション関数のカスタマイズにより,ニューラルネットワークのエラーが大幅に低減されることを示す。既に精製されたニューラルネットワークにおけるカモメの活性化機能への簡単な置換は、エラーのオーダー・オブ・マグニチュードの低減につながる可能性がある。
論文参考訳（メタデータ） (2023-01-16T23:38:37Z)
Learning Bayesian Sparse Networks with Full Experience Replay for Continual Learning [54.7584721943286]
継続学習(CL)手法は、機械学習モデルが、以前にマスターされたタスクを壊滅的に忘れることなく、新しいタスクを学習できるようにすることを目的としている。既存のCLアプローチは、しばしば、事前に確認されたサンプルのバッファを保持し、知識蒸留を行い、あるいはこの目標に向けて正規化技術を使用する。我々は,現在および過去のタスクを任意の段階で学習するために,スパースニューロンのみを活性化し,選択することを提案する。
論文参考訳（メタデータ） (2022-02-21T13:25:03Z)
Biologically Inspired Oscillating Activation Functions Can Bridge the Performance Gap between Biological and Artificial Neurons [2.362412515574206]
本稿では,ヒト錐体ニューロンにインスパイアされた4つの新しい振動活性化関数を提案する。振動活性化関数は、一般的なアクティベーション関数とは異なり、全ての入力に対して非飽和である。一般的なモノトニックや非モノトニックなシングルゼロアクティベーション関数の代わりに発振活性化関数を使用すると、ニューラルネットワークはより速くトレーニングし、少ない層で分類問題を解くことができる。
論文参考訳（メタデータ） (2021-11-07T07:31:58Z)
Growing Cosine Unit: A Novel Oscillatory Activation Function That Can Speedup Training and Reduce Parameters in Convolutional Neural Networks [0.1529342790344802]
畳み込みニューラルネットワークは多くの社会的に重要で経済的に重要な問題を解くことに成功した。ディープネットワークのトレーニングを可能にする重要な発見は、Rectified Linear Unit (ReLU) アクティベーション機能の採用であった。新しい活性化関数 C(z) = z cos z は様々なアーキテクチャ上で Sigmoids, Swish, Mish, ReLU より優れる。
論文参考訳（メタデータ） (2021-08-30T01:07:05Z)
Adaptive Rational Activations to Boost Deep Reinforcement Learning [68.10769262901003]
我々は、合理的が適応可能なアクティベーション機能に適合する理由と、ニューラルネットワークへの含意が重要である理由を動機付けている。人気アルゴリズムに(繰り返しの)アクティベーションを組み込むことで,アタリゲームにおいて一貫した改善がもたらされることを実証する。
論文参考訳（メタデータ） (2021-02-18T14:53:12Z)
And/or trade-off in artificial neurons: impact on adversarial robustness [91.3755431537592]
ネットワークに十分な数のOR様ニューロンが存在すると、分類の脆さと敵の攻撃に対する脆弱性が増加する。そこで我々は,AND様ニューロンを定義し,ネットワーク内での割合を増大させる対策を提案する。 MNISTデータセットによる実験結果から,本手法はさらなる探索の方向として有望であることが示唆された。
論文参考訳（メタデータ） (2021-02-15T08:19:05Z)
Can Temporal-Difference and Q-Learning Learn Representation? A Mean-Field Theory [110.99247009159726]
時間差とQ-ラーニングは、ニューラルネットワークのような表現力のある非線形関数近似器によって強化される深層強化学習において重要な役割を担っている。特に時間差学習は、関数近似器が特徴表現において線形であるときに収束する。
論文参考訳（メタデータ） (2020-06-08T17:25:22Z)
Towards Efficient Processing and Learning with Spikes: New Approaches for Multi-Spike Learning [59.249322621035056]
各種タスクにおける他のベースラインよりも優れた性能を示すための2つの新しいマルチスパイク学習ルールを提案する。特徴検出タスクでは、教師なしSTDPの能力と、その制限を提示する能力を再検討する。提案した学習ルールは,特定の制約を適用せずに,幅広い条件で確実にタスクを解くことができる。
論文参考訳（メタデータ） (2020-05-02T06:41:20Z)
Non-linear Neurons with Human-like Apical Dendrite Activations [81.18416067005538]
XOR論理関数を100%精度で学習し, 標準的なニューロンに後続のアピーカルデンドライト活性化(ADA)が認められた。コンピュータビジョン,信号処理,自然言語処理の6つのベンチマークデータセットについて実験を行った。
論文参考訳（メタデータ） (2020-02-02T21:09:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。