論文の概要: NROWAN-DQN: A Stable Noisy Network with Noise Reduction and Online
Weight Adjustment for Exploration
- arxiv url: http://arxiv.org/abs/2006.10980v1
- Date: Fri, 19 Jun 2020 07:10:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 03:21:41.309018
- Title: NROWAN-DQN: A Stable Noisy Network with Noise Reduction and Online
Weight Adjustment for Exploration
- Title(参考訳): NROWAN-DQN: ノイズ低減と探索用オンライン重み調整機能を備えた安定ノイズネットワーク
- Authors: Shuai Han and Wenbo Zhou and Jing Liu and Shuai L\"u
- Abstract要約: 本稿では,NROWAN-DQN,すなわちノイズリダクションとオンライン重み調整ノイズ-DQNというアルゴリズムを提案する。
本研究では,NuisyNet-DQN のノイズ低減手法を開発した。
第二に、ノイズ低減のためのオンライン重み調整戦略を設計し、安定した性能を向上し、エージェントのスコアを高くする。
- 参考スコア(独自算出の注目度): 16.288831638257125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep reinforcement learning has been applied more and more widely nowadays,
especially in various complex control tasks. Effective exploration for noisy
networks is one of the most important issues in deep reinforcement learning.
Noisy networks tend to produce stable outputs for agents. However, this
tendency is not always enough to find a stable policy for an agent, which
decreases efficiency and stability during the learning process. Based on
NoisyNets, this paper proposes an algorithm called NROWAN-DQN, i.e., Noise
Reduction and Online Weight Adjustment NoisyNet-DQN. Firstly, we develop a
novel noise reduction method for NoisyNet-DQN to make the agent perform stable
actions. Secondly, we design an online weight adjustment strategy for noise
reduction, which improves stable performance and gets higher scores for the
agent. Finally, we evaluate this algorithm in four standard domains and analyze
properties of hyper-parameters. Our results show that NROWAN-DQN outperforms
prior algorithms in all these domains. In addition, NROWAN-DQN also shows
better stability. The variance of the NROWAN-DQN score is significantly
reduced, especially in some action-sensitive environments. This means that in
some environments where high stability is required, NROWAN-DQN will be more
appropriate than NoisyNets-DQN.
- Abstract(参考訳): 近年, 様々な複雑な制御タスクにおいて, 深層強化学習が広く適用されている。
ノイズの多いネットワークに対する効果的な探索は、深層強化学習において最も重要な問題の1つだ。
ノイズネットワークはエージェントに対して安定した出力を生成する傾向がある。
しかし、この傾向は、学習過程における効率と安定性を低下させるエージェントの安定的なポリシーを見つけるのに十分とは限らない。
本稿では,NoisyNetsに基づくNROWAN-DQN,すなわちノイズ低減とオンライン重み調整のアルゴリズムを提案する。
まず,NuisyNet-DQN のノイズ低減手法を開発し,エージェントに安定した動作をさせる。
第2に,騒音低減のためのオンライン重量調整戦略を考案し,性能を向上し,エージェントのスコアを高くする。
最後に、このアルゴリズムを4つの標準領域で評価し、ハイパーパラメータの特性を解析する。
この結果から,NROWAN-DQNはこれらの領域で先行アルゴリズムよりも優れていた。
さらにNROWAN-DQNは安定性も向上した。
NROWAN-DQNスコアの変動は、特に一部の行動感受性環境において顕著に減少する。
つまり、高い安定性が必要な環境では、NROWAN-DQNはNoisyNets-DQNよりも適切である。
関連論文リスト
- Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - sVAD: A Robust, Low-Power, and Light-Weight Voice Activity Detection
with Spiking Neural Networks [51.516451451719654]
スパイキングニューラルネットワーク(SNN)は生物学的に妥当で、電力効率が高いことが知られている。
本稿では sVAD と呼ばれる新しい SNN ベースの音声活動検出モデルを提案する。
SincNetと1D畳み込みによる効果的な聴覚特徴表現を提供し、アテンション機構による雑音の堅牢性を向上させる。
論文 参考訳(メタデータ) (2024-03-09T02:55:44Z) - Noisy Spiking Actor Network for Exploration [56.13654667729119]
スパイキングニューラルネットワーク(SNN)はノイズに対して強い堅牢性を持ち、局所的な障害による効率的な探索を実現することは困難である。
本稿では,充電・送信中の時間関連ノイズを発生させるノイズの多いスパイクアクタネットワーク(ノイズSAN)を提案する。
本手法は,OpenAI体育館の多種多様な連続制御タスクにおいて,最先端の性能を向上する。
論文 参考訳(メタデータ) (2024-03-07T02:47:08Z) - Differentially Private Deep Q-Learning for Pattern Privacy Preservation
in MEC Offloading [76.0572817182483]
攻撃者は、エッジサーバ(ES)のキュー情報とユーザの使用パターンを推測するために、オフロードの決定を盗み取ることができる。
パターンプライバシ(PP)を維持しつつ,レイテンシ,ESのエネルギー消費,タスク削減率を両立させるオフロード戦略を提案する。
そこで我々はDP-DQOアルゴリズムを開発し,PP問題にノイズを注入することでこの問題に対処する。
論文 参考訳(メタデータ) (2023-02-09T12:50:18Z) - Noise Injection Node Regularization for Robust Learning [0.0]
ノイズインジェクションノード規則化(NINR)は、トレーニング期間中に、構造化されたノイズをディープニューラルネットワーク(DNN)に注入する手法である。
本研究は、NINRの下で訓練されたフィードフォワードDNNに対する各種試験データ摂動に対するロバスト性を大幅に改善する理論的および実証的な証拠を示す。
論文 参考訳(メタデータ) (2022-10-27T20:51:15Z) - Mitigating Black-Box Adversarial Attacks via Output Noise Perturbation [4.7591428725916245]
ブラックボックスの敵攻撃では、敵はディープニューラルネットワーク(DNN)に問い合わせる
本稿では,この攻撃を緩和するために,DNN出力に白色雑音を加える手法について検討する。
論文 参考訳(メタデータ) (2021-09-30T14:24:44Z) - Noise Stability Regularization for Improving BERT Fine-tuning [94.80511419444723]
BERTのような微調整済みの言語モデルは、様々なNLPタスクにまたがるリーダーボードを支配する一般的なプラクティスとなっている。
レイヤワイドノイズ安定正規化(LNSR)と呼ばれる,NLPタスクの微調整を改善するための,新しい効果的な正規化手法を提案する。
良好な性能を示すモデルが雑音に対する感度が低く、LNSRによる微調整は明らかに高い一般化性と安定性を示すことを実験的に確認した。
論文 参考訳(メタデータ) (2021-07-10T13:19:04Z) - Noisy Recurrent Neural Networks [45.94390701863504]
入力データによって駆動される微分方程式の離散化として,隠れ状態に雑音を注入することによって訓練されたリカレントニューラルネットワーク(RNN)について検討する。
合理的な仮定の下では、この暗黙の正則化はより平坦なミニマムを促進し、より安定な力学を持つモデルに偏りを呈し、分類タスクではより大きな分類マージンを持つモデルを好む。
本理論は, 各種入力摂動に対するロバスト性の向上と, 最先端性能の維持を両立させる実証実験により支持された。
論文 参考訳(メタデータ) (2021-02-09T15:20:50Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - Robust Processing-In-Memory Neural Networks via Noise-Aware
Normalization [26.270754571140735]
PIM加速器は、しばしば物理的成分の固有のノイズに悩まされる。
雑音設定に対してロバストなニューラルネットワーク性能を実現するためのノイズ非依存手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T06:51:28Z) - QUANOS- Adversarial Noise Sensitivity Driven Hybrid Quantization of
Neural Networks [3.2242513084255036]
QUINOSは、逆雑音感度(ANS)に基づく層特異的ハイブリッド量子化を行うフレームワークである
CIFAR10, CIFAR100データセットを用いた実験により, QUINOSは対向ロバスト性の観点から, 均一に量子化された8ビット精度のベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2020-04-22T15:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。