Fugu-MT 論文翻訳(概要): A Nesterov's Accelerated quasi-Newton method for Global Routing using Deep Reinforcement Learning

論文の概要: A Nesterov's Accelerated quasi-Newton method for Global Routing using Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2010.09465v1
Date: Thu, 15 Oct 2020 07:30:17 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-07 04:55:26.186538
Title: A Nesterov's Accelerated quasi-Newton method for Global Routing using Deep Reinforcement Learning
Title（参考訳）: 深層強化学習を用いたグローバルルーティングのためのネステロフ加速準ニュートン法
Authors: S. Indrapriyadarsini, Shahrzad Mahboubi, Hiroshi Ninomiya, Takeshi Kamio, Hideki Asai
Abstract要約: 本稿では,Nesterovの高速化準ニュートン法を導入することにより,深層Qネットワークのトレーニングを高速化する。グローバルルーティングのための二重DQNを用いた深層強化学習における提案手法の性能評価を行った。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep Q-learning method is one of the most popularly used deep reinforcement learning algorithms which uses deep neural networks to approximate the estimation of the action-value function. Training of the deep Q-network (DQN) is usually restricted to first order gradient based methods. This paper attempts to accelerate the training of deep Q-networks by introducing a second order Nesterov's accelerated quasi-Newton method. We evaluate the performance of the proposed method on deep reinforcement learning using double DQNs for global routing. The results show that the proposed method can obtain better routing solutions compared to the DQNs trained with first order Adam and RMSprop methods.
Abstract（参考訳）: ディープQ学習法は、ディープニューラルネットワークを用いてアクション値関数の推定を近似する最も一般的なディープ強化学習アルゴリズムの1つである。ディープQネットワーク(DQN)のトレーニングは通常、一階勾配に基づく手法に制限される。本稿では,第2次ネステロフ加速準ニュートン法を導入することにより,深層qネットワークの学習を高速化する。グローバルルーティングのための二重DQNを用いた深層強化学習における提案手法の性能評価を行った。提案手法は,第1次Adam法とRMSprop法で訓練したDQNよりも優れたルーティング解が得られることを示す。

関連論文リスト

Application of linear regression and quasi-Newton methods to the deep reinforcement learning in continuous action cases [0.0]
LeineらによりLast Squares Deep Q Network (LS-DQN)法が提案された。本稿では,この制限に対応するために,Double Least Squares Deep Deterministic Policy Gradient (DLS-DDPG)法を提案する。 MuJoCo 環境で行った数値実験により,提案手法は少なくともいくつかのタスクにおいて性能を向上した。
論文参考訳（メタデータ） (2025-03-19T08:10:54Z)
Neural-Network-Driven Reward Prediction as a Heuristic: Advancing Q-Learning for Mobile Robot Path Planning [10.066546417538786]
ニューラルネットワークの出力を情報として利用し,Q-ラーニングの収束過程を高速化するNDR-QL法を提案する。提案手法は,ベースラインQ-ラーニング手法の収束速度を90%向上し,パス品質の指標において従来改善されていたQ-ラーニング手法を上回っている。
論文参考訳（メタデータ） (2024-12-17T08:19:40Z)
A lifted Bregman strategy for training unfolded proximal neural network Gaussian denoisers [8.343594411714934]
屈曲した近位ニューラルネットワーク(PNN)は、深層学習と近位最適化のアプローチを組み合わせた一連の手法である。展開されたPNNに対するBregman距離に基づく揚力トレーニングの定式化を提案する。画像復調の数値シミュレーションにより,提案したPNNのトレーニング手法の挙動を評価する。
論文参考訳（メタデータ） (2024-08-16T13:41:34Z)
An Efficient Learning-based Solver Comparable to Metaheuristics for the Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。まず,方向対応型注意モデル(DaAM)を提案する。第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文参考訳（メタデータ） (2024-03-11T02:17:42Z)
The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。 FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文参考訳（メタデータ） (2023-03-17T02:01:11Z)
M$^2$DQN: A Robust Method for Accelerating Deep Q-learning Network [6.689964384669018]
我々は,Deep Q-Network(M$2$DQN)におけるMax-Mean損失を利用したフレームワークを提案する。トレーニングステップで1バッチの経験をサンプリングする代わりに、経験の再生からいくつかのバッチをサンプリングし、これらのバッチの最大TDエラーなどのパラメータを更新する。ジムゲームにおけるDouble DQN(Double DQN)を用いて,このフレームワークの有効性を検証する。
論文参考訳（メタデータ） (2022-09-16T09:20:35Z)
Provable Acceleration of Nesterov's Accelerated Gradient Method over Heavy Ball Method in Training Over-Parameterized Neural Networks [12.475834086073734]
1次勾配法はニューラルネットワークのトレーニングに広く用いられている。近年の研究では、最初のニューラルオーダー法が世界最小収束を達成することができることが証明されている。
論文参考訳（メタデータ） (2022-08-08T07:13:26Z)
Backward Gradient Normalization in Deep Neural Networks [68.8204255655161]
ニューラルネットワークトレーニングにおける勾配正規化のための新しい手法を提案する。勾配は、ネットワークアーキテクチャ内の特定の点で導入された正規化レイヤを使用して、後方通過中に再スケールされる。非常に深いニューラルネットワークを用いたテストの結果、新しい手法が勾配ノルムを効果的に制御できることが示されている。
論文参考訳（メタデータ） (2021-06-17T13:24:43Z)
Local Critic Training for Model-Parallel Learning of Deep Neural Networks [94.69202357137452]
そこで我々は,局所的批判訓練と呼ばれる新しいモデル並列学習手法を提案する。提案手法は,畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)の両方において,階層群の更新プロセスの分離に成功したことを示す。また,提案手法によりトレーニングされたネットワークを構造最適化に利用できることを示す。
論文参考訳（メタデータ） (2021-02-03T09:30:45Z)
Cross Learning in Deep Q-Networks [82.20059754270302]
本稿では、値に基づく強化学習手法において、よく知られた過大評価問題を緩和することを目的とした、新しいクロスQ-ラーニングアルゴリズムを提案する。本アルゴリズムは,並列モデルの集合を維持し,ランダムに選択されたネットワークに基づいてQ値を算出することによって,二重Q-ラーニングに基づいて構築する。
論文参考訳（メタデータ） (2020-09-29T04:58:17Z)
Deep Networks with Fast Retraining [0.0]
本稿では,深層畳み込みニューラルネットワーク(DCNN)学習のための新しいMP逆ベース高速リトレーニング戦略を提案する。各トレーニングでは、後進パスでトレーニングされた畳み込み層の数を制御するランダムな学習戦略が最初に利用される。そこで,MP 逆ベースバッチ・バイ・バッチ・ラーニング・ストラテジーを開発し,産業規模の計算資源を使わずにネットワークを実装できるようにした。
論文参考訳（メタデータ） (2020-08-13T15:17:38Z)
Variance Reduction for Deep Q-Learning using Stochastic Recursive Gradient [51.880464915253924]
深層Q-ラーニングアルゴリズムは、過度な分散を伴う勾配推定に苦しむことが多い。本稿では、SRG-DQNと呼ばれる新しいアルゴリズムを実現するため、深層Q-ラーニングにおける勾配推定を更新するためのフレームワークを提案する。
論文参考訳（メタデータ） (2020-07-25T00:54:20Z)
Tune smarter not harder: A principled approach to tuning learning rates for shallow nets [13.203765985718201]
浅いフィードフォワードニューラルネットワークに対して,学習率を選択するための原則的アプローチを提案する。シミュレーションにより,提案手法が既存のチューニング手法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (2020-03-22T09:38:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。