論文の概要: Mutual Information Decay Curves and Hyper-Parameter Grid Search Design
for Recurrent Neural Architectures
- arxiv url: http://arxiv.org/abs/2012.04632v1
- Date: Tue, 8 Dec 2020 18:52:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 20:42:26.217753
- Title: Mutual Information Decay Curves and Hyper-Parameter Grid Search Design
for Recurrent Neural Architectures
- Title(参考訳): リカレントニューラルネットワークのための相互情報減衰曲線とハイパーパラメータグリッド探索設計
- Authors: Abhijit Mahalunkar and John D. Kelleher
- Abstract要約: 相互情報を用いてデータセット内の長距離依存関係(ldd)を分析する。
さまざまなベンチマークデータセットでDilatedRNNの最新の結果を取得します。
- 参考スコア(独自算出の注目度): 1.2894104422808241
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present an approach to design the grid searches for hyper-parameter
optimization for recurrent neural architectures. The basis for this approach is
the use of mutual information to analyze long distance dependencies (LDDs)
within a dataset. We also report a set of experiments that demonstrate how
using this approach, we obtain state-of-the-art results for DilatedRNNs across
a range of benchmark datasets.
- Abstract(参考訳): 本稿では,リカレントニューラルネットワークに対するハイパーパラメータ最適化のためのグリッド探索の設計手法を提案する。
このアプローチの基盤は、データセット内の長距離依存関係(ldd)を分析するための相互情報の利用である。
また、このアプローチを用いて、DilatedRNNに対して、さまざまなベンチマークデータセットの最先端結果を得る方法を示す一連の実験を報告する。
関連論文リスト
- POMONAG: Pareto-Optimal Many-Objective Neural Architecture Generator [4.09225917049674]
Transferable NASが登場し、データセット依存からタスク依存への探索プロセスを一般化した。
本稿では多目的拡散プロセスを通じて拡散NAGを拡張するPOMONAGを紹介する。
結果は、NAS201とMobileNetV3の2つの検索スペースで検証され、15の画像分類データセットで評価された。
論文 参考訳(メタデータ) (2024-09-30T16:05:29Z) - Heterogeneous Learning Rate Scheduling for Neural Architecture Search on Long-Tailed Datasets [0.0]
本稿では,DARTSのアーキテクチャパラメータに適した適応学習率スケジューリング手法を提案する。
提案手法は,学習エポックに基づくアーキテクチャパラメータの学習率を動的に調整し,よく訓練された表現の破壊を防止する。
論文 参考訳(メタデータ) (2024-06-11T07:32:25Z) - Quantifying uncertainty for deep learning based forecasting and
flow-reconstruction using neural architecture search ensembles [0.8258451067861933]
本稿では,ディープニューラルネットワーク(DNN)の自動検出手法を提案するとともに,アンサンブルに基づく不確実性定量化にも有効であることを示す。
提案手法は,タスクの高パフォーマンスニューラルネットワークアンサンブルを検出するだけでなく,不確実性をシームレスに定量化する。
本研究では, 歴史的データからの予測と, 海面温度のスパースセンサからのフロー再構成という2つの課題に対して, この枠組みの有効性を実証する。
論文 参考訳(メタデータ) (2023-02-20T03:57:06Z) - Learning to Learn with Generative Models of Neural Network Checkpoints [71.06722933442956]
ニューラルネットワークのチェックポイントのデータセットを構築し,パラメータの生成モデルをトレーニングする。
提案手法は,幅広い損失プロンプトに対するパラメータの生成に成功している。
我々は、教師付きおよび強化学習における異なるニューラルネットワークアーキテクチャとタスクに本手法を適用した。
論文 参考訳(メタデータ) (2022-09-26T17:59:58Z) - Exploiting Temporal Structures of Cyclostationary Signals for
Data-Driven Single-Channel Source Separation [98.95383921866096]
単一チャネルソース分離(SCSS)の問題点について検討する。
我々は、様々なアプリケーション領域に特に適するサイクロ定常信号に焦点を当てる。
本稿では,最小MSE推定器と競合するU-Netアーキテクチャを用いたディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T14:04:56Z) - A Local Optima Network Analysis of the Feedforward Neural Architecture
Space [0.0]
ローカルオプティマネットワーク(LON)解析は、候補解のフィットネスランドスケープの派生である。
LONは、ニューラルネットワークを分析し最適化する実行可能なパラダイムを提供することができる。
論文 参考訳(メタデータ) (2022-06-02T08:09:17Z) - A novel Deep Neural Network architecture for non-linear system
identification [78.69776924618505]
非線形システム識別のための新しいDeep Neural Network (DNN)アーキテクチャを提案する。
メモリシステムにインスパイアされたインダクティブバイアス(アーキテクチャ)と正規化(損失関数)を導入する。
このアーキテクチャは、利用可能なデータのみに基づいて、自動的な複雑性の選択を可能にする。
論文 参考訳(メタデータ) (2021-06-06T10:06:07Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - Hyperparameter Optimization in Neural Networks via Structured Sparse
Recovery [54.60327265077322]
スパースリカバリ法のレンズを用いて,ニューラルネットワークの自動設計における2つの重要な問題について検討する。
本論文の前半では,HPOと構造的スパースリカバリの新たな接続を確立する。
本論文の第2部では,NASと構造的スパース回復の関連性を確立する。
論文 参考訳(メタデータ) (2020-07-07T00:57:09Z) - A Neural Architecture for Detecting Confusion in Eye-tracking Data [1.8655840060559168]
我々は、RNNとCNNのサブモデルを並列に使用して、データの時間的・空間的側面を活用するアーキテクチャを提案する。
本モデルでは,Random Forestsをベースとした既存モデルよりも22%の感度・特異性が向上した。
論文 参考訳(メタデータ) (2020-03-13T18:20:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。