論文の概要: Sparse neural networks with skip-connections for identification of
aluminum electrolysis cell
- arxiv url: http://arxiv.org/abs/2301.00582v2
- Date: Thu, 27 Apr 2023 10:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-28 21:43:58.998025
- Title: Sparse neural networks with skip-connections for identification of
aluminum electrolysis cell
- Title(参考訳): アルミニウム電解セル識別のためのスキップ接続を有するスパースニューラルネットワーク
- Authors: Erlend Torje Berg Lundby, Haakon Robinsson, Adil Rasheed, Ivar Johan
Halvorsen, Jan Tommy Gravdahl
- Abstract要約: 本研究では,スキップ接続とスポーサリティプロモータライゼーションの組み合わせが,短い,中,長い予測地平線による予測の開放ループ安定性と精度に及ぼす影響について検討する。
提案したモデル構造は、入力層と全ての断続層からスパース出力層へのスペーシング接続を含み、InputSkipと呼ばれる。
その結果、InputSkipは、オープンループ安定性と長期予測精度に関して、高密度でスパースな標準フィードフォワードニューラルネットワークと高密度のInputSkipより優れていた。
- 参考スコア(独自算出の注目度): 0.4812321790984493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural networks are rapidly gaining interest in nonlinear system
identification due to the model's ability to capture complex input-output
relations directly from data. However, despite the flexibility of the approach,
there are still concerns about the safety of these models in this context, as
well as the need for large amounts of potentially expensive data. Aluminum
electrolysis is a highly nonlinear production process, and most of the data
must be sampled manually, making the sampling process expensive and infrequent.
In the case of infrequent measurements of state variables, the accuracy and
open-loop stability of the long-term predictions become highly important.
Standard neural networks struggle to provide stable long-term predictions with
limited training data. In this work, we investigate the effect of combining
concatenated skip-connections and the sparsity-promoting $\ell_1$
regularization on the open-loop stability and accuracy of forecasts with short,
medium, and long prediction horizons. The case study is conducted on a
high-dimensional and nonlinear simulator representing an aluminum electrolysis
cell's mass and energy balance. The proposed model structure contains
concatenated skip connections from the input layer and all intermittent layers
to the output layer, referred to as InputSkip. $\ell_1$ regularized InputSkip
is called sparse InputSkip. The results show that sparse InputSkip outperforms
dense and sparse standard feedforward neural networks and dense InputSkip
regarding open-loop stability and long-term predictive accuracy. The results
are significant when models are trained on datasets of all sizes (small,
medium, and large training sets) and for all prediction horizons (short,
medium, and long prediction horizons.)
- Abstract(参考訳): モデルがデータから直接複雑な入出力関係をキャプチャできるため、ニューラルネットワークは非線形システムの識別に急速に関心を寄せている。
しかし、このアプローチの柔軟性にもかかわらず、この文脈ではこれらのモデルの安全性や、潜在的に高価なデータを大量に必要とすることへの懸念が残っている。
アルミニウム電解は極めて非線形な製造プロセスであり、ほとんどのデータは手動でサンプリングする必要があるため、サンプリングプロセスは高価で不十分である。
状態変数の頻繁な測定では,長期予測の精度と開ループ安定性が非常に重要である。
標準的なニューラルネットワークは、限られたトレーニングデータで安定した長期予測を提供するのに苦労している。
本研究では,連結型スキップ接続とスペーサを動機とする$\ell_1$正規化の組み合わせが,短い,中,長い予測地平線による予測のオープンループ安定性と精度に与える影響について検討する。
ケーススタディはアルミニウム電解セルの質量とエネルギー収支を表す高次元および非線形シミュレータを用いて行った。
提案したモデル構造は、入力層と全ての断続層から出力層への連結スキップ接続を含み、InputSkipと呼ばれる。
$\ell_1$ regularized InputSkipはスパースInputSkipと呼ばれる。
その結果,Sparse InputSkipは,オープンループ安定性と長期予測精度に関して,高密度かつ疎度なフィードフォワードニューラルネットワークと高密度なInputSkipより優れていた。
モデルがすべてのサイズのデータセット(小、中、大型のトレーニングセット)と、すべての予測水平線(短、中、長期予測水平線)でトレーニングされる場合、結果は重要である。
関連論文リスト
- An Investigation on Machine Learning Predictive Accuracy Improvement and Uncertainty Reduction using VAE-based Data Augmentation [2.517043342442487]
深層生成学習は、特定のMLモデルを使用して、既存のデータの基盤となる分布を学習し、実際のデータに似た合成サンプルを生成する。
本研究では,変分オートエンコーダ(VAE)を用いた深部生成モデルを用いて,データ拡張の有効性を評価することを目的とする。
本研究では,拡張データを用いてトレーニングしたディープニューラルネットワーク(DNN)モデルの予測において,データ拡張が精度の向上につながるかどうかを検討した。
論文 参考訳(メタデータ) (2024-10-24T18:15:48Z) - Data-Augmented Predictive Deep Neural Network: Enhancing the extrapolation capabilities of non-intrusive surrogate models [0.5735035463793009]
本稿では、カーネル動的モード分解(KDMD)を用いて、畳み込みオートエンコーダ(CAE)のエンコーダ部が生成する潜伏空間のダイナミクスを進化させる新しいディープラーニングフレームワークを提案する。
KDMD-decoder-extrapolated dataを元のデータセットに追加した後、この拡張データを用いてフィードフォワードディープニューラルネットワークと共にCAEをトレーニングする。
トレーニングされたネットワークは、トレーニング外のパラメータサンプルでトレーニング時間間隔外の将来の状態を予測できる。
論文 参考訳(メタデータ) (2024-10-17T09:26:14Z) - Scalable Spatiotemporal Prediction with Bayesian Neural Fields [3.3299088915999295]
BayesNFは、高容量関数推定のための新しいディープニューラルネットワークアーキテクチャである。
気候および公衆衛生データセットからの統計的機械学習予測問題に対してベイズNFを評価した。
論文 参考訳(メタデータ) (2024-03-12T13:47:50Z) - Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - The kernel-balanced equation for deep neural networks [0.0]
本稿では,データセットの分布推定のためのネットワークについて考察する。
推定は不安定であり、不安定性はデータ密度とトレーニング時間に依存する。
論文 参考訳(メタデータ) (2023-09-14T01:00:05Z) - Truncated tensor Schatten p-norm based approach for spatiotemporal
traffic data imputation with complicated missing patterns [77.34726150561087]
本研究は, モード駆動繊維による3症例の欠失を含む, 4症例の欠失パターンについて紹介する。
本モデルでは, 目的関数の非性にもかかわらず, 乗算器の交互データ演算法を統合することにより, 最適解を導出する。
論文 参考訳(メタデータ) (2022-05-19T08:37:56Z) - Bilinear Input Normalization for Neural Networks in Financial
Forecasting [101.89872650510074]
本稿では,高頻度金融時系列を扱うディープニューラルネットワークのための新しいデータ駆動正規化手法を提案する。
提案手法は,財務時系列のバイモーダル特性を考慮したものである。
我々の実験は最先端のニューラルネットワークと高周波データを用いて行われ、他の正規化技術よりも大幅に改善された。
論文 参考訳(メタデータ) (2021-09-01T07:52:03Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Robust Implicit Networks via Non-Euclidean Contractions [63.91638306025768]
暗黙のニューラルネットワークは、精度の向上とメモリ消費の大幅な削減を示す。
彼らは不利な姿勢と収束の不安定さに悩まされる。
本論文は,ニューラルネットワークを高機能かつ頑健に設計するための新しい枠組みを提供する。
論文 参考訳(メタデータ) (2021-06-06T18:05:02Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。