論文の概要: Perturbation of Deep Autoencoder Weights for Model Compression and
Classification of Tabular Data
- arxiv url: http://arxiv.org/abs/2205.08358v1
- Date: Tue, 17 May 2022 13:51:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-18 18:19:32.515846
- Title: Perturbation of Deep Autoencoder Weights for Model Compression and
Classification of Tabular Data
- Title(参考訳): モデル圧縮と表データの分類のための深部オートエンコーダ重みの摂動
- Authors: Manar Samad and Sakib Abrar
- Abstract要約: 本稿では,特にディープオートエンコーダの自己指導型事前学習段階における重みの周期的摂動について述べる。
我々の実験では、トレーニング済みのディープオートエンコーダが従来の機械学習より優れていることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Fully connected deep neural networks (DNN) often include redundant weights
leading to overfitting and high memory requirements. Additionally, the
performance of DNN is often challenged by traditional machine learning models
in tabular data classification. In this paper, we propose periodical
perturbations (prune and regrow) of DNN weights, especially at the
self-supervised pre-training stage of deep autoencoders. The proposed weight
perturbation strategy outperforms dropout learning in four out of six tabular
data sets in downstream classification tasks. The L1 or L2 regularization of
weights at the same pretraining stage results in inferior classification
performance compared to dropout or our weight perturbation routine. Unlike
dropout learning, the proposed weight perturbation routine additionally
achieves 15% to 40% sparsity across six tabular data sets for the compression
of deep pretrained models. Our experiments reveal that a pretrained deep
autoencoder with weight perturbation or dropout can outperform traditional
machine learning in tabular data classification when fully connected DNN fails
miserably. However, traditional machine learning models appear superior to any
deep models when a tabular data set contains uncorrelated variables. Therefore,
the success of deep models can be attributed to the inevitable presence of
correlated variables in real-world data sets.
- Abstract(参考訳): 完全接続型ディープニューラルネットワーク(dnn)は、しばしば過剰な重みと高いメモリ要求につながる冗長な重みを含む。
さらに、DNNの性能は従来の機械学習モデルによって表データ分類においてしばしば問題視される。
本稿では,dnn重みの周期的摂動(prune and regrow)について,特にディープオートエンコーダの自己教師付き事前学習段階において提案する。
提案する重み摂動戦略は,ダウンストリーム分類タスクにおいて6つの表データのうち4つでドロップアウト学習を上回っている。
重みのL1またはL2正則化は,重みの減少や重みの摂動に比較して,分類性能が劣る結果となった。
ドロップアウト学習とは異なり、提案された重み摂動ルーチンは、深い事前学習されたモデルの圧縮のために、6つの表型データセットで15%から40%のスパーシティを達成する。
実験の結果,DNNが完全に接続されていない場合,事前学習した重みの摂動やドロップアウトを伴うディープオートエンコーダは,表型データ分類において従来の機械学習よりも優れることがわかった。
しかし、従来の機械学習モデルは、表のデータセットが非相関変数を含む場合、どんな深層モデルよりも優れているように見える。
したがって、深層モデルの成功は、実世界のデータセットにおける相関変数の存在が避けられないことに起因している。
関連論文リスト
- How Does Data Diversity Shape the Weight Landscape of Neural Networks? [2.89287673224661]
本稿では, ニューラルネットワークのパラメータ空間に対する降雨量, 重量減衰量, 騒音増大の影響について検討する。
我々は、多様なデータが、ドロップアウトと同様の方法で重量景観に影響を与えることを観察する。
合成データにより、実際の入力データにより多くの多様性がもたらされ、アウト・オブ・ディストリビューションテストインスタンスの性能が向上する、と結論付けている。
論文 参考訳(メタデータ) (2024-10-18T16:57:05Z) - Physics-Inspired Deep Learning and Transferable Models for Bridge Scour Prediction [2.451326684641447]
深層学習を用いたせん断予測を橋渡しするために,せん断物理に触発されたニューラルネットワーク(SPINN)を導入する。
SPINNは物理に基づく経験的方程式をディープニューラルネットワークに統合し、サイト固有の履歴監視データを使用してトレーニングする。
性能の変動にもかかわらず、SPINNは、ほとんどのケースで純粋なデータ駆動モデルよりも優れていた。
論文 参考訳(メタデータ) (2024-07-01T13:08:09Z) - Improved Generalization of Weight Space Networks via Augmentations [53.87011906358727]
深度重み空間(DWS)における学習は新たな研究方向であり、2次元および3次元神経場(INRs, NeRFs)への応用
我々は、この過度な適合の理由を実証的に分析し、主要な理由は、DWSデータセットの多様性の欠如であることがわかった。
そこで本研究では,重み空間におけるデータ拡張戦略について検討し,重み空間に適応したMixUp法を提案する。
論文 参考訳(メタデータ) (2024-02-06T15:34:44Z) - Kalman Filter for Online Classification of Non-Stationary Data [101.26838049872651]
オンライン連続学習(OCL)では、学習システムはデータのストリームを受け取り、予測とトレーニングの手順を順次実行する。
本稿では,線形予測量に対するニューラル表現と状態空間モデルを用いた確率ベイズオンライン学習モデルを提案する。
多クラス分類の実験では、モデルの予測能力と非定常性を捉える柔軟性を示す。
論文 参考訳(メタデータ) (2023-06-14T11:41:42Z) - Phantom Embeddings: Using Embedding Space for Model Regularization in
Deep Neural Networks [12.293294756969477]
機械学習モデルの強みは、データから複雑な関数近似を学ぶ能力に起因している。
複雑なモデルはトレーニングデータを記憶する傾向があり、結果としてテストデータの正規化性能が低下する。
情報豊富な潜伏埋め込みと高いクラス内相関を利用してモデルを正規化するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-14T17:15:54Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Compact representations of convolutional neural networks via weight
pruning and quantization [63.417651529192014]
本稿では、音源符号化に基づく畳み込みニューラルネットワーク(CNN)の新しいストレージフォーマットを提案し、重み付けと量子化の両方を活用する。
我々は、全接続層で0.6%、ネットワーク全体で5.44%のスペース占有率を削減し、最低でもベースラインと同じくらいの競争力を発揮する。
論文 参考訳(メタデータ) (2021-08-28T20:39:54Z) - Investigating the Relationship Between Dropout Regularization and Model
Complexity in Neural Networks [0.0]
ドロップアウト規則化は、ディープラーニングモデルのばらつきを低減するのに役立つ。
2,000のニューラルネットワークをトレーニングすることにより,ドロップアウト率とモデル複雑性の関係について検討する。
各密層に隠されたユニットの数から、最適なドロップアウト率を予測するニューラルネットワークを構築します。
論文 参考訳(メタデータ) (2021-08-14T23:49:33Z) - Rank-R FNN: A Tensor-Based Learning Model for High-Order Data
Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。
まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。
Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2021-04-11T16:37:32Z) - Neural networks with late-phase weights [66.72777753269658]
学習後期に重みのサブセットを組み込むことで,SGDの解をさらに改善できることを示す。
学習の終わりに、重み空間における空間平均を取ることにより、1つのモデルを取得する。
論文 参考訳(メタデータ) (2020-07-25T13:23:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。