Fugu-MT 論文翻訳(概要): Stochastic Optimization of Plain Convolutional Neural Networks with Simple methods

論文の概要: Stochastic Optimization of Plain Convolutional Neural Networks with Simple methods

arxiv url: http://arxiv.org/abs/2001.08856v1
Date: Fri, 24 Jan 2020 01:20:59 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-07 04:58:57.476691
Title: Stochastic Optimization of Plain Convolutional Neural Networks with Simple methods
Title（参考訳）: 単純手法による平滑畳み込みニューラルネットワークの確率的最適化
Authors: Yahia Assiri
Abstract要約: 我々は、より優れたパフォーマンスを得るために協調して機能する正規化手法の組み合わせを示す。 5つの有名なデータセットにモデルを適用することにより,これらの手法を検証・評価した。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Convolutional neural networks have been achieving the best possible accuracies in many visual pattern classification problems. However, due to the model capacity required to capture such representations, they are often oversensitive to overfitting and therefore require proper regularization to generalize well. In this paper, we present a combination of regularization techniques which work together to get better performance, we built plain CNNs, and then we used data augmentation, dropout and customized early stopping function, we tested and evaluated these techniques by applying models on five famous datasets, MNIST, CIFAR10, CIFAR100, SVHN, STL10, and we achieved three state-of-the-art-of (MNIST, SVHN, STL10) and very high-Accuracy on the other two datasets.
Abstract（参考訳）: 畳み込みニューラルネットワークは多くの視覚パターン分類問題において最高の精度を実現している。しかし、そのような表現を捉えるのに必要なモデル容量のため、しばしば過剰適合に過敏であり、従ってうまく一般化するために適切な正規化が必要である。本稿では,より優れた性能を得るために協調して機能する正規化手法の組み合わせを提案するとともに,データ拡張,ドロップアウト,カスタマイズした早期停止機能を用いて,MNIST, CIFAR10, CIFAR100, SVHN, STL10の5つの有名なデータセットにモデルを適用して評価し,他の2つのデータセット上で3つの最先端(MNIST, SVHN, STL10)と非常に高い精度を実現した。

関連論文リスト

Higher-Order Convolution Improves Neural Predictivity in the Retina [0.7916635054977068]
畳み込みニューラルネットワーク(CNN)に直接高次操作を組み込むニューラルレスポンス予測への新しいアプローチを提案する。我々のモデルは、畳み込み演算子自体に高次演算を組み込むことで、従来の3次元CNNを拡張します。自然界に対するサラマンデル網膜神経節細胞 (RGC) 応答と, 制御された幾何学的変換に対するマウスRGC応答の新しいデータセットの2つの異なるデータセットに対するアプローチを評価した。
論文参考訳（メタデータ） (2025-05-12T14:43:32Z)
Building Efficient Lightweight CNN Models [0.0]
畳み込みニューラルネットワーク(CNN)は、その堅牢な特徴抽出能力のため、画像分類タスクにおいて重要である。本稿では,競争精度を維持しつつ軽量CNNを構築する手法を提案する。提案モデルは手書き文字MNISTで99%,ファッションMNISTで89%,パラメータは14,862,モデルサイズは0.17MBであった。
論文参考訳（メタデータ） (2025-01-26T14:39:01Z)
A Multi-Fidelity Graph U-Net Model for Accelerated Physics Simulations [1.2430809884830318]
本稿では,GNNモデルの性能向上のための多元性手法の利点を生かした,新しいGNNアーキテクチャであるMulti-Fidelity U-Netを提案する。提案手法は精度とデータ要求において有意に優れた性能を示すことを示す。また,提案アーキテクチャの高速バージョンであるMulti-Fidelity U-Net Liteを35%高速化し,精度を2～5%削減した。
論文参考訳（メタデータ） (2024-12-19T20:09:38Z)
Training Graph Neural Networks Using Non-Robust Samples [2.1937382384136637]
グラフニューラルネットワーク(GNN)は、構造化されたデータを処理するための、非常に効果的なニューラルネットワークである。 GNNは、データポイント間の関係を表すグラフ構造と、データの特徴行列の両方を活用して、特徴表現を最適化する。本稿では,モデルトレーニングのためのより小型で効果的なトレーニングセットを構築するために,元のトレーニングセットからノイズに敏感なトレーニングサンプルを選択する新しい手法を提案する。
論文参考訳（メタデータ） (2024-12-19T11:10:48Z)
Time Elastic Neural Networks [2.1756081703276]
時間弾性ニューラルネットワーク(teNN)という,非定型ニューラルネットワークアーキテクチャの導入と詳細化について述べる。古典的ニューラルネットワークアーキテクチャと比較して新しいのは、時間ゆがみ能力を明確に組み込んでいることだ。トレーニング過程において,TENNは各細胞に必要となるニューロン数を減少させることに成功した。
論文参考訳（メタデータ） (2024-05-27T09:01:30Z)
DiTMoS: Delving into Diverse Tiny-Model Selection on Microcontrollers [34.282971510732736]
我々は、セレクタ分類器アーキテクチャを備えた新しいDNNトレーニングおよび推論フレームワークであるDiTMoSを紹介する。弱いモデルの合成は高い多様性を示すことができ、それらの結合は精度の上限を大幅に高めることができる。我々は,Nucleo STM32F767ZIボード上にDiTMoSをデプロイし,人間の活動認識,キーワードスポッティング,感情認識のための時系列データセットに基づいて評価する。
論文参考訳（メタデータ） (2024-03-14T02:11:38Z)
The Convex Landscape of Neural Networks: Characterizing Global Optima and Stationary Points via Lasso Models [75.33431791218302]
ディープニューラルネットワーク(DNN)モデルは、プログラミング目的に使用される。本稿では,凸型神経回復モデルについて検討する。定常的非次元目的物はすべて,グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。また, 静止非次元目的物はすべて, グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
論文参考訳（メタデータ） (2023-12-19T23:04:56Z)
TCT: Convexifying Federated Learning using Bootstrapped Neural Tangent Kernels [141.29156234353133]
最先端の凸学習手法は、クライアントが異なるデータ分布を持つ場合、集中型よりもはるかにパフォーマンスが劣る。我々は、この格差は、非NISTityが提示した課題に大きく起因していることを示す。本稿では,Train-Convexify Neural Network (TCT) 手法を提案する。
論文参考訳（メタデータ） (2022-07-13T16:58:22Z)
HyperImpute: Generalized Iterative Imputation with Automatic Model Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文参考訳（メタデータ） (2022-06-15T19:10:35Z)
Semantic Perturbations with Normalizing Flows for Improved Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文参考訳（メタデータ） (2021-08-18T03:20:00Z)
Rank-R FNN: A Tensor-Based Learning Model for High-Order Data Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。 Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文参考訳（メタデータ） (2021-04-11T16:37:32Z)
Passive Batch Injection Training Technique: Boosting Network Performance by Injecting Mini-Batches from a different Data Distribution [39.8046809855363]
この研究は、元の入力データとは異なる分布から追加のデータを利用するディープニューラルネットワークの新しいトレーニング手法を提案する。私たちの知る限りでは、畳み込みニューラルネットワーク(CNN)のトレーニングを支援するために、異なるデータ分散を利用する最初の研究である。
論文参考訳（メタデータ） (2020-06-08T08:17:32Z)
Question Type Classification Methods Comparison [0.0]
本稿では、ロジスティック回帰、畳み込みニューラルネットワーク(CNN)、Long Short-Term Memory Network(LSTM)、Quasi-Recurrent Neural Networks(QRNN)といった問題分類タスクに対する最先端のアプローチの比較研究について述べる。すべてのモデルは、事前訓練されたGLoVeワードの埋め込みを使用し、人間のラベル付きデータに基づいて訓練される。最良の精度は5つの畳み込み層と、並列に積み重ねられたさまざまなカーネルサイズを持つCNNモデルを使用して達成され、その後に1つの完全に接続された層が続く。
論文参考訳（メタデータ） (2020-01-03T00:16:46Z)
Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文参考訳（メタデータ） (2019-10-12T22:07:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。