論文の概要: Using mixup as regularization and tuning hyper-parameters for ResNets
- arxiv url: http://arxiv.org/abs/2111.11616v1
- Date: Tue, 23 Nov 2021 02:33:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 04:36:05.529505
- Title: Using mixup as regularization and tuning hyper-parameters for ResNets
- Title(参考訳): ミックスアップを正規化として使用し、ResNetのハイパーパラメータをチューニングする
- Authors: Venkata Bhanu Teja Pallakonda
- Abstract要約: アイデンティティマッピングに基づくアーキテクチャ ResNetsとDenseNetsは、イメージ分類タスクにおけるパスブレークの結果を約束している。
この作業はResNetsを再定義し、ミックスアップデータ拡張を正規化として使用し、ハイパーパラメータをチューニングすることで、ResNet50 citeresnetsを改善する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While novel computer vision architectures are gaining traction, the impact of
model architectures is often related to changes or exploring in training
methods. Identity mapping-based architectures ResNets and DenseNets have
promised path-breaking results in the image classification task and are go-to
methods for even now if the data given is fairly limited. Considering the ease
of training with limited resources this work revisits the ResNets and improves
the ResNet50 \cite{resnets} by using mixup data-augmentation as regularization
and tuning the hyper-parameters.
- Abstract(参考訳): 新たなコンピュータビジョンアーキテクチャが注目を集めている一方で、モデルアーキテクチャの影響は、しばしば変化やトレーニング方法の探求に関連している。
アイデンティティマッピングベースのアーキテクチャ ResNetsとDenseNetsは、イメージ分類タスクにおいてパスブレーキングの結果を約束しており、与えられたデータがかなり制限されている場合でも、現在ゴーツーメソッドである。
限られたリソースによるトレーニングの容易さを考えると、この作業はresnetsを再検討し、mixup data-augmentationを正規化し、ハイパーパラメータをチューニングすることでresnet50 \cite{resnets}を改善します。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - ResBuilder: Automated Learning of Depth with Residual Structures [5.172964916120902]
Resbuilderと呼ばれるニューラルネットワーク検索アルゴリズムを開発し、ResNetアーキテクチャをゼロから開発する。
Resbuilderは、市販のResNetと比較して計算コストを削減しつつ、最先端のパフォーマンスに近いパフォーマンスを実現している。
本研究では,本手法の既定パラメータを,プロプライエタリな不正検出データセットに適用することにより,産業応用にも応用できることを実証する。
論文 参考訳(メタデータ) (2023-08-16T16:58:25Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Re-visiting Reservoir Computing architectures optimized by Evolutionary
Algorithms [0.0]
進化的アルゴリズム(EA)はニューラルネットワーク(NN)アーキテクチャの改善に応用されている。
我々は、Reservoir Computing (RC) という、リカレントNNの特定の領域におけるEAの応用に関する体系的な簡単な調査を行う。
論文 参考訳(メタデータ) (2022-11-11T14:50:54Z) - Deep Learning without Shortcuts: Shaping the Kernel with Tailored
Rectifiers [83.74380713308605]
我々は、ReLUの変種であるLeaky ReLUsと完全に互換性のある新しいタイプの変換を開発する。
実験では,ResNetsと競合する深層バニラネットワークによる検証精度を考慮し,計算コストを考慮しない手法を提案する。
論文 参考訳(メタデータ) (2022-03-15T17:49:08Z) - ThreshNet: An Efficient DenseNet using Threshold Mechanism to Reduce
Connections [1.2542322096299672]
本稿では,接続の方法をさらに最適化するためのしきい値機構を用いた新しいネットワークアーキテクチャを提案する。
ThreshNetは、DenseNetと比較して最大60%の推論時間を短縮し、トレーニング速度を最大35%高速化し、エラー率を20%削減する。
論文 参考訳(メタデータ) (2022-01-09T13:52:16Z) - SIRe-Networks: Skip Connections over Interlaced Multi-Task Learning and
Residual Connections for Structure Preserving Object Classification [28.02302915971059]
本稿では、オブジェクト分類タスクにおける消失勾配を低減するために、SIReを定義したインターレース型マルチタスク学習戦略を提案する。
提案手法は、自動エンコーダを介して入力画像構造を保存することにより、畳み込みニューラルネットワーク(CNN)を直接改善する。
提案手法を検証するため、SIRe戦略を介して単純なCNNと有名なネットワークの様々な実装を拡張し、CIFAR100データセットで広範囲にテストする。
論文 参考訳(メタデータ) (2021-10-06T13:54:49Z) - Impact of Aliasing on Generalization in Deep Convolutional Networks [29.41652467340308]
深層畳み込みネットワークの一般化におけるエイリアスの影響について検討する。
キー位置で非トレーニング可能な低域通過フィルタを挿入することでエイリアスを緩和する方法を示す。
論文 参考訳(メタデータ) (2021-08-07T17:12:03Z) - Revisiting ResNets: Improved Training and Scaling Strategies [54.0162571976267]
トレーニングとスケーリングの戦略は、アーキテクチャの変更よりも重要であり、その結果、ResNetは最新のモデルと一致します。
ベストパフォーマンスなスケーリング戦略は、トレーニング体制に依存することを示します。
私たちは、ResNetアーキテクチャのファミリー、ResNet-RSを設計します。ResNet-RSは、TPU上のEfficientNetsよりも1.7倍 - 2.7倍高速です。
論文 参考訳(メタデータ) (2021-03-13T00:18:19Z) - Dynamic Graph: Learning Instance-aware Connectivity for Neural Networks [78.65792427542672]
動的グラフネットワーク(DG-Net)は完全な有向非巡回グラフであり、ノードは畳み込みブロックを表し、エッジは接続経路を表す。
ネットワークの同じパスを使用する代わりに、DG-Netは各ノードの機能を動的に集約する。
論文 参考訳(メタデータ) (2020-10-02T16:50:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。