論文の概要: Towards a learning-based performance modeling for accelerating Deep
Neural Networks
- arxiv url: http://arxiv.org/abs/2212.05031v1
- Date: Fri, 9 Dec 2022 18:28:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 15:58:54.447100
- Title: Towards a learning-based performance modeling for accelerating Deep
Neural Networks
- Title(参考訳): ディープニューラルネットワークの高速化のための学習に基づくパフォーマンスモデリングに向けて
- Authors: Damiano Perri, Paolo Sylos Labini, Osvaldo Gervasi, Sergio Tasso,
Flavio Vella
- Abstract要約: 我々は、畳み込みニューラルネットワーク(CNN)を最適化するために、機械学習技術に基づく予測モデルの調査を開始する。
MidgardベースのARM Mali GPUの予備実験では、我々の予測モデルはライブラリが手作業で選択したすべての畳み込み演算子よりも優れていた。
- 参考スコア(独自算出の注目度): 1.1549572298362785
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Emerging applications such as Deep Learning are often data-driven, thus
traditional approaches based on auto-tuners are not performance effective
across the wide range of inputs used in practice. In the present paper, we
start an investigation of predictive models based on machine learning
techniques in order to optimize Convolution Neural Networks (CNNs). As a
use-case, we focus on the ARM Compute Library which provides three different
implementations of the convolution operator at different numeric precision.
Starting from a collation of benchmarks, we build and validate models learned
by Decision Tree and naive Bayesian classifier. Preliminary experiments on
Midgard-based ARM Mali GPU show that our predictive model outperforms all the
convolution operators manually selected by the library.
- Abstract(参考訳): ディープラーニングのような新興アプリケーションは、しばしばデータ駆動であるので、オートチューナーに基づく従来のアプローチは、実際に使用される幅広い入力に対して、パフォーマンスが良くない。
本稿では,畳み込みニューラルネットワーク(cnns)を最適化するために,機械学習に基づく予測モデルの検討を開始する。
ユースケースとして、異なる数値精度で畳み込み演算子の3つの異なる実装を提供するARM Compute Libraryに焦点を当てる。
ベンチマークの照合から始まり、決定木とベイズ分類器によって学習されたモデルを構築し、検証する。
MidgardベースのARM Mali GPUの予備実験では、我々の予測モデルはライブラリが手作業で選択したすべての畳み込み演算子よりも優れていた。
関連論文リスト
- BEND: Bagging Deep Learning Training Based on Efficient Neural Network Diffusion [56.9358325168226]
BEND(Efficient Neural Network Diffusion)に基づくバッグング深層学習学習アルゴリズムを提案する。
我々のアプローチは単純だが効果的であり、まず複数のトレーニングされたモデルの重みとバイアスを入力として、オートエンコーダと潜伏拡散モデルを訓練する。
提案したBENDアルゴリズムは,元のトレーニングモデルと拡散モデルの両方の平均および中央値の精度を一貫して向上させることができる。
論文 参考訳(メタデータ) (2024-03-23T08:40:38Z) - Diffusion-Model-Assisted Supervised Learning of Generative Models for
Density Estimation [10.793646707711442]
本稿では,密度推定のための生成モデルを訓練するためのフレームワークを提案する。
スコアベース拡散モデルを用いてラベル付きデータを生成する。
ラベル付きデータが生成されると、シンプルな完全に接続されたニューラルネットワークをトレーニングして、教師付き方法で生成モデルを学ぶことができます。
論文 参考訳(メタデータ) (2023-10-22T23:56:19Z) - Training dynamic models using early exits for automatic speech
recognition on resource-constrained devices [15.879328412777008]
初期のアーキテクチャは、そのサイズとアーキテクチャを様々なレベルの計算リソースとASRパフォーマンス要求に適応できる動的モデルの開発を可能にする。
また,スクラッチからトレーニングした早期退避モデルは,エンコーダ層が少ない場合に性能を保ちつつ,単一退避モデルや事前学習モデルと比較してタスク精度が向上することを示した。
結果は、ASRモデルの早期アーキテクチャのトレーニングダイナミクスに関する洞察を与える。
論文 参考訳(メタデータ) (2023-09-18T07:45:16Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - A Near-Optimal Algorithm for Debiasing Trained Machine Learning Models [21.56208997475512]
我々は、深層ニューラルネットワーク(DNN)を含む訓練済みモデルのデバイアス化のためのスケーラブルな後処理アルゴリズムを提案する。
過剰なベイズリスクを限定することで、ほぼ最適であることを証明します。
標準ベンチマークデータセットでその利点を実証的に検証する。
論文 参考訳(メタデータ) (2021-06-06T09:45:37Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - On Training and Evaluation of Neural Network Approaches for Model
Predictive Control [9.8918553325509]
本稿では,制約ニューラルネットワークを用いて実装されたモデル予測制御(MPC)のトレーニングと評価を行うフレームワークである。
モチベーションは、安全クリティカルフィードバック制御システムのリアルタイム最適化を、ニューラルネットワークと最適化層という形で学習されたマッピングに置き換えることである。
論文 参考訳(メタデータ) (2020-05-08T15:37:55Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。