論文の概要: AI Accelerator Survey and Trends
- arxiv url: http://arxiv.org/abs/2109.08957v1
- Date: Sat, 18 Sep 2021 15:57:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-21 15:59:49.641049
- Title: AI Accelerator Survey and Trends
- Title(参考訳): AI加速器の調査と動向
- Authors: Albert Reuther, Peter Michaleas, Michael Jones, Vijay Gadepally,
Siddharth Samsi, Jeremy Kepner
- Abstract要約: 本稿では,過去2年間のAIアクセラレータとプロセッサの調査を更新する。
本稿では,ピーク性能と電力消費数で公表されている現在の商用アクセラレータをまとめ,要約する。
- 参考スコア(独自算出の注目度): 4.722078109242797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the past several years, new machine learning accelerators were being
announced and released every month for a variety of applications from speech
recognition, video object detection, assisted driving, and many data center
applications. This paper updates the survey of AI accelerators and processors
from past two years. This paper collects and summarizes the current commercial
accelerators that have been publicly announced with peak performance and power
consumption numbers. The performance and power values are plotted on a scatter
graph, and a number of dimensions and observations from the trends on this plot
are again discussed and analyzed. This year, we also compile a list of
benchmarking performance results and compute the computational efficiency with
respect to peak performance.
- Abstract(参考訳): 過去数年間、音声認識、ビデオオブジェクト検出、アシスト駆動、および多くのデータセンターアプリケーションなど、さまざまなアプリケーション向けに、新しい機械学習アクセラレータが発表され、毎月リリースされている。
本稿では,過去2年間のAIアクセラレータとプロセッサの調査を更新する。
本稿では,ピーク性能と電力消費数で公表されている現在の商用アクセラレータをまとめ,要約する。
散乱グラフ上で性能とパワー値がプロットされ、このプロットの傾向から多くの次元と観測結果が再度議論され、分析される。
また今年は,ベンチマーク結果のリストをコンパイルし,ピーク性能に関する計算効率を計算した。
関連論文リスト
- Accelerating AI Performance using Anderson Extrapolation on GPUs [2.114333871769023]
Anderson外挿を利用したAI性能向上のための新しい手法を提案する。
混合ペナルティが生じるクロスオーバー点を特定することにより、反復を収束に還元することに焦点を当てる。
高速コンピューティングの領域におけるスケーラビリティと効率性の拡張を動機とした,トレーニングと推論の両面での大幅な改善を示す。
論文 参考訳(メタデータ) (2024-10-25T10:45:17Z) - Dynamic Data Pruning for Automatic Speech Recognition [58.95758272440217]
ASR(DDP-ASR)のダイナミック・データ・プルーニング(Dynamic Data Pruning for ASR)を導入し,音声関連データセットに特化して微細なプルーニングの粒度を提供する。
実験の結果,DDP-ASRは最大1.6倍のトレーニング時間を節約できることがわかった。
論文 参考訳(メタデータ) (2024-06-26T14:17:36Z) - Insight Gained from Migrating a Machine Learning Model to Intelligence Processing Units [8.782847610934635]
インテリジェンス処理ユニット(IPU)は、機械学習(ML)アプリケーションのためのGPUに代わる実行可能なアクセラレータを提供する。
本稿では,GPU から IPU へモデルを移行するプロセスについて検討し,パイプライニングや勾配蓄積などの最適化手法について検討する。
従来のColossus IPUと比較して,Bow IPUの性能は大幅に向上した。
論文 参考訳(メタデータ) (2024-04-16T17:02:52Z) - G-MEMP: Gaze-Enhanced Multimodal Ego-Motion Prediction in Driving [71.9040410238973]
我々は、視線データを用いて、運転者の車両のエゴ軌道を推定することに集中する。
次に、GPSとビデオ入力と視線データを組み合わせた新しいマルチモーダルエゴ軌道予測ネットワークであるG-MEMPを開発する。
その結果,G-MEMPは両ベンチマークにおいて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - Lincoln AI Computing Survey (LAICS) Update [8.790207519640472]
本稿は、過去4年間のAIアクセラレーターおよびプロセッサの調査の更新である。
公に発表された現在の商業アクセラレータを収集し、要約する。
市場セグメントを散乱プロットにハイライトし、各セグメントのズームプロットも含む。
論文 参考訳(メタデータ) (2023-10-13T14:36:26Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。
UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文 参考訳(メタデータ) (2022-06-21T01:46:38Z) - Dynamic GPU Energy Optimization for Machine Learning Training Workloads [9.156075372403421]
GPOEOは、機械学習トレーニングワークロードのための、オンラインGPUエネルギ最適化フレームワークである。
オンライン計測、多目的予測モデリング、探索最適化に新しい手法を採用している。
NVIDIAのデフォルトのスケジューリング戦略と比較すると、GPOEOは平均エネルギーを16.2%削減し、平均実行時間は5.1%増加した。
論文 参考訳(メタデータ) (2022-01-05T16:25:48Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - Survey of Machine Learning Accelerators [15.163544680926474]
本稿では,昨年のIEEE-HPEC論文から,AIアクセラレータとプロセッサの調査を更新する。
本稿では,性能と消費電力の数値が公表されている現在のアクセラレータを整理し,要約する。
論文 参考訳(メタデータ) (2020-09-01T01:28:59Z) - PnPNet: End-to-End Perception and Prediction with Tracking in the Loop [82.97006521937101]
我々は、自動運転車の文脈において、共同認識と運動予測の問題に取り組む。
我々は,入力センサデータとしてエンド・ツー・エンドのモデルであるNetを提案し,各ステップのオブジェクト追跡とその将来レベルを出力する。
論文 参考訳(メタデータ) (2020-05-29T17:57:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。