論文の概要: Performance Analysis of Deep Learning Workloads on a Composable System
- arxiv url: http://arxiv.org/abs/2103.10911v1
- Date: Fri, 19 Mar 2021 17:15:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 14:26:33.402594
- Title: Performance Analysis of Deep Learning Workloads on a Composable System
- Title(参考訳): 構成可能なシステムにおける深層学習ワークロードの性能解析
- Authors: Kauotar El Maghraoui and Lorraine M. Herger and Chekuri Choudary and
Kim Tran and Todd Deshane and David Hanson
- Abstract要約: 構成可能なインフラストラクチャは、計算、ストレージ、アクセラレータ、ネットワークなどのリソースとして定義され、プール内で共有される。
本稿では、IBM Research AI Hardware Centerのパートナーが実装し、利用可能にしたエンタープライズ構成可能なインフラストラクチャの設計について説明します。
- 参考スコア(独自算出の注目度): 0.08388591755871731
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A composable infrastructure is defined as resources, such as compute,
storage, accelerators and networking, that are shared in a pool and that can be
grouped in various configurations to meet application requirements. This
freedom to 'mix and match' resources dynamically allows for experimentation
early in the design cycle, prior to the final architectural design or hardware
implementation of a system. This design provides flexibility to serve a variety
of workloads and provides a dynamic co-design platform that allows experiments
and measurements in a controlled manner. For instance, key performance
bottlenecks can be revealed early on in the experimentation phase thus avoiding
costly and time consuming mistakes. Additionally, various system-level
topologies can be evaluated when experimenting with new System on Chip (SoCs)
and new accelerator types. This paper details the design of an enterprise
composable infrastructure that we have implemented and made available to our
partners in the IBM Research AI Hardware Center (AIHC). Our experimental
evaluations on the composable system give insights into how the system works
and evaluates the impact of various resource aggregations and reconfigurations
on representative deep learning benchmarks.
- Abstract(参考訳): 構成可能なインフラストラクチャは、計算、ストレージ、アクセラレータ、ネットワークなどのリソースとして定義され、プール内で共有され、アプリケーション要件を満たすためにさまざまな構成でグループ化される。
このリソースを「ミックス・アンド・マッチ」する自由は、システムの最終設計やハードウェア実装に先立って、設計サイクルの初期段階で動的に実験することができる。
この設計は、さまざまなワークロードに柔軟性を提供し、実験や測定を制御可能な動的共同設計プラットフォームを提供する。
例えば、重要なパフォーマンスボトルネックは実験段階で早期に明らかになるため、コストと時間のかかる間違いを避けることができる。
さらに、新しいシステムオンチップ(SoC)と新しいアクセラレータータイプを実験する際に、様々なシステムレベルのトポロジーを評価することができる。
本稿では,IBM Research AI Hardware Center(AIHC)のパートナが実装した,エンタープライズ構成可能なインフラストラクチャの設計について詳述する。
構成可能なシステムに対する実験的な評価は、システムがどのように機能するかを洞察し、様々なリソース集約と再構成が代表的ディープラーニングベンチマークに与える影響を評価する。
関連論文リスト
- Reconfigurable Distributed FPGA Cluster Design for Deep Learning
Accelerators [59.11160990637615]
エッジコンピューティングアプリケーション用に設計された低消費電力組み込みFPGAに基づく分散システムを提案する。
提案システムは,様々なニューラルネットワーク(NN)モデルを同時に実行し,パイプライン構造にグラフを配置し,NNグラフの最も計算集約的な層により大きなリソースを手動で割り当てる。
論文 参考訳(メタデータ) (2023-05-24T16:08:55Z) - Towards a Dynamic Composability Approach for using Heterogeneous Systems
in Remote Sensing [0.0]
本稿では,科学計算,人工知能(AI),リモートセンシング領域の共通部分において,構成可能なシステムを利用するための新しいアプローチを提案する。
我々は,NSFが出資するスーパーコンピュータであるExpanseを,地理的分散クラスタであるNautilusとフェデレートする,構成可能なインフラストラクチャの最初の実例のアーキテクチャについて述べる。
論文 参考訳(メタデータ) (2022-11-13T14:48:00Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z) - An Extensible Benchmark Suite for Learning to Simulate Physical Systems [60.249111272844374]
我々は、統一されたベンチマークと評価プロトコルへの一歩を踏み出すために、一連のベンチマーク問題を導入する。
本稿では,4つの物理系と,広く使用されている古典的時間ベースおよび代表的なデータ駆動手法のコレクションを提案する。
論文 参考訳(メタデータ) (2021-08-09T17:39:09Z) - Elastic Architecture Search for Diverse Tasks with Different Resources [87.23061200971912]
本研究では,異なるリソースを持つ多様なタスクを効率的に配置する上で,クラス群に対応するリソース制約や関心のタスクをテスト時に動的に指定する,新たな課題について検討する。
従来のNASアプローチでは、全てのクラスのアーキテクチャを同時に設計することを模索しており、これはいくつかの個別のタスクに最適ではないかもしれない。
本稿では、様々なリソース制約のある多様なタスクに対して、実行時に即時特殊化を可能にする、Elastic Architecture Search (EAS)と呼ばれる斬新で一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-03T00:54:27Z) - Machine Learning-based Orchestration of Containers: A Taxonomy and
Future Directions [25.763692543206773]
既存のメインストリームのクラウドサービスプロバイダは、自動化されたアプリケーション管理のために、分散システムインフラストラクチャにコンテナテクノロジを広く採用しています。
コンテナ化されたアプリケーションのデプロイ、メンテナンス、自動スケーリング、ネットワークの自動化を扱うために、コンテナオーケストレーションが重要な研究課題として提案されている。
本稿では,既存の機械学習ベースのコンテナオーケストレーション手法について概観する。
論文 参考訳(メタデータ) (2021-06-24T02:55:35Z) - Measuring what Really Matters: Optimizing Neural Networks for TinyML [7.455546102930911]
ニューラルネットワーク(NN)は、アーキテクチャと計算の複雑さが前例のない成長を遂げた。
NNをリソース制約のあるデバイスに導入することで、コスト効率の高いデプロイメント、広範な可用性、機密データの保存が可能になる。
この作業は、ユビキタスなARM Cortex-Mアーキテクチャに焦点を当てた、機械学習をMCUに持ち込むという課題に対処する。
論文 参考訳(メタデータ) (2021-04-21T17:14:06Z) - Test and Evaluation Framework for Multi-Agent Systems of Autonomous
Intelligent Agents [0.0]
人工知能を組み込んだサイバー物理システムの複雑なアンサンブルのための統一的なテストと評価フレームワークを開発することの課題について考察する。
本稿では,開発ライフサイクルだけでなく,システムが学習し,適応するにつれて,テストと評価を実施できるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-25T21:42:27Z) - Integrated Benchmarking and Design for Reproducible and Accessible
Evaluation of Robotic Agents [61.36681529571202]
本稿では,開発とベンチマークを統合した再現性ロボット研究の新しい概念について述べる。
このセットアップの中心的なコンポーネントの1つはDuckietown Autolabであり、これは比較的低コストで再現可能な標準化されたセットアップである。
本研究では,インフラを用いて実施した実験の再現性を解析し,ロボットのハードウェアや遠隔実験室間でのばらつきが低いことを示す。
論文 参考訳(メタデータ) (2020-09-09T15:31:29Z) - How to Train Your Super-Net: An Analysis of Training Heuristics in
Weight-Sharing NAS [64.50415611717057]
我々は,スーパーネットトレーニングにおける一般的なベースラインが,スーパーネットとスタンドアローンのパフォーマンスの相関に負の影響を及ぼすことを示した。
私たちのコードと実験は、将来の作業が構築できる、強く再現可能なベースラインを設定しました。
論文 参考訳(メタデータ) (2020-03-09T17:34:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。