論文の概要: Compiler Toolchains for Deep Learning Workloads on Embedded Platforms
- arxiv url: http://arxiv.org/abs/2104.04576v1
- Date: Mon, 8 Mar 2021 13:54:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-08 18:05:42.694196
- Title: Compiler Toolchains for Deep Learning Workloads on Embedded Platforms
- Title(参考訳): 組み込みプラットフォーム上でのディープラーニングワークロードのためのコンパイラツールチェーン
- Authors: Max Sponner, Bernd Waschneck and Akash Kumar
- Abstract要約: フレームワーク固有のネットワーク表現を組み込みプラットフォームの実行可能なコードに変換する必要がある。
最初のセクションは、利用可能なオープンソースのディープラーニングコンパイラツールチェーンの調査とベンチマークで構成されています。
第2部では、異種デバイスに対するコンパイルフローの実装と評価について検討する。
- 参考スコア(独自算出の注目度): 2.5744053804694893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the usage of deep learning becomes increasingly popular in mobile and
embedded solutions, it is necessary to convert the framework-specific network
representations into executable code for these embedded platforms. This paper
consists of two parts: The first section is made up of a survey and benchmark
of the available open source deep learning compiler toolchains, which focus on
the capabilities and performance of the individual solutions in regard to
targeting embedded devices and microcontrollers that are combined with a
dedicated accelerator in a heterogeneous fashion. The second part explores the
implementation and evaluation of a compilation flow for such a heterogeneous
device and reuses one of the existing toolchains to demonstrate the necessary
steps for hardware developers that plan to build a software flow for their own
hardware.
- Abstract(参考訳): モバイルおよび組み込みソリューションでディープラーニングが普及するにつれ、フレームワーク固有のネットワーク表現をこれらの組み込みプラットフォーム用の実行可能なコードに変換する必要がある。
第1部は、利用可能なオープンソースのディープラーニングコンパイラツールチェーンのサーベイとベンチマークで構成され、組み込みデバイスやマイクロコントローラをターゲットにした、異種な方法で専用のアクセラレータと組み合わせた個々のソリューションの能力と性能に焦点を当てている。
第2部では、異種デバイス用のコンパイルフローの実装と評価について検討し、既存のツールチェーンの1つを再利用して、独自のハードウェア用のソフトウェアフローを構築する予定のハードウェア開発者にとって必要なステップを示す。
関連論文リスト
- Benchmarking Predictive Coding Networks -- Made Simple [48.652114040426625]
まず,性能と簡易性を重視したPCXというライブラリを提案する。
私たちはPCXを使って、コミュニティが実験に使用する大規模なベンチマークを実装しています。
論文 参考訳(メタデータ) (2024-07-01T10:33:44Z) - ResyDuo: Combining data models and CF-based recommender systems to
develop Arduino projects [4.844354192596123]
本稿では,Arduino開発者を支援するために,ResyDuoというプロトタイプを提案する。
ResyDuoは,ProjectHubリポジトリに格納されているタグや既存のArduinoプロジェクトを使用して,ハードウェアコンポーネントを検索する。
システムは最終的に、識別されたハードウェアデバイスに基づいて対応するソフトウェアライブラリを検索することができる。
論文 参考訳(メタデータ) (2023-08-26T08:21:31Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文 参考訳(メタデータ) (2023-03-18T11:26:36Z) - Flashlight: Enabling Innovation in Tools for Machine Learning [50.63188263773778]
私たちは、機械学習ツールやシステムの革新を促進するために構築されたオープンソースのライブラリであるFlashlightを紹介します。
Flashlightは、広く使われているライブラリを下流で活用し、機械学習とシステム研究者をより緊密に連携させる研究を可能にするツールだと考えています。
論文 参考訳(メタデータ) (2022-01-29T01:03:29Z) - On Joint Learning for Solving Placement and Routing in Chip Design [70.30640973026415]
本稿では,マクロや標準セルの配置に関するDeepPlaceによる共同学習手法を提案する。
また,DeepPRと呼ばれるマクロ配置とルーティングの両方を満たすための強化学習による共同学習手法も開発している。
本手法は,経験から効果的に学習し,数時間のトレーニングで標準細胞配置の中間配置を提供する。
論文 参考訳(メタデータ) (2021-10-30T11:41:49Z) - Bring Your Own Codegen to Deep Learning Compiler [8.87545486816377]
本稿では,独自のコード生成ツールの開発にのみ集中できるオープンソースフレームワークを提案する。
当社のフレームワークは、柔軟で使いやすいインターフェースをユーザーに提供し、モデルを「最高の」プロセッサで実行できるセグメントに分割します。
論文 参考訳(メタデータ) (2021-05-03T17:22:25Z) - MLIR: A Compiler Infrastructure for the End of Moore's Law [14.795080852112083]
MLIRは、ソフトウェアの断片化に対処し、異種ハードウェアのコンパイルを改善し、ドメイン固有のコンパイラを構築するコストを大幅に削減することを目的としている。
MLIRはコードジェネレータ、トランスレータ、トランスレータを様々な抽象化レベルで設計し実装する。
論文 参考訳(メタデータ) (2020-02-25T17:24:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。