Fugu-MT 論文翻訳(概要): Compiler Toolchains for Deep Learning Workloads on Embedded Platforms

論文の概要: Compiler Toolchains for Deep Learning Workloads on Embedded Platforms

arxiv url: http://arxiv.org/abs/2104.04576v1
Date: Mon, 8 Mar 2021 13:54:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-08 18:05:42.694196
Title: Compiler Toolchains for Deep Learning Workloads on Embedded Platforms
Title（参考訳）: 組み込みプラットフォーム上でのディープラーニングワークロードのためのコンパイラツールチェーン
Authors: Max Sponner, Bernd Waschneck and Akash Kumar
Abstract要約: フレームワーク固有のネットワーク表現を組み込みプラットフォームの実行可能なコードに変換する必要がある。最初のセクションは、利用可能なオープンソースのディープラーニングコンパイラツールチェーンの調査とベンチマークで構成されています。第2部では、異種デバイスに対するコンパイルフローの実装と評価について検討する。
参考スコア（独自算出の注目度）: 2.5744053804694893
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As the usage of deep learning becomes increasingly popular in mobile and embedded solutions, it is necessary to convert the framework-specific network representations into executable code for these embedded platforms. This paper consists of two parts: The first section is made up of a survey and benchmark of the available open source deep learning compiler toolchains, which focus on the capabilities and performance of the individual solutions in regard to targeting embedded devices and microcontrollers that are combined with a dedicated accelerator in a heterogeneous fashion. The second part explores the implementation and evaluation of a compilation flow for such a heterogeneous device and reuses one of the existing toolchains to demonstrate the necessary steps for hardware developers that plan to build a software flow for their own hardware.
Abstract（参考訳）: モバイルおよび組み込みソリューションでディープラーニングが普及するにつれ、フレームワーク固有のネットワーク表現をこれらの組み込みプラットフォーム用の実行可能なコードに変換する必要がある。第1部は、利用可能なオープンソースのディープラーニングコンパイラツールチェーンのサーベイとベンチマークで構成され、組み込みデバイスやマイクロコントローラをターゲットにした、異種な方法で専用のアクセラレータと組み合わせた個々のソリューションの能力と性能に焦点を当てている。第2部では、異種デバイス用のコンパイルフローの実装と評価について検討し、既存のツールチェーンの1つを再利用して、独自のハードウェア用のソフトウェアフローを構築する予定のハードウェア開発者にとって必要なステップを示す。

関連論文リスト

KForge: Program Synthesis for Diverse AI Hardware Accelerators [5.967639357025406]
KForgeは2つの協調LDMエージェント上に構築されたプラットフォームに依存しないフレームワークである。生成エージェントは、コンパイルと正当性フィードバックによりプログラムを反復的に生成・洗練し、パフォーマンス分析エージェントは、プロファイリングデータを解釈して最適化を誘導する。このエージェントベースのアーキテクチャは、新しいプラットフォームをターゲットにしたシングルショットの例のみを必要とする。
論文参考訳（メタデータ） (2025-11-17T11:46:43Z)
Library Liberation: Competitive Performance Matmul Through Compiler-composed Nanokernels [37.00431889602245]
本稿では,スケーラブルで高性能なマイクロカーネルを自動生成するコンパイル方式を提案する。本手法は,ベクトルおよびタイルベースのCPU命令をサポートするMLIRベースのコンパイラで実装する。実験の結果、生成したナノカーネルは生産品質が高く、最先端のマイクロカーネルライブラリと競合することがわかった。
論文参考訳（メタデータ） (2025-11-14T14:32:28Z)
MOBIUS: Big-to-Mobile Universal Instance Segmentation via Multi-modal Bottleneck Fusion and Calibrated Decoder Pruning [91.90342432541138]
モデルサイズとトレーニングデータのスケールアップには、インスタンスレベルの知覚のための高度な基盤モデルがある。資源制約されたプラットフォームにおける高い計算コスト制限。我々は,高性能コンピューティングプラットフォームとモバイルデバイスの両方において,効率的なセグメンテーションのための新しいベンチマークを導入する。
論文参考訳（メタデータ） (2025-10-16T18:00:00Z)
A High-Level Compiler Integration Approach for Deep Learning Accelerators Supporting Abstraction and Optimization [1.2828127925625228]
本稿では,GEMMに基づくディープラーニングアクセラレータを対象とするTVMベースのコンパイル統合手法を提案する。我々のアプローチは、コンパイラ統合の複雑さを抽象化し、アクセラレータのシームレスな統合を可能にします。我々のフレームワークはGemminiアクセラレータでベンチマークされており、手動で実装されたツールチェーンに匹敵するパフォーマンスを示している。
論文参考訳（メタデータ） (2025-07-07T09:50:15Z)
Benchmarking Predictive Coding Networks -- Made Simple [48.652114040426625]
まず,性能と簡易性を重視したPCXというライブラリを提案する。私たちはPCXを使って、コミュニティが実験に使用する大規模なベンチマークを実装しています。
論文参考訳（メタデータ） (2024-07-01T10:33:44Z)
ResyDuo: Combining data models and CF-based recommender systems to develop Arduino projects [4.844354192596123]
本稿では,Arduino開発者を支援するために,ResyDuoというプロトタイプを提案する。 ResyDuoは,ProjectHubリポジトリに格納されているタグや既存のArduinoプロジェクトを使用して,ハードウェアコンポーネントを検索する。システムは最終的に、識別されたハードウェアデバイスに基づいて対応するソフトウェアライブラリを検索することができる。
論文参考訳（メタデータ） (2023-08-26T08:21:31Z)
CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。 CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文参考訳（メタデータ） (2023-05-31T05:24:48Z)
Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。 1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文参考訳（メタデータ） (2023-04-25T05:04:44Z)
Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文参考訳（メタデータ） (2023-03-18T11:26:36Z)
Towards Cooperative Federated Learning over Heterogeneous Edge/Fog Networks [49.19502459827366]
フェデレートラーニング(FL)は、エッジ/フォグネットワーク上で機械学習(ML)モデルをトレーニングするための一般的なテクニックとして推奨されている。 FLの従来の実装は、ネットワーク間協力の可能性を大きく無視してきた。我々は,デバイス・ツー・デバイス(D2D)とデバイス・ツー・サーバ(D2S)インタラクションに基づいて構築された協調的エッジ/フォグMLパラダイムである協調的連合学習(CFL)を提唱する。
論文参考訳（メタデータ） (2023-03-15T04:41:36Z)
Flashlight: Enabling Innovation in Tools for Machine Learning [50.63188263773778]
私たちは、機械学習ツールやシステムの革新を促進するために構築されたオープンソースのライブラリであるFlashlightを紹介します。 Flashlightは、広く使われているライブラリを下流で活用し、機械学習とシステム研究者をより緊密に連携させる研究を可能にするツールだと考えています。
論文参考訳（メタデータ） (2022-01-29T01:03:29Z)
On Joint Learning for Solving Placement and Routing in Chip Design [70.30640973026415]
本稿では,マクロや標準セルの配置に関するDeepPlaceによる共同学習手法を提案する。また,DeepPRと呼ばれるマクロ配置とルーティングの両方を満たすための強化学習による共同学習手法も開発している。本手法は,経験から効果的に学習し,数時間のトレーニングで標準細胞配置の中間配置を提供する。
論文参考訳（メタデータ） (2021-10-30T11:41:49Z)
Bring Your Own Codegen to Deep Learning Compiler [8.87545486816377]
本稿では,独自のコード生成ツールの開発にのみ集中できるオープンソースフレームワークを提案する。当社のフレームワークは、柔軟で使いやすいインターフェースをユーザーに提供し、モデルを「最高の」プロセッサで実行できるセグメントに分割します。
論文参考訳（メタデータ） (2021-05-03T17:22:25Z)
MLIR: A Compiler Infrastructure for the End of Moore's Law [14.795080852112083]
MLIRは、ソフトウェアの断片化に対処し、異種ハードウェアのコンパイルを改善し、ドメイン固有のコンパイラを構築するコストを大幅に削減することを目的としている。 MLIRはコードジェネレータ、トランスレータ、トランスレータを様々な抽象化レベルで設計し実装する。
論文参考訳（メタデータ） (2020-02-25T17:24:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。