Fugu-MT 論文翻訳(概要): Virtualization of Tiny Embedded Systems with a robust real-time capable and extensible Stack Virtual Machine REXAVM supporting Material-integrated Intelligent Systems and Tiny Machine Learning

論文の概要: Virtualization of Tiny Embedded Systems with a robust real-time capable and extensible Stack Virtual Machine REXAVM supporting Material-integrated Intelligent Systems and Tiny Machine Learning

arxiv url: http://arxiv.org/abs/2302.09002v1
Date: Fri, 17 Feb 2023 17:13:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-20 13:57:01.935305
Title: Virtualization of Tiny Embedded Systems with a robust real-time capable and extensible Stack Virtual Machine REXAVM supporting Material-integrated Intelligent Systems and Tiny Machine Learning
Title（参考訳）: 物質統合知能システムとTiny Machine Learningをサポートする堅牢で拡張可能なStack Virtual Machine REXAVMによるTiny Embedded Systemsの仮想化
Authors: Stefan Bosse, Sarah Bornemann, Bj\"orn L\"ussem
Abstract要約: 本稿では,動作に等価なソフトウェアとハードウェア(FPGA)の実装において,提案するVMアーキテクチャの適合性を示し,評価する。全体的なアーキテクチャアプローチでは、VMは特にデジタル信号処理と小さな機械学習に対処する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the past decades, there has been a significant increase in sensor density and sensor deployment, driven by a significant miniaturization and decrease in size down to the chip level, addressing ubiquitous computing, edge computing, as well as distributed sensor networks. Material-integrated and intelligent systems (MIIS) provide the next integration and application level, but they create new challenges and introduce hard constraints (resources, energy supply, communication, resilience, and security). Commonly, low-resource systems are statically programmed processors with application-specific software or application-specific hardware (FPGA). This work demonstrates the need for and solution to virtualization in such low-resource and constrained systems towards resilient distributed sensor and cyber-physical networks using a unified low-resource, customizable, and real-time capable embedded and extensible stack virtual machine (REXAVM) that can be implemented and cooperate in both software and hardware. In a holistic architecture approach, the VM specifically addresses digital signal processing and tiny machine learning. The REXAVM is highly customizable through the use of VM program code generators at compile time and incremental code processing at run time. The VM uses an integrated, highly efficient just-in-time compiler to create Bytecode from text code. This paper shows and evaluates the suitability of the proposed VM architecture for operationally equivalent software and hardware (FPGA) implementations. Specific components supporting tiny ML and DSP using fixed-point arithmetic with respect to efficiency and accuracy are discussed. An extended use-case section demonstrates the usability of the introduced VM architecture for a broad range of applications.
Abstract（参考訳）: 過去数十年間、センサーの密度とセンサーの配置が大幅に向上し、チップレベルでの大幅な小型化とサイズの減少、ユビキタスコンピューティング、エッジコンピューティング、分散センサーネットワークへの対処が進められてきた。材料統合とインテリジェントシステム(miis)は、次の統合とアプリケーションレベルを提供するが、新たな課題を生み出し、厳しい制約(リソース、エネルギー供給、通信、レジリエンス、セキュリティ)を導入する。一般に低リソースシステムは、アプリケーション固有のソフトウェアまたはアプリケーション固有のハードウェア(fpga)を備えた静的にプログラムされたプロセッサである。この研究は、ソフトウェアとハードウェアの両方で実装および協調可能な、低リソースでカスタマイズ可能でリアルタイムに実行可能な組み込みおよび拡張可能なスタック仮想マシン(REXAVM)を使用して、レジリエントな分散センサとサイバー物理ネットワークに対する、このような低リソースおよび制約されたシステムの仮想化の必要性と解決策を実証する。全体的なアーキテクチャアプローチでは、VMは特にデジタル信号処理と小さな機械学習に対処する。 REXAVMは、コンパイル時にVMプログラムコードジェネレータを使用し、実行時にインクリメンタルコード処理によって、高度にカスタマイズできる。 vmは統合的で高効率なjust-in-timeコンパイラを使用して、テキストコードからバイトコードを生成する。本稿では,動作に等価なソフトウェアとハードウェア(FPGA)の実装に適したVMアーキテクチャを提案する。固定点演算を用いた小型MLとDSPをサポートする特定のコンポーネントについて,効率と精度について論じる。拡張されたユースケースセクションでは、幅広いアプリケーションに対して導入されたVMアーキテクチャのユーザビリティを示しています。

関連論文リスト

Tilus: A Virtual Machine for Arbitrary Low-Precision GPGPU Computation in LLM Serving [12.068287973463786]
Serving Large Language Models (LLMs) はAIを利用したアプリケーションには必須だが、かなりの計算資源を必要とする。低精度の計算が資源消費を減らしながら効率を向上する鍵となる技術として登場した。低精度カーネルを生成するための既存のアプローチは、2つのパワーを持つウェイトビット幅に限られている。
論文参考訳（メタデータ） (2025-04-17T14:45:03Z)
Pilot-Quantum: A Quantum-HPC Middleware for Resource, Workload and Task Management [1.381966718755792]
Pilot-Quantumは、ハイブリッド量子古典環境におけるリソースとワークロードの統一されたアプリケーションレベルの管理を提供するように設計されている。リソース、ワークロード、タスクを管理するために、もともとHPC用に開発されたPilot Abstraction概念モデルを実装している。
論文参考訳（メタデータ） (2024-12-24T15:55:46Z)
DeeR-VLA: Dynamic Inference of Multimodal Large Language Models for Efficient Robot Execution [114.61347672265076]
実世界のロボットのためのMLLMの開発は、ロボットプラットフォームで利用可能な計算能力とメモリ容量が典型的に限られているため、難しい。活性化MLLMのサイズを自動的に調整するロボットビジョンランゲージ・アクション・モデル(DeeR)の動的早期実行フレームワークを提案する。 DeeR は LLM の計算コストを 5.2-6.5x に削減し、GPU のメモリを 2-6x に削減した。
論文参考訳（メタデータ） (2024-11-04T18:26:08Z)
Co-design of a novel CMOS highly parallel, low-power, multi-chip neural network accelerator [0.0]
我々は,並列処理(>10X)を大幅に高速化し,消費電力を大幅に削減する新しい低消費電力ASICAIプロセッサであるNV-1を提案する。結果のデバイスは、現在、フィールド化されたエッジセンサーアプリケーションで使用されている。
論文参考訳（メタデータ） (2024-09-28T15:47:16Z)
Designing and Implementing a Generator Framework for a SIMD Abstraction Library [53.84310825081338]
SIMD抽象化ライブラリを生成するための新しいエンドツーエンドフレームワークであるTSLGenを提案する。私たちのフレームワークは既存のライブラリに匹敵するもので、同じパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-07-26T13:25:38Z)
Hybrid Oscillator-Qubit Quantum Processors: Instruction Set Architectures, Abstract Machine Models, and Applications [32.40067565226366]
CV-DVハイブリッドハードウェアは,DVプロセッサとCVプロセッサの両方の長所を継承する,強力な計算パラダイムを提供する。本稿では,様々なハイブリッドCV-DVコンパイル技術,アルゴリズム,アプリケーションについて述べる。ハイブリッドCV-DV量子計算は超伝導、閉じ込められたイオン、中性原子プラットフォームで実行され始めている。
論文参考訳（メタデータ） (2024-07-15T01:23:47Z)
Efficient and accurate neural field reconstruction using resistive memory [52.68088466453264]
デジタルコンピュータにおける従来の信号再構成手法は、ソフトウェアとハードウェアの両方の課題に直面している。本稿では,スパース入力からの信号再構成のためのソフトウェア・ハードウェア協調最適化を用いた体系的アプローチを提案する。この研究は、AI駆動の信号復元技術を進歩させ、将来の効率的で堅牢な医療AIと3Dビジョンアプリケーションへの道を開く。
論文参考訳（メタデータ） (2024-04-15T09:33:09Z)
Random resistive memory-based deep extreme point learning machine for unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文参考訳（メタデータ） (2023-12-14T09:46:16Z)
FusionAI: Decentralized Training and Deploying LLMs with Massive Consumer-Level GPUs [57.12856172329322]
我々は、巨大な未使用のコンシューマレベルのGPUをアンロックする分散システムを構想する。このシステムは、CPUとGPUメモリの制限、ネットワーク帯域幅の低さ、ピアとデバイスの多様性など、重要な課題に直面している。
論文参考訳（メタデータ） (2023-09-03T13:27:56Z)
Efficient Machine Learning, Compilers, and Optimizations for Embedded Systems [21.098443474303462]
Deep Neural Networks(DNN)は、高品質なコンピュータビジョン、自然言語処理、仮想現実アプリケーションを提供することによって、膨大な数の人工知能(AI)アプリケーションで大きな成功を収めている。これらの新興AIアプリケーションは、計算とメモリ要求の増大も伴うため、特に限られた/メモリリソース、厳格な電力予算、小さなフォームファクタが要求される組み込みシステムでは、処理が困難である。本章では,効率的なアルゴリズム,コンパイラ,組込みシステムに対するさまざまな最適化を実現するための,効率的な設計手法を紹介する。
論文参考訳（メタデータ） (2022-06-06T02:54:05Z)
Distributed On-Sensor Compute System for AR/VR Devices: A Semi-Analytical Simulation Framework for Power Estimation [2.5696683295721883]
そこで本研究では,分散オンセンサコンピューティングアーキテクチャにより,集中型システムに比べてシステム消費電力を低減できることを示す。計算集約型機械学習に基づくハンドトラッキングアルゴリズムの場合、分散オンセンサーコンピューティングアーキテクチャはシステムの消費電力を削減できることを示す。
論文参考訳（メタデータ） (2022-03-14T20:18:24Z)
FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文参考訳（メタデータ） (2022-01-18T13:59:22Z)
A Heterogeneous In-Memory Computing Cluster For Flexible End-to-End Inference of Real-World Deep Neural Networks [12.361842554233558]
最新のTinyMLタスクを小さなバッテリに制約されたIoTデバイスにデプロイするには、高い計算エネルギー効率が必要である。非揮発性メモリ(NVM)を使用したアナログメモリコンピューティング(IMC)は、ディープニューラルネットワーク(DNN)推論の大幅な効率向上を実現する。 8つのRISC-Vコア、インメモリ・コンピューティング・アクセラレータ(IMA)、デジタル・アクセラレータを統合した異種密結合アーキテクチャを提案する。
論文参考訳（メタデータ） (2022-01-04T11:12:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。