論文の概要: ImageHD: Energy-Efficient On-Device Continual Learning of Visual Representations via Hyperdimensional Computing
- arxiv url: http://arxiv.org/abs/2604.21280v1
- Date: Thu, 23 Apr 2026 04:55:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.309244
- Title: ImageHD: Energy-Efficient On-Device Continual Learning of Visual Representations via Hyperdimensional Computing
- Title(参考訳): ImageHD:超次元計算による視覚表現のエネルギー効率のよいオンデバイス連続学習
- Authors: Jebacyril Arockiaraj, Dhruv Parikh, Viktor Prasanna,
- Abstract要約: ImageHDは、HDCに基づいたビジュアルデータのデバイス上での連続学習のためのFPGAアクセラレータである。
CORe50では、ImageHDは最大40.4x (4.84x)のスピードアップと383x (105.1x)のエネルギー効率を最適化CPU(GPU)ベースライン上で達成している。
- 参考スコア(独自算出の注目度): 0.07646713951724012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: On-device continual learning (CL) is critical for edge AI systems operating on non-stationary data streams, but most existing methods rely on backpropagation or exemplar-heavy classifiers, incurring substantial compute, memory, and latency overheads. Hyperdimensional computing (HDC) offers a lightweight alternative through fast, non-iterative online updates. Combined with a compact convolutional neural network (CNN) feature extractor, HDC enables efficient on-device adaptation with strong visual representations. However, prior HDC-based CL systems often depend on multi-tier memory hierarchies and complex cluster management, limiting deployability on resource-constrained hardware. We present ImageHD, an FPGA accelerator for on-device continual learning of visual data based on HDC. ImageHD targets streaming CL under strict latency and on-chip memory constraints, avoiding costly iterative optimization. At the algorithmic level, we introduce a hardware-aware CL method that bounds class exemplars through a unified exemplar memory and a hardware-efficient cluster merging strategy, while incorporating a quantized CNN front-end to reduce deployment overhead without sacrificing accuracy. At the system level, ImageHD is implemented as a streaming dataflow architecture on the AMD Zynq ZCU104 FPGA, integrating HDC encoding, similarity search, and bounded cluster management using word-packed binary hypervectors for massively parallel bitwise computation within tight on-chip resource budgets. On CORe50, ImageHD achieves up to 40.4x (4.84x) speedup and 383x (105.1x) energy efficiency over optimized CPU (GPU) baselines, demonstrating the practicality of HDC-enabled continual learning for real-time edge AI.
- Abstract(参考訳): デバイス上での連続学習(CL)は、非定常データストリームで動作するエッジAIシステムにとって重要であるが、既存のほとんどの手法はバックプロパゲーションや典型的な分類器に依存しており、相当な計算、メモリ、レイテンシのオーバーヘッドが発生する。
超次元コンピューティング(HDC)は、高速で非定型的なオンライン更新を通じて軽量な代替手段を提供する。
コンパクト畳み込みニューラルネットワーク(CNN)特徴抽出器と組み合わせることで、HDCは強力な視覚表現を備えたデバイス上での効率的な適応を可能にする。
しかし、従来のHDCベースのCLシステムは多層メモリ階層と複雑なクラスタ管理に依存しており、リソース制約のあるハードウェアへのデプロイを制限している。
本稿では,HDCに基づく画像データのデバイス上で連続学習を行うFPGAアクセラレータであるImageHDを紹介する。
ImageHDは、厳格なレイテンシとオンチップメモリ制約下でのストリーミングCLをターゲットにしており、コストのかかる反復的な最適化を避けている。
アルゴリズムレベルでは,一貫したメモリとハードウェア効率のクラスタマージ戦略を通じて,クラスをバウンドするハードウェア対応CL手法を導入するとともに,量子化されたCNNフロントエンドを組み込むことにより,精度を犠牲にすることなく,デプロイメントオーバーヘッドを低減する。
システムレベルでは、ImageHDはAMD Zynq ZCU104 FPGA上のストリーミングデータフローアーキテクチャとして実装され、HDCエンコーディング、類似性検索、境界クラスタ管理を統合する。
CORe50では、ImageHDは最大40.4x (4.84x)のスピードアップと383x (105.1x)のエネルギー効率を最適化CPU(GPU)ベースライン上で達成し、リアルタイムエッジAIのためのHDC対応連続学習の実践性を実証している。
関連論文リスト
- cuNNQS-SCI: A Fully GPU-Accelerated Framework for High-Performance Configuration Interaction Selection with Neural Network Quantum States [12.436495225801863]
cuNNQS-SCIは、これらのボトルネックを克服するために設計された、完全にGPUアクセラレーションされたSCIフレームワークである。
64GPUのNVIDIA A100クラスタでは、cuNNQS-SCIは最大2.32倍のエンドツーエンドのスピードアップを達成する。
優れた分散パフォーマンスを示し、強力なスケーリングテストで90%以上の並列効率を維持する。
論文 参考訳(メタデータ) (2026-04-17T07:15:18Z) - Resource-Efficient Iterative LLM-Based NAS with Feedback Memory [49.44875022114861]
ニューラルアーキテクチャサーチ(NAS)はネットワーク設計を自動化するが、従来の手法ではかなりの計算資源を必要とする。
本稿では,大規模言語モデル(LLM)を活用して,畳み込みニューラルネットワークアーキテクチャを反復的に生成し,評価し,洗練するクローズドループパイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-12T16:00:22Z) - Primitive-Driven Acceleration of Hyperdimensional Computing for Real-Time Image Classification [0.07646713951724012]
局所的な画像パッチを空間情報に富んだハイパーベクターにマッピングする画像符号化アルゴリズムを開発した。
これらのパッチレベルのハイパーベクターは、基本HDC演算を用いてグローバル表現にマージされる。
このエンコーダは、MNISTで95.67%、Fashion-MNISTで85.14%の精度を達成し、HDCベースの画像エンコーダよりも優れていた。
論文 参考訳(メタデータ) (2026-01-27T21:12:56Z) - Fast SAM2 with Text-Driven Token Pruning [52.8350457627401]
Segment Anything Model 2 (SAM2) では、視覚計算モデルがプロンプト駆動のビデオオブジェクトセグメンテーションにおいて大幅に進歩している。
SAM2パイプラインは、イメージエンコーダが生成するすべての視覚トークンを、ターゲットオブジェクトとの関係にかかわらず、下流の時間的推論モジュールを通じて伝達する。
本稿では,時間的伝播に先立ってトークン密度を選択的に低減し,推論効率を向上させるためのテキスト誘導型トークンプルーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-24T18:59:05Z) - ScalableHD: Scalable and High-Throughput Hyperdimensional Computing Inference on Multi-Core CPUs [0.0]
ハイパーベクター(HV)という,高次元ベクトルを用いた情報表現と操作
従来のHDC法はシングルパスの非パラメトリックトレーニングに依存しており、しばしば低い精度で悩まされる。
しかし、推論は軽量であり、リアルタイム実行に適している。
論文 参考訳(メタデータ) (2025-06-10T22:46:12Z) - QuantCache: Adaptive Importance-Guided Quantization with Hierarchical Latent and Layer Caching for Video Generation [84.91431271257437]
Diffusion Transformers (DiTs) はビデオ生成において支配的なアーキテクチャとして登場した。
DiTには、計算コストやメモリコストの増大など、大きな欠点がある。
我々は,新しいトレーニングフリー推論アクセラレーションフレームワークQuantCacheを提案する。
論文 参考訳(メタデータ) (2025-03-09T10:31:51Z) - Hyperdimensional Computing Empowered Federated Foundation Model over Wireless Networks for Metaverse [56.384390765357004]
本稿では,新しい基礎モデルのための統合型分割学習と超次元計算フレームワークを提案する。
この新しいアプローチは通信コスト、計算負荷、プライバシーリスクを低減し、Metaverseのリソース制約されたエッジデバイスに適している。
論文 参考訳(メタデータ) (2024-08-26T17:03:14Z) - Efficient and accurate neural field reconstruction using resistive memory [52.68088466453264]
デジタルコンピュータにおける従来の信号再構成手法は、ソフトウェアとハードウェアの両方の課題に直面している。
本稿では,スパース入力からの信号再構成のためのソフトウェア・ハードウェア協調最適化を用いた体系的アプローチを提案する。
この研究は、AI駆動の信号復元技術を進歩させ、将来の効率的で堅牢な医療AIと3Dビジョンアプリケーションへの道を開く。
論文 参考訳(メタデータ) (2024-04-15T09:33:09Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - SHEARer: Highly-Efficient Hyperdimensional Computing by
Software-Hardware Enabled Multifold Approximation [7.528764144503429]
我々は,HDコンピューティングの性能とエネルギー消費を改善するアルゴリズム-ハードウェア協調最適化であるSHEARerを提案する。
SHEARerは104,904x (15.7x)のスループット向上と56,044x (301x)の省エネを実現している。
また,提案した近似符号化をエミュレートすることで,HDモデルのトレーニングを可能にするソフトウェアフレームワークを開発した。
論文 参考訳(メタデータ) (2020-07-20T07:58:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。