論文の概要: Leveraging Transprecision Computing for Machine Vision Applications at
the Edge
- arxiv url: http://arxiv.org/abs/2108.12914v1
- Date: Sun, 29 Aug 2021 20:51:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:21:50.372399
- Title: Leveraging Transprecision Computing for Machine Vision Applications at
the Edge
- Title(参考訳): エッジにおけるマシンビジョンアプリケーションのための翻訳コンピューティングの活用
- Authors: Umar Ibrahim Minhas, Lev Mukhanov, Georgios Karakonstantis, Hans
Vandierendonck and Roger Woods
- Abstract要約: 本稿では、実行時のワークロードの制約を監視し、精度-スループットトレードオフを利用する軽量なアプローチを提案する。
1%の精度低下では、1.6倍のフレーム処理率を示し、より低い精度でさらなる改善が可能となる。
- 参考スコア(独自算出の注目度): 1.5267236995686557
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine vision tasks present challenges for resource constrained edge
devices, particularly as they execute multiple tasks with variable workloads. A
robust approach that can dynamically adapt in runtime while maintaining the
maximum quality of service (QoS) within resource constraints, is needed. The
paper presents a lightweight approach that monitors the runtime workload
constraint and leverages accuracy-throughput trade-off. Optimisation techniques
are included which find the configurations for each task for optimal accuracy,
energy and memory and manages transparent switching between configurations. For
an accuracy drop of 1%, we show a 1.6x higher achieved frame processing rate
with further improvements possible at lower accuracy.
- Abstract(参考訳): マシンビジョンタスクは、リソース制約のあるエッジデバイス、特に可変ワークロードで複数のタスクを実行する場合の課題を示す。
リソース制約内でサービス(QoS)の最大品質を維持しながら、実行時に動的に適応できる堅牢なアプローチが必要である。
本稿では,実行時のワークロード制約を監視し,精度とスループットのトレードオフを活用する軽量なアプローチを提案する。
最適化技術は、各タスクの構成を最適精度、エネルギー、メモリで見つけ、構成間の透過的な切り替えを管理する。
1%の精度低下では、1.6倍のフレーム処理率を示し、より低い精度でさらなる改善が可能となる。
関連論文リスト
- TReX- Reusing Vision Transformer's Attention for Efficient Xbar-based Computing [12.583079680322156]
本稿では,注目度に基づくViT最適化フレームワークであるTReXを提案する。
We found that TReX achieves 2.3x (2.19x) EDAP reduction and 1.86x (1.79x) TOPS/mm2 improve with 1% accuracy drop in case of DeiT-S (LV-ViT-S) ViT models。
CoLAのようなNLPタスクでは、TReXは、基準線が1.6倍低いEDAPよりも2%高い非理想的精度をもたらす。
論文 参考訳(メタデータ) (2024-08-22T21:51:38Z) - Neural Horizon Model Predictive Control -- Increasing Computational Efficiency with Neural Networks [0.0]
予測制御をモデル化するための機械学習支援手法を提案する。
安全保証を維持しつつ,問題地平線の一部を近似することを提案する。
提案手法は,迅速な制御応答を必要とするアプリケーションを含む,幅広いアプリケーションに適用可能である。
論文 参考訳(メタデータ) (2024-08-19T08:13:37Z) - On the fly Deep Neural Network Optimization Control for Low-Power
Computer Vision [0.0]
最先端のコンピュータビジョン技術は、リソース制約のあるエッジデバイスにデプロイするには電力不足の大規模なディープニューラルネットワーク(DNN)に依存している。
本稿では,DNNが再学習を必要とせずに,実行時の精度とエネルギー消費に適応できる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-09-04T21:26:26Z) - Efficient Controllable Multi-Task Architectures [85.76598445904374]
本稿では,共有エンコーダとタスク固有デコーダからなるマルチタスクモデルを提案する。
我々のキーとなる考え方は、タスク固有のデコーダの容量を変化させ、計算コストの総和を制御し、タスクの重要度を制御することである。
これにより、与えられた予算に対してより強力なエンコーダを許可し、計算コストの制御を高め、高品質のスリム化サブアーキテクチャを提供することにより、全体的な精度を向上させる。
論文 参考訳(メタデータ) (2023-08-22T19:09:56Z) - Light-Weight Vision Transformer with Parallel Local and Global
Self-Attention [11.255962936937744]
Vision Transformer PLG-ViTを、よりコンパクトで効率的なものに再設計しました。
ImageNet-1K 分類ベンチマークで 79.5$%$ top-1 の精度を達成した。
我々のネットワークは、一般的なビジョンベンチマークで優れた性能を示している。
論文 参考訳(メタデータ) (2023-07-18T10:07:06Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - Controllable Dynamic Multi-Task Architectures [92.74372912009127]
本稿では,そのアーキテクチャと重みを動的に調整し,所望のタスク選択とリソース制約に適合させる制御可能なマルチタスクネットワークを提案する。
本稿では,タスク親和性と分岐正規化損失を利用した2つのハイパーネットの非交互トレーニングを提案し,入力の嗜好を取り入れ,適応重み付き木構造モデルを予測する。
論文 参考訳(メタデータ) (2022-03-28T17:56:40Z) - AdaViT: Adaptive Vision Transformers for Efficient Image Recognition [78.07924262215181]
AdaViTは、パッチ、セルフアテンションヘッド、およびトランスフォーマーブロックを使用するための利用ポリシーを導出する適応フレームワークである。
本手法は,0.8%の精度で,最先端のビジョントランスに比べて2倍以上の効率向上を実現している。
論文 参考訳(メタデータ) (2021-11-30T18:57:02Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Fully Quantized Image Super-Resolution Networks [81.75002888152159]
効率と精度を両立させるためのフル量子化画像超解像フレームワーク(FQSR)を提案する。
我々は、SRResNet、SRGAN、EDSRを含む複数の主流超解像アーキテクチャに量子化スキームを適用した。
低ビット量子化を用いたFQSRは、5つのベンチマークデータセットの完全精度と比較すると、パー性能で実現できる。
論文 参考訳(メタデータ) (2020-11-29T03:53:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。