論文の概要: Improved vectorization of OpenCV algorithms for RISC-V CPUs
- arxiv url: http://arxiv.org/abs/2311.12808v1
- Date: Tue, 19 Sep 2023 12:36:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 15:46:58.229672
- Title: Improved vectorization of OpenCV algorithms for RISC-V CPUs
- Title(参考訳): risc-v cpu用opencvアルゴリズムのベクトル化改善
- Authors: V. D. Volokitin, E. P. Vasiliev, E. A. Kozinov, V. D. Kustikova, A. V.
Liniov, Y. A. Rodimkov, A. V. Sysoyev, and I. B. Meyerov
- Abstract要約: 利用可能なRISC-Vプロセッサ上で計算を高速化する可能性について論じる。
ベクター化の改善により、RISC-Vデバイスの既存のプロトタイプの計算速度が数千パーセント向上することが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of an open and free RISC-V architecture is of great interest
for a wide range of areas, including high-performance computing and numerical
simulation in mathematics, physics, chemistry and other problem domains. In
this paper, we discuss the possibilities of accelerating computations on
available RISC-V processors by improving the vectorization of several computer
vision and machine learning algorithms in the widely used OpenCV library. It is
shown that improved vectorization speeds up computations on existing prototypes
of RISC-V devices by tens of percent.
- Abstract(参考訳): オープンで自由なRISC-Vアーキテクチャの開発は、数学、物理学、化学、その他の問題領域における高性能計算や数値シミュレーションなど、幅広い分野において大きな関心を集めている。
本稿では、利用可能なRISC-Vプロセッサ上での計算を高速化する可能性について、広く使われているOpenCVライブラリにおいて、コンピュータビジョンと機械学習アルゴリズムのベクトル化を改善することで論じる。
ベクター化の改善により、RISC-Vデバイスの既存のプロトタイプの計算速度が数千パーセント向上することが示されている。
関連論文リスト
- Accelerating AI and Computer Vision for Satellite Pose Estimation on the Intel Myriad X Embedded SoC [3.829322478948514]
本稿では,インテルのMovidius Myriad Xを用いたハイブリッドAI/CVシステムを構築し,衛星の宇宙ミッションにおける姿勢を初期化・追跡する。
提案したシングルチップ,ロバスト推定,リアルタイムソリューションは,2Wの限られたパワーエンベロープ内で,1メガピクセルのRGB画像に対して最大5FPSのスループットを提供する。
論文 参考訳(メタデータ) (2024-09-19T17:50:50Z) - RISC-V RVV efficiency for ANN algorithms [0.5892638927736115]
本研究では、一般的なANNアルゴリズムにRVVを適用することの有効性について検討する。
アルゴリズムはRISC-Vに適応し、主要なボトルネックを特定した後、RVVを使用して最適化された。
論文 参考訳(メタデータ) (2024-07-18T09:26:07Z) - Full-stack evaluation of Machine Learning inference workloads for RISC-V systems [0.2621434923709917]
本研究は,オープンソースのアーキテクチャシミュレータであるgem5を用いて,RISC-Vアーキテクチャ上での機械学習ワークロードの性能を評価する。
MLIR(Multi-Level Intermediate Representation)に基づいたオープンソースのコンパイルツールチェーンを活用することで、ディープラーニング推論ワークロードに特化したベンチマーク結果が提示される。
論文 参考訳(メタデータ) (2024-05-24T09:24:46Z) - Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like
Architectures [99.20299078655376]
本稿では、NLPフィールドで使用されるRWKVモデルから適応したVision-RWKVを紹介する。
我々のモデルは、スパース入力を効率的に処理し、ロバストなグローバル処理能力を実証するために設計されている。
評価の結果,VRWKVは画像分類におけるViTの性能を超え,高速化とメモリ使用量の削減を図っている。
論文 参考訳(メタデータ) (2024-03-04T18:46:20Z) - Support Vector Machine Implementation on MPI-CUDA and Tensorflow
Framework [0.0]
Support Vector Machine (SVM)アルゴリズムは、複雑な二次プログラミング(QP)最適化問題を解決するために高い計算コストを必要とする。
並列マルチアーキテクチャは、マルチコアCPUと高度にスケーラブルなGPUの両方で利用できる。
本稿では,異なる並列アーキテクチャフレームワーク上でSVMアルゴリズムを実装した比較研究を行う。
論文 参考訳(メタデータ) (2023-11-25T02:52:37Z) - Randomized Polar Codes for Anytime Distributed Machine Learning [66.46612460837147]
本稿では,低速な計算ノードに対して堅牢で,線形演算の近似計算と精度の両立が可能な分散コンピューティングフレームワークを提案する。
本稿では,復号化のための計算複雑性を低く保ちながら,実数値データを扱うための逐次復号アルゴリズムを提案する。
大規模行列乗算やブラックボックス最適化など,様々な文脈において,このフレームワークの潜在的な応用を実証する。
論文 参考訳(メタデータ) (2023-09-01T18:02:04Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。
本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文 参考訳(メタデータ) (2022-07-09T09:14:12Z) - Collaborative Learning over Wireless Networks: An Introductory Overview [84.09366153693361]
主に、ワイヤレスデバイス間の協調トレーニングに焦点を合わせます。
過去数十年間、多くの分散最適化アルゴリズムが開発されてきた。
データ局所性 – すなわち、各参加デバイスで利用可能なデータがローカルのままである間、共同モデルを協調的にトレーニングすることができる。
論文 参考訳(メタデータ) (2021-12-07T20:15:39Z) - Vector Symbolic Architectures as a Computing Framework for Emerging
Hardware [8.28931204639352]
本稿では,ベクトル記号アーキテクチャ(VSA)の最近の進歩を概観する。
我々は、VSAが高次元ベクトルに対して単純だが強力な操作を提供し、現代のコンピューティングに関連するすべてのデータ構造と操作をサポートすることを実証した。
この記事では、VSAの背景にある哲学、それらと分散コンピューティングの技法、そしてそれらが新興のコンピューティングハードウェアと関連していることを説明することで、コンピュータアーキテクトへの参照として機能する。
論文 参考訳(メタデータ) (2021-06-09T23:38:39Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。