論文の概要: Improved vectorization of OpenCV algorithms for RISC-V CPUs
- arxiv url: http://arxiv.org/abs/2311.12808v1
- Date: Tue, 19 Sep 2023 12:36:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 15:46:58.229672
- Title: Improved vectorization of OpenCV algorithms for RISC-V CPUs
- Title(参考訳): risc-v cpu用opencvアルゴリズムのベクトル化改善
- Authors: V. D. Volokitin, E. P. Vasiliev, E. A. Kozinov, V. D. Kustikova, A. V.
Liniov, Y. A. Rodimkov, A. V. Sysoyev, and I. B. Meyerov
- Abstract要約: 利用可能なRISC-Vプロセッサ上で計算を高速化する可能性について論じる。
ベクター化の改善により、RISC-Vデバイスの既存のプロトタイプの計算速度が数千パーセント向上することが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of an open and free RISC-V architecture is of great interest
for a wide range of areas, including high-performance computing and numerical
simulation in mathematics, physics, chemistry and other problem domains. In
this paper, we discuss the possibilities of accelerating computations on
available RISC-V processors by improving the vectorization of several computer
vision and machine learning algorithms in the widely used OpenCV library. It is
shown that improved vectorization speeds up computations on existing prototypes
of RISC-V devices by tens of percent.
- Abstract(参考訳): オープンで自由なRISC-Vアーキテクチャの開発は、数学、物理学、化学、その他の問題領域における高性能計算や数値シミュレーションなど、幅広い分野において大きな関心を集めている。
本稿では、利用可能なRISC-Vプロセッサ上での計算を高速化する可能性について、広く使われているOpenCVライブラリにおいて、コンピュータビジョンと機械学習アルゴリズムのベクトル化を改善することで論じる。
ベクター化の改善により、RISC-Vデバイスの既存のプロトタイプの計算速度が数千パーセント向上することが示されている。
関連論文リスト
- Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like
Architectures [99.20299078655376]
本稿では、NLPフィールドで使用されるRWKVモデルから適応したVision-RWKVを紹介する。
我々のモデルは、スパース入力を効率的に処理し、ロバストなグローバル処理能力を実証するために設計されている。
評価の結果,VRWKVは画像分類におけるViTの性能を超え,高速化とメモリ使用量の削減を図っている。
論文 参考訳(メタデータ) (2024-03-04T18:46:20Z) - Support Vector Machine Implementation on MPI-CUDA and Tensorflow
Framework [0.0]
Support Vector Machine (SVM)アルゴリズムは、複雑な二次プログラミング(QP)最適化問題を解決するために高い計算コストを必要とする。
並列マルチアーキテクチャは、マルチコアCPUと高度にスケーラブルなGPUの両方で利用できる。
本稿では,異なる並列アーキテクチャフレームワーク上でSVMアルゴリズムを実装した比較研究を行う。
論文 参考訳(メタデータ) (2023-11-25T02:52:37Z) - Randomized Polar Codes for Anytime Distributed Machine Learning [66.46612460837147]
本稿では,低速な計算ノードに対して堅牢で,線形演算の近似計算と精度の両立が可能な分散コンピューティングフレームワークを提案する。
本稿では,復号化のための計算複雑性を低く保ちながら,実数値データを扱うための逐次復号アルゴリズムを提案する。
大規模行列乗算やブラックボックス最適化など,様々な文脈において,このフレームワークの潜在的な応用を実証する。
論文 参考訳(メタデータ) (2023-09-01T18:02:04Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。
本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文 参考訳(メタデータ) (2022-07-09T09:14:12Z) - Distributed On-Sensor Compute System for AR/VR Devices: A
Semi-Analytical Simulation Framework for Power Estimation [2.5696683295721883]
そこで本研究では,分散オンセンサコンピューティングアーキテクチャにより,集中型システムに比べてシステム消費電力を低減できることを示す。
計算集約型機械学習に基づくハンドトラッキングアルゴリズムの場合、分散オンセンサーコンピューティングアーキテクチャはシステムの消費電力を削減できることを示す。
論文 参考訳(メタデータ) (2022-03-14T20:18:24Z) - Collaborative Learning over Wireless Networks: An Introductory Overview [84.09366153693361]
主に、ワイヤレスデバイス間の協調トレーニングに焦点を合わせます。
過去数十年間、多くの分散最適化アルゴリズムが開発されてきた。
データ局所性 – すなわち、各参加デバイスで利用可能なデータがローカルのままである間、共同モデルを協調的にトレーニングすることができる。
論文 参考訳(メタデータ) (2021-12-07T20:15:39Z) - Efficient GPU implementation of randomized SVD and its applications [17.71779625877989]
行列分解は、次元データの圧縮やディープラーニングアルゴリズムなど、機械学習においてユビキタスである。
行列分解の典型的な解は、計算コストと時間を大幅に増大させる複雑さを持つ。
我々は,計算行列分解の計算負担を軽減するために,現代のグラフィカル処理ユニット(GPU)で並列に動作する効率的な処理操作を利用する。
論文 参考訳(メタデータ) (2021-10-05T07:42:41Z) - Vector Symbolic Architectures as a Computing Framework for Emerging
Hardware [8.28931204639352]
本稿では,ベクトル記号アーキテクチャ(VSA)の最近の進歩を概観する。
我々は、VSAが高次元ベクトルに対して単純だが強力な操作を提供し、現代のコンピューティングに関連するすべてのデータ構造と操作をサポートすることを実証した。
この記事では、VSAの背景にある哲学、それらと分散コンピューティングの技法、そしてそれらが新興のコンピューティングハードウェアと関連していることを説明することで、コンピュータアーキテクトへの参照として機能する。
論文 参考訳(メタデータ) (2021-06-09T23:38:39Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - CUDA-Optimized real-time rendering of a Foveated Visual System [5.260841516691153]
本稿では,GPUを用いて高速(165Hz)でガウス画像(1920x1080)を効率よく生成する手法を提案する。
提案手法は生体人工エージェント間の空間変動処理の需要を満たし,既存システム上で容易にフォベーションを付加できる。
論文 参考訳(メタデータ) (2020-12-15T22:43:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。