論文の概要: Real-time FPGA Design for OMP Targeting 8K Image Reconstruction
- arxiv url: http://arxiv.org/abs/2110.04714v1
- Date: Sun, 10 Oct 2021 06:08:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 19:17:40.435818
- Title: Real-time FPGA Design for OMP Targeting 8K Image Reconstruction
- Title(参考訳): 8k画像再構成用ompのリアルタイムfpga設計
- Authors: Jiayao Xu, Chen Fu, Zhiqiang Zhang, Jinjia Zhou
- Abstract要約: Orthogonal Matching Pursuit (OMP) は、ハードウェア実装において最も広く使われている再構成アルゴリズムである。
Dot Product (DP) と Least Square Problem (LSP) が含まれている。
これら2つの部分は、多くの除算計算と相当なベクトルベースの乗算を持ち、ハードウェア上のリアルタイム再構成の実装を制限している。
本稿では,OMP再構成を最適化し,再構成効率のボトルネックを解消するために,疎性であり,主にベクトルを含むセンサマトリックスを採用する。
- 参考スコア(独自算出の注目度): 9.060598464676435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: During the past decade, implementing reconstruction algorithms on hardware
has been at the center of much attention in the field of real-time
reconstruction in Compressed Sensing (CS). Orthogonal Matching Pursuit (OMP) is
the most widely used reconstruction algorithm on hardware implementation
because OMP obtains good quality reconstruction results under a proper time
cost. OMP includes Dot Product (DP) and Least Square Problem (LSP). These two
parts have numerous division calculations and considerable vector-based
multiplications, which limit the implementation of real-time reconstruction on
hardware. In the theory of CS, besides the reconstruction algorithm, the choice
of sensing matrix affects the quality of reconstruction. It also influences the
reconstruction efficiency by affecting the hardware architecture. Thus,
designing a real-time hardware architecture of OMP needs to take three factors
into consideration. The choice of sensing matrix, the implementation of DP and
LSP. In this paper, a sensing matrix, which is sparsity and contains zero
vectors mainly, is adopted to optimize the OMP reconstruction to break the
bottleneck of reconstruction efficiency. Based on the features of the chosen
matrix, the DP and LSP are implemented by simple shift, add and comparing
procedures. This work is implemented on the Xilinx Virtex UltraScale+ FPGA
device. To reconstruct a digital signal with 1024 length under 0.25 sampling
rate, the proposal method costs 0.818us while the state-of-the-art costs
238$us. Thus, this work speedups the state-of-the-art method 290 times. This
work costs 0.026s to reconstruct an 8K gray image, which achieves 30FPS
real-time reconstruction.
- Abstract(参考訳): 過去10年間、ハードウェア上での再構成アルゴリズムの実装は、圧縮センシング(CS)におけるリアルタイム再構築の分野で大きな注目を集めてきた。
ompは適切な時間コストで良好な品質の再構成結果が得られるため、ハードウェア実装において最も広く使われている復元アルゴリズムである。
OMP には Dot Product (DP) と Least Square Problem (LSP) が含まれている。
これら2つの部分は、多くの分割計算と相当なベクトルベースの乗算を持ち、ハードウェア上のリアルタイム再構成の実装を制限している。
CS理論では、再構成アルゴリズムの他に、センシング行列の選択が再構成の質に影響を与える。
また、ハードウェアアーキテクチャに影響を与えることで、再構築効率に影響を与える。
したがって、OMPのリアルタイムハードウェアアーキテクチャを設計するには、3つの要素を考慮する必要がある。
センシングマトリックスの選択、DPとLSPの実装。
本稿では,OMP再構成を最適化し,再構成効率のボトルネックを解消するために,疎度で主にベクトルを含むセンサマトリックスを採用した。
選択された行列の特徴に基づいて、DPとLSPは、簡単なシフト、加算、比較手順によって実装される。
この機能は Xilinx Virtex UltraScale+ FPGA デバイスで実装されている。
サンプリングレート0.25以下で1024のディジタル信号を再構成するため,提案手法は0.818us,最先端は238$usである。
これにより最先端の手法を290倍に高速化する。
この作業は8Kグレーの画像の再構築に0.026秒かかる。
関連論文リスト
- Deep Network for Image Compressed Sensing Coding Using Local Structural
Sampling [37.10939114542612]
局所構造サンプリング(CSCNet)を用いた新しいCNNベースの画像CS符号化フレームワークを提案する。
提案するフレームワークでは、GRMの代わりに、新しい局所構造サンプリング行列が最初に開発された。
高相関の計測結果が生成され、サードパーティ画像によって最終ビットストリームに符号化される。
論文 参考訳(メタデータ) (2024-02-29T12:43:28Z) - Fast Inner-Product Algorithms and Architectures for Deep Neural Network
Accelerators [0.0]
本稿では,FFIP(Free-pipeline Fast Inner Product)と呼ばれる新しいアルゴリズムとそのハードウェアアーキテクチャを紹介する。
FIPは、主に行列乗算に分解できるすべての機械学習(ML)モデル層に適用できる。
FFIPは従来の固定点シストリックアレーMLアクセラレーターにシームレスに組み込むことができることを示す。
論文 参考訳(メタデータ) (2023-11-20T22:37:20Z) - LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning [66.85589263870702]
提案手法では,事前学習した行列を高精度の低ランク成分とメモリ効率の量子化成分に分解するために反復アルゴリズムを用いる。
微調整されたRoBERTaとLLaMA-2の実験は、我々の低ランク+量子化行列分解法(LQ-LoRA)が強いQLoRAおよびGPTQ-LoRAベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2023-11-20T18:57:41Z) - KyberMat: Efficient Accelerator for Matrix-Vector Polynomial Multiplication in CRYSTALS-Kyber Scheme via NTT and Polyphase Decomposition [20.592217626952507]
CRYSTAL-Kyber (Kyber) は、標準化プロセス中に選択された暗号鍵カプセル化機構 (KEM) の1つである。
本稿では,Kyberアーキテクチャのレイテンシとスループットの制約に対する最適化について述べる。
論文 参考訳(メタデータ) (2023-10-06T22:57:25Z) - Image Reconstruction for Accelerated MR Scan with Faster Fourier
Convolutional Neural Networks [87.87578529398019]
部分走査は、磁気共鳴イメージング(MRI)データ取得を2次元および3次元の両方で加速する一般的な手法である。
本稿では,Faster Fourier Convolution (FasterFC) と呼ばれる新しい畳み込み演算子を提案する。
2次元加速MRI法であるFasterFC-End-to-End-VarNetは、FasterFCを用いて感度マップと再構成品質を改善する。
k空間領域再構成を誘導する単一グループアルゴリズムを用いたFasterFC-based Single-to-group Network (FAS-Net) と呼ばれる3次元加速MRI法
論文 参考訳(メタデータ) (2023-06-05T13:53:57Z) - Degradation-Aware Unfolding Half-Shuffle Transformer for Spectral
Compressive Imaging [142.11622043078867]
圧縮画像と物理マスクからパラメータを推定し,これらのパラメータを用いて各イテレーションを制御する,DAUF(Degradation-Aware Unfolding Framework)を提案する。
HST を DAUF に接続することにより,HSI 再構成のための変換器の深部展開法であるデグレーション・アウェア・アンフォールディング・ハーフシャッフル変換器 (DAUHST) を確立した。
論文 参考訳(メタデータ) (2022-05-20T11:37:44Z) - A modular software framework for the design and implementation of
ptychography algorithms [55.41644538483948]
我々は,Pychographyデータセットをシミュレートし,最先端の再構築アルゴリズムをテストすることを目的とした,新しいptychographyソフトウェアフレームワークであるSciComを紹介する。
その単純さにもかかわらず、ソフトウェアはPyTorchインターフェースによる高速化処理を利用する。
結果は合成データと実データの両方で示される。
論文 参考訳(メタデータ) (2022-05-06T16:32:37Z) - Novel Consistency Check For Fast Recursive Reconstruction Of
Non-Regularly Sampled Video Data [1.2891210250935146]
クォーターサンプリングは、ピクセル数を増やすことなく高解像度画像の取得を可能にする新しいセンサー設計である。
ここでは、以前のフレームで測定された画素を現在のフレームに投影し、その再構成を支援する。
運動ベクトルのいくつかは誤りである可能性があるため、適切な整合性検査を行うことが重要である。
論文 参考訳(メタデータ) (2022-03-17T09:46:54Z) - ReconFormer: Accelerated MRI Reconstruction Using Recurrent Transformer [60.27951773998535]
本稿では,MRI再構成のためのリカレントトランスモデルである textbfReconFormer を提案する。
高度にアンダーサンプリングされたk空間データから高純度磁気共鳴像を反復的に再構成することができる。
パラメータ効率が向上し,最先端手法よりも大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-01-23T21:58:19Z) - Accelerating Laue Depth Reconstruction Algorithm with CUDA [0.0]
Laue diffraction microscopy(英語版)実験では、多色のLaue micro-diffraction(英語版)法を用いて材料の構造を調べる。
記録された画像は、将来のデータ解析のための深度再構成アルゴリズムで処理される。
本稿では,深度再構成問題に対するスケーラブルなGPUプログラムソリューションを提案する。
論文 参考訳(メタデータ) (2022-01-20T18:35:51Z) - Kullback-Leibler Divergence-Based Fuzzy $C$-Means Clustering
Incorporating Morphological Reconstruction and Wavelet Frames for Image
Segmentation [152.609322951917]
そこで我々は,厳密なウェーブレットフレーム変換と形態的再構成操作を組み込むことで,Kulback-Leibler (KL) 発散に基づくFuzzy C-Means (FCM) アルゴリズムを考案した。
提案アルゴリズムはよく機能し、他の比較アルゴリズムよりもセグメンテーション性能が優れている。
論文 参考訳(メタデータ) (2020-02-21T05:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。