論文の概要: FlowPrecision: Advancing FPGA-Based Real-Time Fluid Flow Estimation with Linear Quantization
- arxiv url: http://arxiv.org/abs/2403.01922v2
- Date: Thu, 20 Jun 2024 09:03:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-22 04:59:27.298245
- Title: FlowPrecision: Advancing FPGA-Based Real-Time Fluid Flow Estimation with Linear Quantization
- Title(参考訳): FlowPrecision:線形量子化によるFPGAに基づくリアルタイム流体推定の改善
- Authors: Tianheng Ling, Julian Hoever, Chao Qian, Gregor Schiele,
- Abstract要約: 本研究では,FPGAを用いたソフトセンサの線形量子化を流体流量推定に適用する。
提案手法は平均二乗誤差を最大10.10%削減し、推論速度を9.39%改善する。
- 参考スコア(独自算出の注目度): 18.15754187896287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In industrial and environmental monitoring, achieving real-time and precise fluid flow measurement remains a critical challenge. This study applies linear quantization in FPGA-based soft sensors for fluid flow estimation, significantly enhancing Neural Network model precision by overcoming the limitations of traditional fixed-point quantization. Our approach achieves up to a 10.10% reduction in Mean Squared Error and a notable 9.39% improvement in inference speed through targeted hardware optimizations. Validated across multiple data sets, our findings demonstrate that the optimized FPGA-based quantized models can provide efficient, accurate real-time inference, offering a viable alternative to cloud-based processing in pervasive autonomous systems.
- Abstract(参考訳): 産業および環境モニタリングにおいては、リアルタイムかつ正確な流体流量測定を実現することが重要な課題である。
本研究では,FPGAを用いたソフトセンサの線形量子化を流体流量推定に適用し,従来の固定点量子化の限界を克服してニューラルネットワークモデルの精度を大幅に向上する。
我々の手法は平均平方誤差を最大10.10%削減し、ターゲットハードウェア最適化による推論速度を9.39%改善する。
複数のデータセットにまたがって検証した結果、最適化されたFPGAベースの量子化モデルは、効率的で正確なリアルタイム推論を提供し、広範囲な自律システムにおけるクラウドベースの処理の代替手段となることを示した。
関連論文リスト
- Real-Time Spacecraft Pose Estimation Using Mixed-Precision Quantized Neural Network on COTS Reconfigurable MPSoC [0.13108652488669734]
本稿では、市販MPSoCのFPGAコンポーネント上に実装された混合精度量子化ニューラルネットワークを用いて、リアルタイム宇宙船のポーズ推定の先駆的なアプローチを提案する。
我々の貢献には、そのようなアルゴリズムを初めてリアルタイムでオープンソースに実装することが含まれており、効率的な宇宙船ポーズ推定アルゴリズムを広く利用できるようにするための大きな進歩を示している。
論文 参考訳(メタデータ) (2024-06-06T17:36:26Z) - Gradient-based Automatic Per-Weight Mixed Precision Quantization for Neural Networks On-Chip [0.9187138676564589]
高グラニュラリティ量子化(HGQ)は、超低レイテンシで低電力のニューラルネットワークを実現するために、ウェイト毎およびアクティベーション毎の精度を自動的に微調整する、革新的な量子化対応トレーニング手法である。
我々は,HGQが既存の手法をかなり上回り,最大20倍のリソース削減,5倍のレイテンシ向上を達成できることを示した。
論文 参考訳(メタデータ) (2024-05-01T17:18:46Z) - On-Chip Hardware-Aware Quantization for Mixed Precision Neural Networks [52.97107229149988]
エッジデバイス上でハードウェア対応の混合精度量子化を行うOn-Chipハードウェア・アウェア量子化フレームワークを提案する。
このパイプラインは、量子化プロセスが量子化演算子の実際のハードウェア効率を知覚することを可能にする。
精度測定のために,マルチチップシナリオにおける演算子の精度への影響を効果的に推定するMask-Guided Quantization Estimation技術を提案する。
論文 参考訳(メタデータ) (2023-09-05T04:39:34Z) - Efficient Graph Neural Network Inference at Large Scale [54.89457550773165]
グラフニューラルネットワーク(GNN)は、幅広いアプリケーションで優れた性能を示している。
既存のスケーラブルなGNNは、線形伝搬を利用して特徴を前処理し、トレーニングと推論の手順を高速化する。
本稿では,そのトポロジ情報に基づいて各ノードに対してパーソナライズされた伝搬順序を生成する適応的伝搬順序法を提案する。
論文 参考訳(メタデータ) (2022-11-01T14:38:18Z) - Performance Optimization for Variable Bitwidth Federated Learning in
Wireless Networks [103.22651843174471]
本稿では,モデル量子化による統合学習(FL)における無線通信と計算効率の向上について考察する。
提案したビット幅FL方式では,エッジデバイスは局所FLモデルパラメータの量子化バージョンを調整し,コーディネートサーバに送信し,それらを量子化されたグローバルモデルに集約し,デバイスを同期させる。
FLトレーニングプロセスはマルコフ決定プロセスとして記述でき、反復よりも行動選択を最適化するためのモデルベース強化学習(RL)手法を提案する。
論文 参考訳(メタデータ) (2022-09-21T08:52:51Z) - LEAPER: Modeling Cloud FPGA-based Systems via Transfer Learning [13.565689665335697]
LEAPERは,既存のMLベースモデルを未知の環境に適応させるFPGAベースのシステムに対して,トランスファーラーニングに基づくアプローチを提案する。
その結果,5ショットの学習を行うクラウド環境において,移動モデルを用いて予測を行う場合,平均85%の精度が得られた。
論文 参考訳(メタデータ) (2022-08-22T21:25:56Z) - Green, Quantized Federated Learning over Wireless Networks: An
Energy-Efficient Design [68.86220939532373]
有限精度レベルは、固定精度フォーマットで重みとアクティベーションを定量化する量子ニューラルネットワーク(QNN)を使用して取得される。
提案するFLフレームワークは,ベースラインFLアルゴリズムと比較して,収束までのエネルギー消費量を最大70%削減することができる。
論文 参考訳(メタデータ) (2022-07-19T16:37:24Z) - Deep Equilibrium Optical Flow Estimation [80.80992684796566]
最近のSOTA(State-of-the-art)光フローモデルでは、従来のアルゴリズムをエミュレートするために有限ステップの更新操作を使用する。
これらのRNNは大きな計算とメモリオーバーヘッドを課し、そのような安定した推定をモデル化するために直接訓練されていない。
暗黙的層の無限レベル固定点として直接流れを解く手法として,Deep equilibrium Flow estimatorを提案する。
論文 参考訳(メタデータ) (2022-04-18T17:53:44Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z) - Optimisation of a Siamese Neural Network for Real-Time Energy Efficient
Object Tracking [0.0]
組込み視覚システムのためのSiameseニューラルネットワークを用いた視覚物体追跡の最適化について述べる。
提案手法は,高解像度ビデオストリームに対して,リアルタイムに動作するものと推定された。
論文 参考訳(メタデータ) (2020-07-01T13:49:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。