論文の概要: AppSign: Multi-level Approximate Computing for Real-Time Traffic Sign Recognition in Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2411.10988v1
- Date: Sun, 17 Nov 2024 07:12:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:27:27.203354
- Title: AppSign: Multi-level Approximate Computing for Real-Time Traffic Sign Recognition in Autonomous Vehicles
- Title(参考訳): AppSign: 自動運転車におけるリアルタイム交通信号認識のためのマルチレベル近似コンピューティング
- Authors: Fatemeh Omidian, Athena Abdi,
- Abstract要約: AppSignは、CNNの畳み込み操作を近似することにより、CNNベースのトラフィックサイン認識ユニットに適用される。
実時間信号認識におけるAppSignの有効性を,いくつかの実験により評価した。
- 参考スコア(独自算出の注目度): 0.27624021966289597
- License:
- Abstract: This paper presents a multi-level approximate computing approach for real-time traffic sign recognition in autonomous vehicles called AppSign. Since autonomous vehicles are real-time systems, they must gather environmental information and process them instantaneously to respond properly. However, due to the limited resources of these systems, executing computation-intensive algorithms such as deep-learning schemes that lead to precise output is impossible and takes a long time. To tackle this, imprecise computation schemes compromise the complexity and real-time operations. In this context, AppSign presents a multi-level approximate computing scheme to balance the accuracy and computation cost of the computation-intensive schemes and make them appropriate for real-time applications. AppSign is applied to the CNN-based traffic sign recognition unit by approximating the convolution operation of CNN which is the primal solution for image processing applications. In AppSign a novel approximate multiplication method called "TIRuD" is proposed that truncates the operations while keeping the accuracy acceptable. Moreover, it provides the adaptive approximation of the underlying CNN by involving various levels of computation and considering different approximation methods. The efficiency of the proposed AppSign, in real-time traffic sign recognition, is evaluated through several experiments. Based on these experiments, our proposed TIRuD reduces the accuracy by about $10\%$ while saving execution time about $64\%$ over the exact multiplication, averagely. Moreover, employing our proposed hierarchical approximation in various model layers outperforms the exact computation $27.78\%$ considering "AoC" that joins accuracy and computation cost in a parameter.
- Abstract(参考訳): 本稿では,AppSignと呼ばれる自律走行車におけるリアルタイム交通信号認識のためのマルチレベル近似計算手法を提案する。
自動運転車はリアルタイムシステムであるため、環境情報を収集し、それらを即座に処理して適切な応答を行う必要がある。
しかし、これらのシステムの限られた資源のため、正確な出力につながるディープラーニングスキームのような計算集約的なアルゴリズムの実行は不可能であり、長い時間を要する。
これを解決するために、不正確な計算スキームは複雑さとリアルタイム操作を損なう。
この文脈において、AppSignは計算集約型スキームの精度と計算コストのバランスをとるために、マルチレベル近似計算スキームを提示し、それらをリアルタイムアプリケーションに適合させる。
AppSignは、CNNの畳み込み操作を近似することにより、CNNベースのトラフィックサイン認識ユニットに適用される。
AppSignでは、「TIRuD」と呼ばれる新しい近似乗法が提案され、精度を保ちながら演算を切断する。
さらに、様々なレベルの計算を伴い、異なる近似法を考慮し、基礎となるCNNの適応近似を提供する。
実時間信号認識におけるAppSignの有効性を,いくつかの実験により評価した。
これらの実験に基づいて、提案したTIRuDは、平均的な乗算よりも、実行時間を約6,4\%(約6,4\%)削減しながら、約10\%(約10 %)の精度を低下させる。
さらに,パラメータの精度と計算コストを結合する「AoC」を考慮し,各モデル層に提案した階層近似を用いることで,正確な計算精度が27.78 %$よりも優れていた。
関連論文リスト
- Real-time Hybrid System Identification with Online Deterministic Annealing [7.229820415732795]
本稿では、入力出力領域と状態空間領域の両方において、離散時間状態依存切替システムに対するリアルタイム識別手法を提案する。
スイッチングシステムにおける標準的な識別アルゴリズムとは対照的に,提案手法は徐々にモード数を推定し,リアルタイムシステム識別に適している。
論文 参考訳(メタデータ) (2024-08-03T10:02:49Z) - SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for
Autonomous Driving [27.776472262857045]
本稿では,自動運転車のための簡易かつ効率的な運動予測ベースライン(SIMPL)を提案する。
メッセージ転送を対称的に行う,コンパクトで効率的なグローバル機能融合モジュールを提案する。
強力なベースラインとして、SIMPLはArgoverse 1と2のモーション予測ベンチマークで高い競争性能を示す。
論文 参考訳(メタデータ) (2024-02-04T15:07:49Z) - Randomized Polar Codes for Anytime Distributed Machine Learning [66.46612460837147]
本稿では,低速な計算ノードに対して堅牢で,線形演算の近似計算と精度の両立が可能な分散コンピューティングフレームワークを提案する。
本稿では,復号化のための計算複雑性を低く保ちながら,実数値データを扱うための逐次復号アルゴリズムを提案する。
大規模行列乗算やブラックボックス最適化など,様々な文脈において,このフレームワークの潜在的な応用を実証する。
論文 参考訳(メタデータ) (2023-09-01T18:02:04Z) - Incrementally-Computable Neural Networks: Efficient Inference for
Dynamic Inputs [75.40636935415601]
ディープラーニングは、センサーデータやユーザ入力などの動的入力を効率的に処理するという課題に直面していることが多い。
インクリメンタルな計算アプローチを採用し、入力の変化に応じて計算を再利用する。
本稿では,この手法をトランスフォーマーアーキテクチャに適用し,修正入力の分数に比例した複雑性を持つ効率的なインクリメンタル推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-27T16:30:27Z) - Evaluation of Test-Time Adaptation Under Computational Time Constraints [80.40939405129102]
テスト時間適応(TTA)メソッドは、テスト時にラベルのないデータを活用して、分散シフトに適応する。
現在の評価プロトコルは、この余分なコストの影響を見落とし、実際の適用性に影響を与える。
本稿では,TTA手法のより現実的な評価プロトコルを提案し,一定の速度のデータストリームからデータをオンライン形式で受信する。
論文 参考訳(メタデータ) (2023-04-10T18:01:47Z) - Connection-Based Scheduling for Real-Time Intersection Control [6.796017024594715]
本稿では,交通渋滞を軽減するために,リアルタイム適応型信号制御のためのスケジューリングアルゴリズムを提案する。
このアルゴリズムは、異なる車線を通る交差点に近づく全車両の到着時刻を推定する車線モデルを採用し、次に、全車両が接近する際の累積遅延を最小化するスケジュールを計算する。
論文 参考訳(メタデータ) (2022-10-16T04:37:03Z) - RISE-SLAM: A Resource-aware Inverse Schmidt Estimator for SLAM [7.388000129690679]
視覚-慣性同時ローカライズ・マッピング(SLAM)のためのRISE-SLAMアルゴリズムを提案する。
線形メモリ要件と調整可能な処理コストを有する情報領域に一貫した新しい近似手法を導出する。
特に、リソースを意識した逆シュミット推定器(RISE)は、計算効率のトレーディング推定精度を実現する。
論文 参考訳(メタデータ) (2020-11-23T21:10:32Z) - Activation Relaxation: A Local Dynamical Approximation to
Backpropagation in the Brain [62.997667081978825]
活性化緩和(AR)は、バックプロパゲーション勾配を力学系の平衡点として構成することで動機付けられる。
我々のアルゴリズムは、正しいバックプロパゲーション勾配に迅速かつ堅牢に収束し、単一のタイプの計算単位しか必要とせず、任意の計算グラフで操作できる。
論文 参考訳(メタデータ) (2020-09-11T11:56:34Z) - Multi-scale Interaction for Real-time LiDAR Data Segmentation on an
Embedded Platform [62.91011959772665]
LiDARデータのリアルタイムセマンティックセグメンテーションは、自動運転車にとって不可欠である。
ポイントクラウド上で直接動作する現在のアプローチでは、複雑な空間集約操作を使用する。
本稿では,マルチスケールインタラクションネットワーク(MINet)と呼ばれるプロジェクションベースの手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T19:06:11Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Towards Efficient Scheduling of Federated Mobile Devices under
Computational and Statistical Heterogeneity [16.069182241512266]
本稿では,モバイルデバイス上での分散学習の実装について検討する。
チューニングノブとしてデータを使用し、異なるワークロードをスケジュールする2つの効率的な時間アルゴリズムを提案する。
一般的なベンチマークと比較すると,提案アルゴリズムはCIFAR10で2-100倍の高速化,2-7%の精度向上,収束率を100%以上達成している。
論文 参考訳(メタデータ) (2020-05-25T18:21:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。