論文の概要: SPAQ-DL-SLAM: Towards Optimizing Deep Learning-based SLAM for Resource-Constrained Embedded Platforms
- arxiv url: http://arxiv.org/abs/2409.14515v1
- Date: Sun, 22 Sep 2024 16:19:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 22:19:40.938460
- Title: SPAQ-DL-SLAM: Towards Optimizing Deep Learning-based SLAM for Resource-Constrained Embedded Platforms
- Title(参考訳): SPAQ-DL-SLAM:資源制約付組込みプラットフォームのためのディープラーニングベースのSLAMの最適化に向けて
- Authors: Niraj Pudasaini, Muhammad Abdullah Hanif, Muhammad Shafique,
- Abstract要約: 本稿では,現在最先端のDL-SLAMアルゴリズムであるDROID-SLAMのアーキテクチャにSPAQ(Structured Pruning and Quantization)を適用したフレームワークを提案する。
DROID-SLAMモデルの最適化版であるSPAQ-DROIDSLAMモデルは、FLOPを18.9%削減し、全体のモデルサイズを79.8%削減する。
- 参考スコア(独自算出の注目度): 5.383130566626935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimizing Deep Learning-based Simultaneous Localization and Mapping (DL-SLAM) algorithms is essential for efficient implementation on resource-constrained embedded platforms, enabling real-time on-board computation in autonomous mobile robots. This paper presents SPAQ-DL-SLAM, a framework that strategically applies Structured Pruning and Quantization (SPAQ) to the architecture of one of the state-ofthe-art DL-SLAM algorithms, DROID-SLAM, for resource and energy-efficiency. Specifically, we perform structured pruning with fine-tuning based on layer-wise sensitivity analysis followed by 8-bit post-training static quantization (PTQ) on the deep learning modules within DROID-SLAM. Our SPAQ-DROIDSLAM model, optimized version of DROID-SLAM model using our SPAQ-DL-SLAM framework with 20% structured pruning and 8-bit PTQ, achieves an 18.9% reduction in FLOPs and a 79.8% reduction in overall model size compared to the DROID-SLAM model. Our evaluations on the TUM-RGBD benchmark shows that SPAQ-DROID-SLAM model surpasses the DROID-SLAM model by an average of 10.5% on absolute trajectory error (ATE) metric. Additionally, our results on the ETH3D SLAM training benchmark demonstrate enhanced generalization capabilities of the SPAQ-DROID-SLAM model, seen by a higher Area Under the Curve (AUC) score and success in 2 additional data sequences compared to the DROIDSLAM model. Despite these improvements, the model exhibits performance variance on the distinct Vicon Room sequences from the EuRoC dataset, which are captured at high angular velocities. This varying performance at some distinct scenarios suggests that designing DL-SLAM algorithms taking operating environments and tasks in consideration can achieve optimal performance and resource efficiency for deployment in resource-constrained embedded platforms.
- Abstract(参考訳): リソース制約の組込みプラットフォーム上での効率的な実装には,ディープラーニングに基づく同時局所マッピング(DL-SLAM)アルゴリズムの最適化が不可欠である。
本稿では,SPAQ-DL-SLAM(Structured Pruning and Quantization, SPAQ)を最先端のDL-SLAMアルゴリズムであるDROID-SLAM(DROID-SLAM)のアーキテクチャに戦略的に適用する手法を提案する。
具体的には,DROID-SLAMの深層学習モジュール上で,階層感度解析と8ビット後の静的量子化(PTQ)に基づく微調整による構造化プルーニングを行う。
我々のSPAQ-DROIDSLAMモデルでは、20パーセントの構造化プルーニングと8ビットのPTQを持つSPAQ-DL-SLAMフレームワークを用いて、DROID-SLAMモデルの最適化版であるDROID-SLAMモデルを用いて、FLOPの18.9%の削減と、DROID-SLAMモデルと比較して全体のモデルサイズ79.8%の削減を実現している。
TUM-RGBDベンチマークによる評価は,SPAQ-DROID-SLAMモデルが絶対軌道誤差(ATE)測定値で平均10.5%のDROID-SLAMモデルを上回ることを示している。
さらに、ETH3D SLAMトレーニングベンチマークの結果、AUCスコアが高いSPAQ-DROID-SLAMモデルの一般化能力が向上し、DROIDSLAMモデルと比較して2つの追加データシーケンスが成功した。
これらの改善にもかかわらず、モデルは高角速度でキャプチャされるEuRoCデータセットと異なるVicon Roomシーケンスのパフォーマンスのばらつきを示す。
DL-SLAMアルゴリズムを設計し、運用環境やタスクを考慮し、リソース制約のある組込みプラットフォームに配置する際の最適なパフォーマンスとリソース効率を実現することを示唆している。
関連論文リスト
- DLO: Dynamic Layer Operation for Efficient Vertical Scaling of LLMs [46.443316184807145]
変換器をベースとした大規模言語モデル(LLM)を垂直スケールする新しいアプローチである動的層演算(DLO)を導入する。
モデル幅の拡張に重点を置く従来のMixture-of-Experts(MoE)手法とは異なり,本手法はモデル深度を対象とし,様々な入力サンプルに対して層表現間で観測される冗長性に対処する。
実験結果から、DLOは元の非スケールモデルよりも優れるだけでなく、効率が大幅に向上した密に拡張されたモデルに匹敵する結果が得られることが示された。
論文 参考訳(メタデータ) (2024-07-03T18:34:08Z) - Can AI be enabled to dynamical downscaling? A Latent Diffusion Model to mimic km-scale COSMO5.0\_CLM9 simulations [0.0]
ダウンスケーリング技術は、地球システムモデリングにおけるディープラーニング(DL)の最も顕著な応用の1つである。
本研究では,イタリア上空のERA5データを2kmまでダウンスケールするために,LDM(Latent Diffusion Model)を適用した。
我々のゴールは、最近の生成モデリングの進歩により、DLが数値力学モデルに匹敵する結果をもたらすことを実証することである。
論文 参考訳(メタデータ) (2024-06-19T15:20:28Z) - DK-SLAM: Monocular Visual SLAM with Deep Keypoint Learning, Tracking and Loop-Closing [13.50980509878613]
公開されているデータセットに対する実験的評価は、DK-SLAMが従来のSLAMシステムと学習ベースのSLAMシステムより優れていることを示している。
本システムでは,キーポイント抽出ネットワークの学習を最適化するために,モデル非依存メタラーニング(MAML)戦略を採用している。
累積的な位置決め誤差を軽減するため、DK-SLAMはループ閉鎖検出にバイナリ機能を利用する新しいオンライン学習モジュールを組み込んだ。
論文 参考訳(メタデータ) (2024-01-17T12:08:30Z) - A-SDM: Accelerating Stable Diffusion through Redundancy Removal and
Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。
次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。
第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:37:47Z) - A Neuromorphic Architecture for Reinforcement Learning from Real-Valued
Observations [0.34410212782758043]
強化学習(RL)は複雑な環境における意思決定のための強力なフレームワークを提供する。
本稿では,実測値を用いてRL問題を解くための新しいスパイキングニューラルネットワーク(SNN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-07-06T12:33:34Z) - Scaling Pre-trained Language Models to Deeper via Parameter-efficient
Architecture [68.13678918660872]
行列積演算子(MPO)に基づくより有能なパラメータ共有アーキテクチャを設計する。
MPO分解はパラメータ行列の情報を再編成し、2つの部分に分解することができる。
私たちのアーキテクチャは、モデルのサイズを減らすために、すべてのレイヤで中央テンソルを共有しています。
論文 参考訳(メタデータ) (2023-03-27T02:34:09Z) - Using Detection, Tracking and Prediction in Visual SLAM to Achieve
Real-time Semantic Mapping of Dynamic Scenarios [70.70421502784598]
RDS-SLAMは、一般的に使用されているIntel Core i7 CPUのみを使用して、動的シナリオのためのオブジェクトレベルでのセマンティックマップをリアルタイムで構築することができる。
我々は, TUM RGB-DデータセットにおけるRDS-SLAMを評価し, 動的シナリオにおいて, RDS-SLAMはフレームあたり30.3msで動作可能であることを示した。
論文 参考訳(メタデータ) (2022-10-10T11:03:32Z) - Simplifying Model-based RL: Learning Representations, Latent-space
Models, and Policies with One Objective [142.36200080384145]
自己整合性を維持しつつ高いリターンを達成するために,潜在空間モデルとポリシーを協調的に最適化する単一目的を提案する。
得られたアルゴリズムは, モデルベースおよびモデルフリーRL手法のサンプル効率に適合するか, 改善することを示した。
論文 参考訳(メタデータ) (2022-09-18T03:51:58Z) - Accelerating Deep Learning Model Inference on Arm CPUs with Ultra-Low
Bit Quantization and Runtime [57.5143536744084]
ディープラーニングモデルの高性能化は、高い計算、ストレージ、電力要求を犠牲にしている。
我々はDeplite Neutrinoを導入し、DepliteはArmベースのプラットフォームに超低ビット量子化モデルを展開する。
論文 参考訳(メタデータ) (2022-07-18T15:05:17Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - A Hybrid Learner for Simultaneous Localization and Mapping [2.1041384320978267]
同時ローカライゼーション・マッピング(slam)は、移動プラットフォームの動的運動経路を予測するために用いられる。
本研究は,機能融合を超えたハイブリッド学習モデルを提案する。
それは異なった深いネットワークの上の層の突然変異によってSLAMのフロントエンドの特徴の抽出器の重量の増強を遂行します。
独立に訓練されたモデルからの軌道予測は、位置の詳細を洗練するために集約される。
論文 参考訳(メタデータ) (2021-01-04T18:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。