論文の概要: EdgeNav-QE: QLoRA Quantization and Dynamic Early Exit for LAM-based Navigation on Edge Devices
- arxiv url: http://arxiv.org/abs/2602.15836v1
- Date: Mon, 12 Jan 2026 09:20:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 12:01:13.633842
- Title: EdgeNav-QE: QLoRA Quantization and Dynamic Early Exit for LAM-based Navigation on Edge Devices
- Title(参考訳): EdgeNav-QE: エッジデバイス上でのLAMベースのナビゲーションのためのQLoRA量子化と動的初期出力
- Authors: Mengyun Liu, Shanshan Huang, Jianan Jiang,
- Abstract要約: 大規模行動モデル(LAM)は、低レベル制御による高レベル推論をブリッジすることで、自律的なナビゲーションにおいて大きな可能性を示している。
エッジデバイスにこれらのマルチビリオンパラメータモデルをデプロイすることは、メモリ制約とレイテンシ要求のため、依然として大きな課題である。
我々は、リアルタイムエッジナビゲーションのためにLAMを最適化する動的早期出力機構と、量子化低ランク適応(QLoRA)を統合する新しいフレームワークであるEdgeNav-QEを提案する。
- 参考スコア(独自算出の注目度): 5.926544683744667
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Action Models (LAMs) have shown immense potential in autonomous navigation by bridging high-level reasoning with low-level control. However, deploying these multi-billion parameter models on edge devices remains a significant challenge due to memory constraints and latency requirements. In this paper, we propose EdgeNav-QE, a novel framework that integrates Quantized Low-Rank Adaptation (QLoRA) with a dynamic early-exit (DEE) mechanism to optimize LAMs for real-time edge navigation. By quantizing the backbone to 4-bit precision and strategically placing early-exit branches, we enable the model to terminate inference early for simple navigation tasks while retaining full depth for complex decision-making. Experimental results on the Habitat-Sim environment with Matterport3D dataset using OpenVLA-7B backbone, demonstrate that EdgeNav-QE reduces inference latency by 82.7% and memory footprint by 66.7% compared to full-precision baselines, while maintaining 81.8% navigation success rate. Furthermore, it outperforms state-of-the-art static early-exit method by 17.9% in latency, demonstrating the superiority of content-aware adaptive computation for safety-critical applications.
- Abstract(参考訳): 大規模行動モデル(LAM)は、低レベル制御による高レベル推論をブリッジすることで、自律的なナビゲーションにおいて大きな可能性を示している。
しかしながら、エッジデバイスにこれらのマルチビリオンパラメータモデルをデプロイすることは、メモリ制約とレイテンシ要求のために依然として大きな問題である。
本稿では,リアルタイムエッジナビゲーションのためのLAMを最適化するために,量子化低ランク適応(QLoRA)と動的早期出力(DEE)機構を統合した新しいフレームワークであるEdgeNav-QEを提案する。
バックボーンを4ビット精度に定量化し、早期終了分岐を戦略的に配置することにより、複雑な意思決定のための完全な深さを維持しつつ、単純なナビゲーションタスクのために推論を早期に終了させることができる。
OpenVLA-7Bのバックボーンを用いたMatterport3Dデータセットを用いたHabitat-Sim環境の実験結果は、EdgeNav-QEが推論遅延を82.7%、メモリフットプリントを66.7%削減し、81.8%のナビゲーション成功率を維持していることを示している。
さらに、最先端の静的アーリーエグジット法を17.9%のレイテンシで上回り、安全クリティカルなアプリケーションに対するコンテンツ認識適応計算の優位性を示す。
関連論文リスト
- ABot-N0: Technical Report on the VLA Foundation Model for Versatile Embodied Navigation [50.35621223011076]
ABot-N0は5つのコアタスクにまたがる「グランド・ユニフィケーション」を実現する統合ビジョン・ランゲージ・アクション(VLA)基盤モデルである。
ABot-N0は階層的なBrain-Action'アーキテクチャを使用し、LLMベースのCognitive Brainをセマンティック推論に組み合わせ、フローマッチングベースのAction Expertと組み合わせて正確で連続的な軌道生成を行う。
論文 参考訳(メタデータ) (2026-02-12T05:30:20Z) - EdgeFlex-Transformer: Transformer Inference for Edge Devices [2.1130318406254074]
視覚変換器(ViT)の圧縮・高速化を目的とした軽量で効果的な多段最適化パイプラインを提案する。
本手法は,アクティベーションプロファイリング,メモリ対応プルーニング,選択的混合精度実行,アクティベーション対応量子化(AWQ)を組み合わせることで,コストのかかるリトレーニングやタスク固有の微調整を必要とせずに,モデルのメモリフットプリントを削減する。
CIFAR-10の実験では、完全に最適化されたモデルはピークメモリ使用量の76%削減と6倍のレイテンシを実現し、元のFP32ベースラインと比較して精度を維持または改善している。
論文 参考訳(メタデータ) (2025-12-17T21:45:12Z) - Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models [97.55009021098554]
本研究の目的は、SLMのリアルタイムレイテンシの主要な決定要因を特定し、SLMの設計とトレーニングのための一般化可能な原則と方法論を提供することである。
我々はNemotron-Flashと呼ばれるハイブリッドSLMの新たなファミリーを導入し、最先端SLMの精度・効率のフロンティアを大幅に向上させる。
論文 参考訳(メタデータ) (2025-11-24T08:46:36Z) - Nav-EE: Navigation-Guided Early Exiting for Efficient Vision-Language Models in Autonomous Driving [24.706739338133236]
Nav-EEは、タスク固有のエグジット層をオフラインでプリコンプリートし、それらをオンラインに動的に適用する、ナビゲーション誘導早期退避フレームワークである。
実験によると、Nav-EEは完全な推論に匹敵する精度を達成し、レイテンシを最大63.9%削減している。
論文 参考訳(メタデータ) (2025-10-02T08:37:58Z) - DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.888688171010365]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。
我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-28T04:46:13Z) - SenseExpo: Efficient Autonomous Exploration with Prediction Information from Lightweight Neural Networks [3.6404856388891793]
SenseExpoは、軽量な予測ネットワークに基づく効率的な自律探査フレームワークである。
我々の最小モデルでは、U-netやLaMaよりもKTHデータセットの性能が向上している。
論文 参考訳(メタデータ) (2025-03-20T10:07:51Z) - MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation [3.9974562667271507]
視覚計測(VO)は,室内環境におけるエンボディエージェントの正確なポイントゴールナビゲーションを可能にするために不可欠である。
近年の深層学習VO法は, 頑健な性能を示すが, トレーニング中のサンプル不効率に悩まされている。
エージェントが環境をナビゲートしている間に利用可能な動作先に基づいて、ロバストでサンプル効率の良いVOパイプラインを提案する。
論文 参考訳(メタデータ) (2024-11-07T15:36:49Z) - Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文 参考訳(メタデータ) (2024-02-04T08:41:20Z) - Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation [72.24964965882783]
強化学習(RL)はロボットナビゲーションにおいて有望なアプローチであり、ロボットは試行錯誤を通じて学習することができる。
現実世界のロボットタスクは、しばしばまばらな報酬に悩まされ、非効率な探索と準最適政策に繋がる。
本稿では,RLに基づくロボットナビゲーションにおいて,報酬関数を変更せずにサンプル効率を向上させる新しい手法であるConfidence-Controlled Exploration (CCE)を紹介する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures
using Lookup Tables [49.965024476651706]
DeepGEMMはSIMDハードウェア上で超高精度畳み込みニューラルネットワークを実行するためのルックアップテーブルベースのアプローチである。
実装は、x86プラットフォーム上で、対応する8ビット整数カーネルを最大1.74倍の性能で上回る。
論文 参考訳(メタデータ) (2023-04-18T15:13:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。