論文の概要: HeiSD: Hybrid Speculative Decoding for Embodied Vision-Language-Action Models with Kinematic Awareness
- arxiv url: http://arxiv.org/abs/2603.17573v1
- Date: Wed, 18 Mar 2026 10:25:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.644894
- Title: HeiSD: Hybrid Speculative Decoding for Embodied Vision-Language-Action Models with Kinematic Awareness
- Title(参考訳): HeiSD:キネマティック・アウェアネスを用いた身体的視覚ランゲージ・アクションモデルのためのハイブリッド投機的デコーディング
- Authors: Zihao Zheng, Zhihao Mao, Sicheng Tian, Maoliang Li, Jiayu Chen, Xinhao Sun, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen,
- Abstract要約: VLA(Vision-Language-Action)モデルはロボット制御の主流のソリューションとなっているが、推論速度が遅い。
VLAモデルにより制御されるロボットの軌道パターンを分析し、重要な洞察を得る。
本論文では,HeiSDにおける検索に基づくSD最適化手法を提案する。
- 参考スコア(独自算出の注目度): 13.793127202497358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-Language-Action (VLA) Models have become the mainstream solution for robot control, but suffer from slow inference speeds. Speculative Decoding (SD) is a promising acceleration method which can be divided into two categories: drafter-based SD and retrieval-based SD. Existing methods fail to analyze the advantages and disadvantages of these two types of SD in VLA models, leading to their sole application or optimization. In this paper, we analyze the trajectory patterns of robots controlled by the VLA model and derive a key insight: the two types of SD should be used in a hybrid manner. However, achieving hybrid SD in VLA models poses several challenges: (1) draft rejection and persistent errors in retrieval-based SD; (2) difficulty in determining the hybrid boundary. To address these, we propose the HeiSD framework. We propose a retrieval-based SD optimization method in HeiSD,which contains a verify-skip mechanism and a sequence-wise relaxed acceptance strategy. Moreover, we proposed a kinematic-based fused metric in HeiSD to automatically determine the hybrid boundary. Experimental results demonstrate that HeiSD attains a speedup of up to 2.45x in simulation benchmarks and 2.06x~2.41x in real-world scenarios, while sustaining a high task success rate.
- Abstract(参考訳): VLA(Vision-Language-Action)モデルはロボット制御の主流のソリューションとなっているが、推論速度が遅い。
投機的復号法 (SD) は有望な加速法であり, ドラフト型SDと検索型SDの2つのカテゴリに分けられる。
既存の手法では、VLAモデルにおけるこれらの2種類のSDの利点と欠点を解析できないため、唯一の応用や最適化に繋がる。
本稿では,VLAモデルによって制御されるロボットの軌道パターンを解析し,この2種類のSDをハイブリッド方式で使用すべきという重要な知見を導出する。
しかしながら、VLAモデルにおけるハイブリッドSDの実現には、(1)検索ベースSDにおけるドラフト拒絶と持続的エラー、(2)ハイブリッド境界の決定の難しさなど、いくつかの課題がある。
そこで我々はHeiSDフレームワークを提案する。
本稿では,HeiSDにおける検索に基づくSD最適化手法を提案する。
さらに,ハイブリット境界を自動的に決定するために,HeiSDでキネマティックベースの融合計量を提案した。
実験の結果、HeiSDはシミュレーションベンチマークで最大2.45倍、実際のシナリオでは2.06x~2.41倍のスピードアップを実現し、高いタスク成功率を維持した。
関連論文リスト
- KERV: Kinematic-Rectified Speculative Decoding for Embodied VLA Models [11.326305992898776]
我々はKERVというキネマティック修正型SDフレームワークを開発した。
KERVは27%37%の加速を達成するが、成功率の損失はほとんどない。
論文 参考訳(メタデータ) (2026-03-02T08:12:03Z) - Time-Aware One Step Diffusion Network for Real-World Image Super-Resolution [95.64241653468872]
拡散に基づく実世界の超解像法(Real-ISR)は優れた性能を示した。
効率的なReal-ISRを実現するために、多くの研究は変分スコア蒸留(VSD)を用いて、固定時間ステップのワンステップSRに対して事前訓練された安定拡散(SD)モデルを蒸留する。
リアルタイムISR(TADSR)のためのタイムアウェアワンステップ拡散ネットワークを提案する。
論文 参考訳(メタデータ) (2025-08-22T17:23:49Z) - Pangu Embedded: An Efficient Dual-system LLM Reasoner with Metacognition [95.54406667705999]
Pangu Embeddedは、Ascend Neural Processing Units (NPU) 上で開発された効率的なLarge Language Model (LLM) 推論器である。
既存の推論最適化 LLM でよく見られる計算コストと推論遅延の問題に対処する。
単一の統一モデルアーキテクチャ内で、迅速な応答と最先端の推論品質を提供する。
論文 参考訳(メタデータ) (2025-05-28T14:03:02Z) - Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff [11.56474452889308]
投機的復号(SD)は、候補トークンを受け入れる際にターゲットモデルに厳密な分布同値を強制する。
本稿では,Fazy Speculative Decoding (FSD)を導入し,ターゲットとドラフトモデルの分布の相違点に基づいて候補トークンを受け付け,SDを一般化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-28T04:25:42Z) - Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis [20.2271205957037]
Hyper-SDはODEトラジェクトリ保存と改革の利点を活かす新しいフレームワークである。
本稿では, 予め定義された時間ステップセグメント内で一貫した蒸留を行うために, トラジェクティブ・セグメンテッド・コンシスタンス蒸留を導入する。
人間のフィードバック学習を取り入れ、低段階のモデルの性能を高めるとともに、蒸留プロセスによって生じる性能損失を軽減する。
論文 参考訳(メタデータ) (2024-04-21T15:16:05Z) - A-SDM: Accelerating Stable Diffusion through Redundancy Removal and
Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。
次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。
第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。