論文の概要: Sparse ActionGen: Accelerating Diffusion Policy with Real-time Pruning
- arxiv url: http://arxiv.org/abs/2601.12894v1
- Date: Mon, 19 Jan 2026 09:50:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.843632
- Title: Sparse ActionGen: Accelerating Diffusion Policy with Real-time Pruning
- Title(参考訳): Sparse ActionGen: リアルタイムプルーニングによる拡散政策の高速化
- Authors: Kangye Ji, Yuan Meng, Zhou Jianbo, Ye Li, Hanyun Cui, Zhi Wang,
- Abstract要約: 拡散政策は、マルチモーダルな行動分布をモデル化する強力な能力のために、アクション生成を支配してきた。
我々は、非常にスパースなアクション生成のために$underlinetextbfS$parse $underlinetextbfA$ction$underlinetextbfG$enを提案する。
- 参考スコア(独自算出の注目度): 9.92274274871221
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diffusion Policy has dominated action generation due to its strong capabilities for modeling multi-modal action distributions, but its multi-step denoising processes make it impractical for real-time visuomotor control. Existing caching-based acceleration methods typically rely on $\textit{static}$ schedules that fail to adapt to the $\textit{dynamics}$ of robot-environment interactions, thereby leading to suboptimal performance. In this paper, we propose $\underline{\textbf{S}}$parse $\underline{\textbf{A}}$ction$\underline{\textbf{G}}$en ($\textbf{SAG}$) for extremely sparse action generation. To accommodate the iterative interactions, SAG customizes a rollout-adaptive prune-then-reuse mechanism that first identifies prunable computations globally and then reuses cached activations to substitute them during action diffusion. To capture the rollout dynamics, SAG parameterizes an observation-conditioned diffusion pruner for environment-aware adaptation and instantiates it with a highly parameter- and inference-efficient design for real-time prediction. Furthermore, SAG introduces a one-for-all reusing strategy that reuses activations across both timesteps and blocks in a zig-zag manner, minimizing the global redundancy. Extensive experiments on multiple robotic benchmarks demonstrate that SAG achieves up to 4$\times$ generation speedup without sacrificing performance. Project Page: https://sparse-actiongen.github.io/.
- Abstract(参考訳): 拡散政策はマルチモーダルな行動分布をモデル化する強力な能力によって行動生成を支配してきたが、その多段階のデノナイズプロセスは実時間ビズモータ制御において実用的ではない。
既存のキャッシュベースのアクセラレーションメソッドは、通常、$\textit{static}$スケジュールに依存する。
本稿では、非常にスパースなアクション生成のために、$\underline{\textbf{S}}$parse $\underline{\textbf{A}}$ction$\underline{\textbf{G}}$en$en$\textbf{SAG}$)を提案する。
反復的な相互作用に対応するため、SAGはロールアウト適応のPrune-then-reuseメカニズムをカスタマイズする。
ロールアウトダイナミクスを捉えるため、SAGは環境適応のための観察条件付き拡散プルーナーをパラメータ化し、リアルタイム予測のためのパラメータと推論効率の高い設計でインスタンス化する。
さらに、SAGは、Zig-zag方式で、タイムステップとブロックをまたいだアクティベーションを再利用し、グローバルな冗長性を最小化するワン・フォル・オール・リユース戦略を導入している。
複数のロボットベンチマークに関する大規模な実験は、SAGが性能を犠牲にすることなく最大4$\times$ジェネレーションスピードアップを達成することを示した。
Project Page: https://sparse-actiongen.github.io/.com
関連論文リスト
- SCOPE: Prompt Evolution for Enhancing Agent Effectiveness [53.75986399936395]
大規模言語モデル(LLM)エージェントは、大規模で動的なコンテキストを生成する環境にますますデプロイされている。
エージェントはこのコンテキストにアクセスできますが、静的なプロンプトには効果的に管理するメカニズムがありません。
textbfSCOPE (Self-evolving Context Optimization via Prompt Evolution) を導入する。
本稿では,戦術的特異性(即時誤りの解消)と戦略的汎用性(長期原則の進化)のバランスをとるデュアルストリーム機構を提案する。
論文 参考訳(メタデータ) (2025-12-17T12:25:05Z) - On Geometric Structures for Policy Parameterization in Continuous Control [7.056222499095849]
本稿では,単位多様体上での演算による構造的利点を保った,計算効率の良いアクション生成パラダイムを提案する。
本手法は,動作を決定論的方向ベクトルと学習可能な濃度に分解し,目標方向と一様雑音との効率性を実現する。
実証的に、我々の手法は標準的な連続制御ベンチマークで最先端の手法と一致するか超えている。
論文 参考訳(メタデータ) (2025-11-11T13:32:38Z) - Improving Generative Behavior Cloning via Self-Guidance and Adaptive Chunking [29.920087317401396]
ジェネレーティブ・ビヘイビア・クローン(Generative Behavior Cloning)は、ロボット学習のためのシンプルで効果的なフレームワークである。
拡散政策の一貫性と反応性を高めるための2つの新しい手法を提案する。
提案手法は,多種多様なシミュレーションおよび実世界のロボット操作タスクにおいて,GBCの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2025-10-14T11:16:34Z) - OmniSAT: Compact Action Token, Faster Auto Regression [70.70037017501357]
我々は、コンパクトで転送可能なアクション表現を学ぶOmni Swift Action Tokenizerを紹介する。
その結果、離散トークン化はトレーニングシーケンスを6.8$times$に短縮し、ターゲットエントロピーを低下させる。
論文 参考訳(メタデータ) (2025-10-08T03:55:24Z) - Action-aware Dynamic Pruning for Efficient Vision-Language-Action Manipulation [27.007611140797852]
既存の手法では、VLAモデル内の視覚的冗長性を低減し、推論速度を最適化する。
textbfAction-aware textbfDynamic textbfPruning (textbfADP)を提案する。
論文 参考訳(メタデータ) (2025-09-26T09:13:02Z) - Self-Guided Action Diffusion [53.38661283705301]
自己誘導的行動拡散は、拡散に基づくポリシーに適した双方向デコーディングのより効率的な変種である。
本手法は,従来の動的タスクよりも最大70%高い成功率を達成する。
論文 参考訳(メタデータ) (2025-08-17T00:39:15Z) - Real-Time Execution of Action Chunking Flow Policies [49.1574468325115]
本稿では,アクションインタラクションシステムの非同期実行を可能にする新しい推論時アルゴリズムを提案する。
これは、再トレーニングなしでボックスから実行する拡散またはVLAベースのシステムに適用できる。
その結果、RTCは高速で、性能が高く、推論操作に対して一意に堅牢であることがわかった。
論文 参考訳(メタデータ) (2025-06-09T01:01:59Z) - Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [54.67512489842682]
大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。
LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文 参考訳(メタデータ) (2025-05-23T08:23:36Z) - Cracking the Code of Action: a Generative Approach to Affordances for Reinforcement Learning [33.790048240113165]
本研究では,専門家の行動に限定的あるいは全くアクセスできない低データ体制について考察する。
我々は、Generative Affordances$(textbf$textttCoGA$)$として$textbfCodeを提案する。
エージェントが考慮しなければならないアクションの数を大幅に削減することで、MiniWob++ベンチマークで幅広いタスクを実演する。
論文 参考訳(メタデータ) (2025-04-24T06:20:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。