Fugu-MT 論文翻訳(概要): STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization

論文の概要: STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization

arxiv url: http://arxiv.org/abs/2506.03863v2
Date: Wed, 11 Jun 2025 13:50:28 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-13 02:07:43.253108
Title: STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization
Title（参考訳）: STAR:回転ベクトル量子化による異種ロボットスキル抽象化の学習
Authors: Hao Li, Qi Lv, Rui Shao, Xiang Deng, Yinchuan Li, Jianye Hao, Liqiang Nie,
Abstract要約: textbfSkill textbfTraining with textbfAugmented textbfRotation (textbfSTAR) は、スキル学習と構成の両方を進化させて複雑な振る舞いを完遂するフレームワークである。
参考スコア（独自算出の注目度）: 87.77475595961154
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Transforming complex actions into discrete skill abstractions has demonstrated strong potential for robotic manipulation. Existing approaches mainly leverage latent variable models, e.g., VQ-VAE, to learn skill abstractions through learned vectors (codebooks), while they suffer from codebook collapse and modeling the causal relationship between learned skills. To address these limitations, we present \textbf{S}kill \textbf{T}raining with \textbf{A}ugmented \textbf{R}otation (\textbf{STAR}), a framework that advances both skill learning and composition to complete complex behaviors. Specifically, to prevent codebook collapse, we devise rotation-augmented residual skill quantization (RaRSQ). It encodes relative angles between encoder outputs into the gradient flow by rotation-based gradient mechanism. Points within the same skill code are forced to be either pushed apart or pulled closer together depending on gradient directions. Further, to capture the causal relationship between skills, we present causal skill transformer (CST) which explicitly models dependencies between skill representations through an autoregressive mechanism for coherent action generation. Extensive experiments demonstrate the superiority of STAR on both LIBERO benchmark and realworld tasks, with around 12\% improvement over the baselines.
Abstract（参考訳）: 複雑なアクションを個別のスキル抽象化に変換することは、ロボット操作の強力な可能性を示している。既存のアプローチは主に潜伏変数モデル(例えばVQ-VAE)を利用して学習ベクトル(コードブック)を通してスキルの抽象化を学ぶが、コードブックの崩壊や学習スキル間の因果関係のモデル化に苦しむ。これらの制限に対処するために、スキル学習と構成の両方を進化させ、複雑な振る舞いを完了させるフレームワークである \textbf{A}ugmented \textbf{R}otation (\textbf{STAR}) を用いた \textbf{S}kill \textbf{T}rainingを示す。具体的には,コードブックの崩壊を防止するために,回転強化残留スキル量子化(RaRSQ)を提案する。エンコーダ出力間の相対角度を回転ベース勾配機構により勾配流に符号化する。同じスキルコード内のポイントは、勾配の方向に応じて、押し離されるか、より深く引かれるように強制されます。さらに、スキル間の因果関係を捉えるために、コヒーレントアクション生成のための自己回帰機構を通じて、スキル表現間の依存関係を明示的にモデル化する因果スキル変換器(CST)を提案する。 LIBEROベンチマークと実世界のタスクの両方においてSTARが優れていることを示し、ベースラインよりも約12倍改善されている。

関連論文リスト

SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning [83.98129545309277]
生経験と政策改善のギャップを埋めるフレームワークであるSkillRLを提案する。本手法では,階層型スキルライブラリであるSkillBankを構築するために,経験に基づく蒸留機構を導入する。 ALF、WebShop、および7つの検索強化タスクの実験結果は、SkillRLが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2026-02-09T03:17:17Z)
Offline Discovery of Interpretable Skills from Multi-Task Trajectories [8.119611773942562]
オフラインスキル発見と階層的模倣のための3段階のエンドツーエンド学習フレームワークであるLOKIを紹介する。 LOKIは、挑戦的なD4RL Kitchenベンチマークで高い成功率を獲得し、標準のHILベースラインを上回っている。
論文参考訳（メタデータ） (2026-02-01T05:03:58Z)
SimStep: Chain-of-Abstractions for Incremental Specification and Debugging of AI-Generated Interactive Simulations [16.00479720281197]
CoA(Chain-of-Abstractions)は、プログラミングの中核的な能力を取り戻す方法である。 CoAは、合成プロセスを認知的に意味のある、タスクに沿った一連の表現に分解する。 SimStepは4つの中間抽象化を通じてシミュレーションを作成する教師のためのオーサリング環境である。
論文参考訳（メタデータ） (2025-07-13T14:54:17Z)
Factorized Visual Tokenization and Generation [37.56136469262736]
本稿では,大規模なコードブックを複数の独立したサブコードブックに分解することで,VQベースのトークン化を活性化する新しい手法であるFacterized Quantization(FQ)を紹介する。このファクター化は、大規模なコードブックのルックアップの複雑さを低減し、より効率的でスケーラブルなビジュアルトークン化を可能にします。実験により,提案したFQGANモデルにより,視覚トークンの再現品質が大幅に向上し,最先端の性能が達成された。
論文参考訳（メタデータ） (2024-11-25T18:59:53Z)
Skill Transfer and Discovery for Sim-to-Real Learning: A Representation-Based Viewpoint [13.28437541072843]
表現学習を用いたロボット制御の文脈において,シミュレート・トゥ・リアルなスキル伝達と発見について検討した。本研究では,実世界のデータから,シム・トゥ・リアルのギャップに起因する新たなスキルを学習する技術発見アルゴリズムを提案する。我々のスキル発見アプローチは、sim-to-realギャップを狭め、現実世界のコントローラのパフォーマンスを最大30.2%向上させるのに役立つ。
論文参考訳（メタデータ） (2024-04-07T19:22:51Z)
SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution [75.2573501625811]
拡散モデルは、ロボット軌道計画の強力な可能性を示している。高レベルの命令からコヒーレントな軌道を生成することは依然として困難である。エンド・ツー・エンドの階層的計画フレームワークであるSkillDiffuserを提案する。
論文参考訳（メタデータ） (2023-12-18T18:16:52Z)
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning [68.16998247593209]
オフライン強化学習(RL)パラダイムは、静的な行動データセットを、データを収集したポリシーよりも優れたパフォーマンスのポリシーに変換するためのレシピを提供する。本稿では,アクション量子化のための適応型スキームを提案する。 IQL,CQL,BRACといった最先端のオフラインRL手法が,提案手法と組み合わせることで,ベンチマークのパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2023-10-18T06:07:10Z)
CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文参考訳（メタデータ） (2023-06-05T20:39:08Z)
Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。 i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文参考訳（メタデータ） (2020-10-11T01:40:03Z)
Learning and Sequencing of Object-Centric Manipulation Skills for Industrial Tasks [16.308562047398542]
本稿では,オブジェクト中心の隠れセミマルコフモデルを用いて,ロボットのスキルシーケンスを高速に符号化するアルゴリズムを提案する。学習したスキルモデルは、多モーダルな(時間的および空間的な)軌道分布を符号化することができる。本研究では,産業用組立作業用ロボットアーム7台について実演する。
論文参考訳（メタデータ） (2020-08-24T14:20:05Z)
Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文参考訳（メタデータ） (2020-07-17T21:50:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。