論文の概要: PoLAR: Factorizing Extent and Mode in Latent Actions for Robot Policy Learning
- arxiv url: http://arxiv.org/abs/2606.21139v1
- Date: Fri, 19 Jun 2026 06:24:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 08:01:57.279009
- Title: PoLAR: Factorizing Extent and Mode in Latent Actions for Robot Policy Learning
- Title(参考訳): PoLAR:ロボット政策学習における潜在行動の要因とモード
- Authors: Youngjoon Jeong, Jihwan Yu, Minsoo Jo, Junha Chun, Taesup Kim,
- Abstract要約: 潜在的行動事前訓練は、一対の観察から視覚変化の表現を学ぶ。
放射状構造を持つ極性潜伏作用 (PoLAR) を導入し, 潜伏作用に放射状指向構造を課す。
PoLARはシミュレーションおよび実世界のロボット実験における下流ポリシー性能を改善する。
- 参考スコア(独自算出の注目度): 7.207198416919797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Latent action pretraining learns representations of visual change from pairs of observations, but existing methods typically encode each transition as a single unstructured representation that entangles transition extent and transition mode. We introduce Polar Latent Actions with Radial structure (PoLAR), which imposes a radial-direction structure on latent actions, encouraging radius to encode transition extent and direction to retain transition mode. PoLAR uses temporal offset between two observations as a weak proxy for transition extent, encouraging latent action from observation pairs separated by larger temporal gaps to occupy larger radii. We instantiate this structure in hyperbolic space, whose expanding volume with radius offers a natural fit for more diverse transition modes at larger extents. Across in-task and large-scale pretraining settings, PoLAR improves downstream policy performance in simulation and real-world robot experiments, outperforming latent action baselines and strong pretrained VLAs. These results suggest that the geometry of the latent action space is an important design choice for transferring visual pretraining to downstream robot policy learning.
- Abstract(参考訳): 潜在行動事前訓練は、一対の観測から視覚変化の表現を学ぶが、既存の手法では、遷移範囲と遷移モードを絡める単一の非構造化表現として、各遷移を符号化する。
我々は、ラジアル構造を持つ極遅延作用(PoLAR)を導入し、ラジアル方向構造を潜在作用に課し、遷移範囲と方向をエンコードして遷移モードを維持するように半径を奨励する。
PoLARは、2つの観測間の時間的オフセットを遷移範囲の弱いプロキシとして使用し、より大きな時間的ギャップによって分離された観測対からの潜伏作用を促進し、より大きな半径を占有する。
我々はこの構造を双曲空間でインスタンス化し、半径を持つ膨張体積はより多様な遷移モードに対してより広い範囲で自然に適合する。
タスク内および大規模事前トレーニング設定全体において、PoLARはシミュレーションおよび実世界のロボット実験における下流ポリシー性能を改善し、潜伏したアクションベースラインと強い事前訓練されたVLAを上回っている。
これらの結果から,潜伏行動空間の幾何学は,下流のロボットポリシー学習に視覚的事前学習を移すための重要な設計選択であることが示唆された。
関連論文リスト
- Deriving Hyperparameter Scaling Laws via Modern Optimization Theory [55.63126290312615]
線形最小化Oracle(LMO)に基づく手法の最近の一階境界について検討する。
近年の文献のバウンダリをプロキシとして扱い、異なるチューニング規則をまたいでそれらを最小化することで、学習率、運動量、バッチサイズに関するクローズドフォームのパワーロースケジュールが得られる。
本研究の結果は, 運動量とバッチサイズスケーリングの相互作用に特に注意を払っており, いくつかのスケーリング戦略によって最適性能が達成される可能性が示唆された。
論文 参考訳(メタデータ) (2026-03-16T22:21:27Z) - Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [73.75271615101754]
本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文 参考訳(メタデータ) (2025-03-25T15:19:56Z) - Diffusion Transformer Policy [48.50988753948537]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。
トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文 参考訳(メタデータ) (2024-10-21T12:43:54Z) - A Hierarchical Hybrid Learning Framework for Multi-agent Trajectory
Prediction [4.181632607997678]
深層学習(DL)と強化学習(RL)の階層的ハイブリッドフレームワークを提案する。
DLの段階では、トラフィックシーンは、トランスフォーマースタイルのGNNが異種相互作用を符号化するために採用される複数の中間スケールの異種グラフに分割される。
RLの段階では、DLの段階で予測される重要な将来点を利用して、交通シーンを局所的なサブシーンに分割する。
論文 参考訳(メタデータ) (2023-03-22T02:47:42Z) - Generalization in Visual Reinforcement Learning with the Reward Sequence
Distribution [98.67737684075587]
部分的に観察されたマルコフ決定過程(POMDP)の一般化は視覚強化学習(VRL)の成功に不可欠である
開始観測に基づく報酬系列分布と事前定義された後続行動系列(RSD-OA)を提案する。
実験により, RSD-OAに基づく表現学習手法は, 目に見えない環境における一般化性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-02-19T15:47:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。