論文の概要: PHASOR: Phase-Anchored Universal Action Representations for Humanoid Embodiments
- arxiv url: http://arxiv.org/abs/2606.01851v2
- Date: Tue, 02 Jun 2026 02:44:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 18:57:50.473952
- Title: PHASOR: Phase-Anchored Universal Action Representations for Humanoid Embodiments
- Title(参考訳): PHASOR:Humanoid Embodimentsのための相アンコール的ユニバーサルアクション表現
- Authors: Kihyun Kim, Chaeyun Kim, Jongho Shin, Taeyoun Kwon, Junghyun Kim, Mijin Koo, Haon Park,
- Abstract要約: 既存の方法は、アクションラテントを第一級表現ではなくタスク固有の中間体として扱う。
我々は、アクション埋め込み空間自体を第一級の設計ターゲットとして位置づけ、表現品質から下流のポリシー品質を生じさせる。
- 参考スコア(独自算出の注目度): 2.2496011156960756
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Learning a good action embedding space is fundamental to scalable robot policy learning, yet existing methods treat action latents as task-specific intermediates rather than first-class representations. The resulting latents are unstructured, embodiment-specific, and weakly tied to motion semantics, limiting interpretability, controllability, and transferability across robots. We position the action embedding space itself as a first-class design target, with downstream policy quality emerging from representation quality. Exploiting motion's intrinsic periodicity, we factorize it into a phase manifold that captures cyclic structure via FFT-parametric coefficients, together with a pose branch that conditions the manifold on non-periodic configuration detail. Combined with motion-semantic distillation, this factorized structure yields a cross-embodiment motion manifold that is interpretable and embodiment-agnostic by design. Anchoring multiple humanoid robots to a shared human-pretrained manifold then produces a unified action embedding space across diverse platforms, achieving strong cross-embodiment retrieval and consistent gains on downstream robot tasks.
- Abstract(参考訳): 優れたアクション埋め込み空間の学習は、スケーラブルなロボットポリシー学習の基礎となるが、既存の方法は、アクション潜伏者を第一級表現ではなくタスク固有の中間体として扱う。
結果として生じる潜伏剤は非構造的で、具体的であり、動作の意味論と弱い結びつきがあり、解釈可能性、制御可能性、ロボット間の移動可能性を制限する。
我々は、アクション埋め込み空間自体を第一級の設計ターゲットとして位置づけ、表現品質から下流のポリシー品質を生じさせる。
運動の固有の周期性を爆発させることで、FFT-パラメトリック係数を通して循環構造を捉える位相多様体に分解し、非周期的な構成の詳細について多様体を条件付けるポーズ分岐とする。
モーション・セマンティック蒸留と組み合わせて、この分解された構造は、設計によって解釈可能でエンボディメントに依存しないクロス・エボディメント運動多様体を生成する。
複数のヒューマノイドロボットを共用する多様体にアンコールすると、多様なプラットフォームにまたがる統一されたアクション埋め込み空間が生成され、下流のロボットタスクにおいて強力なクロス・エボディメント検索と一貫したゲインを達成する。
関連論文リスト
- TATIC: Task-Aware Temporal Learning for Human Intent Inference from Physical Corrections in Human-Robot Collaboration [3.4672098154671995]
ヒューマンロボットコラボレーション(HRC)では、ロボットは動的タスクの制約にオンラインで適応し、人間の意図を進化させなければならない。
本稿では,トルクベース接触力推定とタスク対応時間畳み込みネットワーク(TCN)を利用した個別タスクレベルの意図を推定する統合フレームワークTATICを提案する。
実験は意図認識において0.904 Macro-F1のスコアを獲得し、ハードウェアの検証に成功した。
論文 参考訳(メタデータ) (2026-03-10T21:19:25Z) - Structural Action Transformer for 3D Dexterous Manipulation [80.07649565189035]
クロス・エボディメント・スキル・トランスファーは、ハイDoFロボットハンドの課題である。
既存の手法は、しばしば2次元の観測と時間中心の行動表現に依存し、3次元の空間的関係を捉えるのに苦労する。
本稿では、構造中心の視点を導入することで、このパラダイムに挑戦する新しい3Dデクスタラスな操作ポリシーを提案する。
論文 参考訳(メタデータ) (2026-03-04T11:38:12Z) - TRACER: Texture-Robust Affordance Chain-of-Thought for Deformable-Object Refinement [37.77903164878976]
TRACER は Texture-Robust Affordance Chain-of- Thought with dEformable-object Refinement framework である。
セマンティック推論から外見が損なわれ、物理的に一貫した機能領域の洗練まで、階層横断的なマッピングを提供する。
Fine-AGDDO15データセットと実世界のロボットプラットフォームで実施された実験は、TRACERが精度を著しく向上することを示した。
論文 参考訳(メタデータ) (2026-01-28T03:12:18Z) - AdaMorph: Unified Motion Retargeting via Embodiment-Aware Adaptive Transformers [49.796014934503184]
本研究では、単一モデルで多様なロボット形態に人間の動きを適応させることができる統一型ニューラルネットワークフレームワークを提案する。
12個の異なるヒューマノイドロボットの実験結果から、AdaMorphが異種トポロジにわたって効果的に制御できることが示されている。
論文 参考訳(メタデータ) (2026-01-12T07:39:38Z) - Learning to Move in Rhythm: Task-Conditioned Motion Policies with Orbital Stability Guarantees [45.137864140049814]
我々は,学習した微分型エンコーダと超臨界ホップ分岐を結合したフレームワークであるOrbitally Stable Motion Primitives (OSMPs)を紹介する。
提案手法は,多種多様なロボットプラットフォームにまたがる広範囲なシミュレーションと実世界の実験によって検証される。
論文 参考訳(メタデータ) (2025-07-12T17:10:03Z) - Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [73.75271615101754]
本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文 参考訳(メタデータ) (2025-03-25T15:19:56Z) - Diffusion Transformer Policy [48.50988753948537]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。
トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文 参考訳(メタデータ) (2024-10-21T12:43:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。