論文の概要: LessMimic: Long-Horizon Humanoid Interaction with Unified Distance Field Representations
- arxiv url: http://arxiv.org/abs/2602.21723v1
- Date: Wed, 25 Feb 2026 09:31:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.70427
- Title: LessMimic: Long-Horizon Humanoid Interaction with Unified Distance Field Representations
- Title(参考訳): LessMimic: Unified Distance Field Representationを用いた長距離ヒューマノイドインタラクション
- Authors: Yutang Lin, Jieming Cui, Yixuan Li, Baoxiong Jia, Yixin Zhu, Siyuan Huang,
- Abstract要約: 距離場(Distance Field)は、基準のない推論、幾何学的一般化、および1つのポリシーにおける長距離スキル構成を表す。
LessMimicは、非構造環境の障害を一般化し、スキルを構築し、回復するヒューマノイドロボットへのスケーラブルなパスを提供する。
- 参考スコア(独自算出の注目度): 36.40622644347312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid robots that autonomously interact with physical environments over extended horizons represent a central goal of embodied intelligence. Existing approaches rely on reference motions or task-specific rewards, tightly coupling policies to particular object geometries and precluding multi-skill generalization within a single framework. A unified interaction representation enabling reference-free inference, geometric generalization, and long-horizon skill composition within one policy remains an open challenge. Here we show that Distance Field (DF) provides such a representation: LessMimic conditions a single whole-body policy on DF-derived geometric cues--surface distances, gradients, and velocity decompositions--removing the need for motion references, with interaction latents encoded via a Variational Auto-Encoder (VAE) and post-trained using Adversarial Interaction Priors (AIP) under Reinforcement Learning (RL). Through DAgger-style distillation that aligns DF latents with egocentric depth features, LessMimic further transfers seamlessly to vision-only deployment without motion capture (MoCap) infrastructure. A single LessMimic policy achieves 80--100% success across object scales from 0.4x to 1.6x on PickUp and SitStand where baselines degrade sharply, attains 62.1% success on 5 task instances trajectories, and remains viable up to 40 sequentially composed tasks. By grounding interaction in local geometry rather than demonstrations, LessMimic offers a scalable path toward humanoid robots that generalize, compose skills, and recover from failures in unstructured environments.
- Abstract(参考訳): 地平線を越えて物理的環境と自律的に対話するヒューマノイドロボットは、インテリジェンスを具現化する中心的な目標である。
既存のアプローチでは、参照動作やタスク固有の報酬、特定のオブジェクトジオメトリへの密結合ポリシー、単一のフレームワーク内でのマルチスキルの一般化を前提としています。
参照のない推論、幾何学的一般化、一つのポリシー内での長距離スキル構成を可能にする統一された相互作用表現は、未解決の課題である。
ここでは、距離場(DF)がこのような表現を提供することを示す: 最小限の条件は、DF由来の幾何学的手がかり(表面距離、勾配、速度分解)に対する単一の全身ポリシーであり、動き参照の必要性を排除し、ラバーショナルオートエンコーダ(VAE)を介してコード化され、Reinforcement Learning(RL)の下で対数的相互作用優先(AIP)を用いて後訓練される。
DF潜水剤をエゴセントリックな深度特徴と整合させるDAggerスタイルの蒸留を通じて、LesMimicはモーションキャプチャー(MoCap)インフラストラクチャーを使わずに、視覚のみのデプロイメントにシームレスに移行する。
LessMimicのポリシーは、PickUpとSitStandで0.4xから1.6倍のオブジェクトスケールで80-100%成功し、ベースラインは急激に低下し、5つのタスクインスタンスのトラジェクトリで62.1%成功し、最大40のシーケンシャルな構成タスクが実行可能である。
デモではなく、局所幾何学の相互作用を基盤にすることで、LesMimicは、非構造化環境での失敗を一般化し、スキルを構成し、回復するヒューマノイドロボットへのスケーラブルな道を提供する。
関連論文リスト
- ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - MolmoSpaces: A Large-Scale Open Ecosystem for Robot Navigation and Manipulation [56.30931340537373]
MolmoSpacesは、ロボットポリシーのベンチマークをサポートするための、完全にオープンなエコシステムである。
MolmoSpacesは230万以上の屋内環境で構成されている。
MolmoSpaces-Benchは8つのタスクのベンチマークスイートで、ロボットが私たちの多様なシーンとリッチな注釈付きオブジェクトと対話する。
論文 参考訳(メタデータ) (2026-02-11T20:16:31Z) - Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。
物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。
ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文 参考訳(メタデータ) (2026-01-13T23:36:30Z) - CIS-BA: Continuous Interaction Space Based Backdoor Attack for Object Detection in the Real-World [10.969593776020757]
静的なオブジェクト特徴から連続的なオブジェクト間相互作用パターンにシフトすることでトリガ設計を再定義する新しいバックドアアタックパラダイムを提案する。
これらのパターンを連続的な相互作用空間としてモデル化することにより、CIS-BAは、初めてマルチトリガー・マルチオブジェクト攻撃機構を可能にする空間トリガーを導入する。
CIS-BAは、複雑な環境下で97%以上の攻撃を成功させ、動的マルチトリガー条件下で95%以上の有効性を維持する。
論文 参考訳(メタデータ) (2025-12-16T07:37:46Z) - OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-Body Loco-Manipulation and Scene Interaction [76.44108003274955]
ヒューマノイドロボットの複雑なスキルを教えるための主要なパラダイムは、強化学習ポリシーの運動学的参照として人間の動きを再ターゲットすることである。
インタラクションメッシュに基づくインタラクション保存データ生成エンジンであるOmniRetargetを紹介する。
人間のメッシュとロボットメッシュの間のラプラシアの変形を最小限にすることで、OmniRetargetは運動学的に実現可能な軌道を生成する。
論文 参考訳(メタデータ) (2025-09-30T17:59:02Z) - InterMimic: Towards Universal Whole-Body Control for Physics-Based Human-Object Interactions [27.225777494300775]
このフレームワークは、単一のポリシーで、何時間も不完全なMoCapデータからしっかりと学習することができる。
実験の結果,InterMimicは複数のHOIデータセットにまたがって,現実的で多様なインタラクションを生成できることがわかった。
論文 参考訳(メタデータ) (2025-02-27T18:59:12Z) - Outlier-Robust Long-Term Robotic Mapping Leveraging Ground Segmentation [1.7948767405202701]
箱から出られる堅牢な長期ロボットマッピングシステムを提案する。
i) 外れ値の存在を否定する高速で頑健な接地分割を提案する。
粗悪なアウトリールの存在を包含する地盤セグメンテーションによるロバストな登録を提案する。
論文 参考訳(メタデータ) (2024-05-18T04:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。