論文の概要: SixthSense: Task-Agnostic Proprioception-Only Whole-Body Wrench Estimation for Humanoids
- arxiv url: http://arxiv.org/abs/2605.01427v1
- Date: Sat, 02 May 2026 12:57:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.766456
- Title: SixthSense: Task-Agnostic Proprioception-Only Whole-Body Wrench Estimation for Humanoids
- Title(参考訳): 六感:タスク非依存の先入観--ヒューマノイドの全身的 Wrench 推定
- Authors: Xingzhou Chen, Xiayan Xu, Yan Ning, Jiyu Yu, Yizheng Zhang, Siyi Qian, Lingzhu Xiang, Jiahao Chen, Yuquan Wang, Haodong Zhang, Ling Shi,
- Abstract要約: SixthSenseは、プロプレセプションとIMUデータだけで、全身の接触タイミング、位置、レンチを推測する。
衝突検出、物理的人間-ロボット相互作用、フォースフィードバック遠隔操作などのアプリケーションのためのプラグアンドプレイ認識モジュールとして機能する。
- 参考スコア(独自算出の注目度): 13.456157050156643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid robots are entering our physical world at scale, yet as oversized toys--good at singing and dancing, but short on force-interaction capabilities for practical tasks. Bridging this gap necessitates prioritizing reliable contact perception as a fundamental requirement. Estimating external wrenches in humanoids is complicated by floating-base dynamics and indeterminate contact locations. Existing analytical frameworks require idealistic assumptions and hard-to-obtain measurements, which are often unavailable in practice. To bridge this gap, we propose SixthSense, a task-agnostic approach that infers whole-body contact timing, location, and wrenches from proprioception and IMU data alone. To capture the multi-modal dynamics between unstructured contact inputs and the uncertain motion outputs, we employ conditional flow matching to tokenize proprioceptive histories and estimate a spatiotemporally sparse contact-event flow. SixthSense serves as a plug-and-play perception module for applications including collision detection, physical human-robot interaction, and force-feedback teleoperation. Experiments across standing, walking, and whole-body motion-tracking policies showcased unprecedented performance in diverse behaviors.
- Abstract(参考訳): ヒューマノイドロボットは、大きめのおもちゃとして、私たちの物理的世界に入ってきています。
このギャップを埋めるには、信頼性の高い接触認識を基本的な要件として優先順位付けする必要がある。
ヒューマノイドにおける外部レンチの推定は、浮動小数点と不定点接触位置によって複雑である。
既存の分析フレームワークでは、理想主義的な仮定と、実際は利用できない難しい測定が必要である。
このギャップを埋めるため,プロプリセプションとIMUデータのみから全身の接触タイミング,位置,レンチを推定するタスク非依存の手法であるSixthSenseを提案する。
本研究では,非構造接触入力と不確実な運動出力のマルチモーダルダイナミクスを捉えるために,条件付きフローマッチングを用いて,固有受容履歴をトークン化し,時空間的にスパースな接触イベントフローを推定する。
SixthSenseは、衝突検出、物理的人間-ロボット相互作用、フォースフィードバック遠隔操作を含むアプリケーションのためのプラグアンドプレイ認識モジュールとして機能する。
立位、歩行、体全体の運動追跡政策にわたる実験は、様々な行動において前例のないパフォーマンスを示した。
関連論文リスト
- Unleashing Guidance Without Classifiers for Human-Object Interaction Animation [54.24065561632133]
従来の拡散に基づくアプローチは、しばしば接触品質を改善するために手作りの接触先行や人為的なキネマティック制約に頼っている。
そこで本研究では,手作業による事前設計への依存を軽減し,手作業による指導を段階的に行うデータ駆動型代替手法を提案する。
このデータ駆動型ガイダンスは本質的に接触認識であり,広い範囲の合成対象測地でトレーニングを行う際に拡張可能である。
論文 参考訳(メタデータ) (2026-03-26T17:59:34Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Learning Whole-Body Human-Humanoid Interaction from Human-Human Demonstrations [63.80827184637476]
D-STAR(D-STAR)は,行動すべき場所から行動すべき場所を乱す階層的な政策である。
広範かつ厳密なシミュレーションを通じて、我々のフレームワークを検証する。
論文 参考訳(メタデータ) (2026-01-14T14:37:06Z) - EscherVerse: An Open World Benchmark and Dataset for Teleo-Spatial Intelligence with Physical-Dynamic and Intent-Driven Understanding [56.89359230139883]
本稿では,Teleo-Spatial Intelligence(TSI)について紹介する。
本稿では、大規模なオープンワールドベンチマーク(Escher-Bench)、データセット(Escher-35k)、モデル(Escherシリーズ)からなるEscherVerseを紹介する。
これはIntent-Driven Reasoningを体系的に評価する最初のベンチマークである。
論文 参考訳(メタデータ) (2026-01-04T14:42:39Z) - HHI-Assist: A Dataset and Benchmark of Human-Human Interaction in Physical Assistance Scenario [63.77482302352545]
HHI-Assist(ヒヒ・アシスト)は、人間の介助作業における人間のインタラクションのモーションキャプチャークリップからなるデータセットである。
私たちの研究は、ロボット支援ポリシーを大幅に強化する可能性がある。
論文 参考訳(メタデータ) (2025-09-12T09:38:17Z) - AdaAfford: Learning to Adapt Manipulation Affordance for 3D Articulated
Objects via Few-shot Interactions [13.802675708793014]
キャビネット、ドア、蛇口などの3D音声による物体の認識と相互作用は、将来のホームアシストロボットに特別な課題をもたらす。
我々はAdaAffordという名の新しいフレームワークを提案し、より正確なインスタンス固有の後付けに手軽さを迅速に適応するために、ごく少数のテスト時間インタラクションを実行することを学習する。
論文 参考訳(メタデータ) (2021-12-01T03:00:05Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。