論文の概要: Humanoid Hanoi: Investigating Shared Whole-Body Control for Skill-Based Box Rearrangement
- arxiv url: http://arxiv.org/abs/2602.13850v3
- Date: Mon, 23 Feb 2026 07:14:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.467035
- Title: Humanoid Hanoi: Investigating Shared Whole-Body Control for Skill-Based Box Rearrangement
- Title(参考訳): Humanoid Hanoi: スキルベースボックス再構成のための共有全身制御の検討
- Authors: Minku Kim, Kuan-Chia Chen, Aayam Shrestha, Li Fuxin, Stefan Lee, Alan Fern,
- Abstract要約: 本研究では,タスクレベルで再利用可能なスキルをシーケンシングすることで,長期実行を可能にするヒューマノイドボックス再構成のためのスキルベースフレームワークについて検討する。
すべてのスキルは、共有されたタスクに依存しない全身コントローラ(WBC)を通して実行され、スキル構成のための一貫したクローズドループインターフェースを提供する。
本研究は,Digit V3ヒューマノイドロボットのシミュレーションおよび実験結果について報告する。
- 参考スコア(独自算出の注目度): 20.89088614661249
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate a skill-based framework for humanoid box rearrangement that enables long-horizon execution by sequencing reusable skills at the task level. In our architecture, all skills execute through a shared, task-agnostic whole-body controller (WBC), providing a consistent closed-loop interface for skill composition, in contrast to non-shared designs that use separate low-level controllers per skill. We find that naively reusing the same pretrained WBC can reduce robustness over long horizons, as new skills and their compositions induce shifted state and command distributions. We address this with a simple data aggregation procedure that augments shared-WBC training with rollouts from closed-loop skill execution under domain randomization. To evaluate the approach, we introduce Humanoid Hanoi, a long-horizon Tower-of-Hanoi box rearrangement benchmark, and report results in simulation and on the Digit V3 humanoid robot, demonstrating fully autonomous rearrangement over extended horizons and quantifying the benefits of the shared-WBC approach over non-shared baselines. Project page: https://osudrl.github.io/Humanoid_Hanoi/
- Abstract(参考訳): 本研究では,タスクレベルで再利用可能なスキルをシーケンシングすることで,長期実行を可能にするヒューマノイドボックス再構成のためのスキルベースフレームワークについて検討する。
我々のアーキテクチャでは、すべてのスキルがタスク非依存の全身コントローラ(WBC)を介して実行され、スキル構成のための一貫したクローズドループインターフェースを提供する。
同じ事前訓練されたWBCを鼻で再利用することで、新しいスキルとその構成が変化した状態とコマンドの分布を誘導するので、長い地平線上での堅牢性を低下させることができる。
ドメインランダム化下でのクローズドループスキル実行によるロールアウトにより、共有WBCトレーニングを増強する単純なデータアグリゲーション手順で、この問題に対処する。
提案手法を評価するために,Humanoid Hanoiという長方形タワー・オブ・ハノイボックス再構成ベンチマークを導入し,シミュレーション結果とDigi V3ヒューマノイドロボット上での報告を行い,拡張地平線上の完全自律的再配置を実証し,非共有ベースラインに対する共有WBCアプローチの利点を定量化する。
プロジェクトページ: https://osudrl.github.io/Humanoid_Hanoi/
関連論文リスト
- AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots [92.18094199070693]
現実世界のロボットタスクは、長い水平、多段階の問題解決を伴い、継続的なスキル獲得のために一般化を必要とすることが多い。
我々は、タスクレベルの計画、アトミックスキルの抽象化、きめ細かいアクションを共同で生成する統合計画実行フレームワークAtomicVLAを提案する。
シミュレーションでは、AtomicVLAはLIBEROで$_0$2.4%、LIBERO-LONGで10%、CALVINで$_0$と$_0.5$0.22、平均タスク長0.25よりパフォーマンスが良い。
論文 参考訳(メタデータ) (2026-03-08T14:18:56Z) - SPIRE: Conditional Personalization for Federated Diffusion Generative Models [7.8583640700306585]
Shared Backbone Personal Identity Representation Embeddings (SPIRE)は、FLで条件付き生成としてクライアント拡散ベースの生成をキャストするフレームワークである。
SPIREは、ネットワークを(i)人口レベルのスコア関数を学習する高容量なグローバルバックボーンと、(ii)ローカルデータ統計を符号化する軽量で学習可能なクライアント埋め込みに分解する。
我々の分析は、クライアントの埋め込みが共有スコアネットワークをパーソナライズするバイアスとしてどのように振舞うかを示唆している。
論文 参考訳(メタデータ) (2025-06-14T01:40:31Z) - A Backbone for Long-Horizon Robot Task Understanding [8.889888977376886]
Therblig-Based Backbone Framework (TBBF)は、ロボットシステムにおける解釈可能性、データ効率、一般化を強化する構造である。
TBBFは、専門家によるデモンストレーションを利用して、rbligレベルのタスク分解を可能にする。
オフライントレーニングの段階において,正確なソルビグセグメンテーションのためのMeta-RGate SynerFusionネットワークを開発した。
オンラインテストの段階では、新しいタスクのワンショットデモが収集された後、MGSFネットワークは高いレベルの知識を抽出する。
論文 参考訳(メタデータ) (2024-08-02T15:32:42Z) - HumanBench: Towards General Human-centric Perception with Projector
Assisted Pretraining [75.1086193340286]
汎用的な人中心下流作業のための一般的な事前訓練モデルを持つことが望ましい。
本研究では,既存のデータセットをベースとしたtextbfHumanBench を提案する。
我々のPATHは、17の下流データセットと他の2つのデータセットの中間結果に対して、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2023-03-10T02:57:07Z) - Centralizing State-Values in Dueling Networks for Multi-Robot
Reinforcement Learning Mapless Navigation [87.85646257351212]
本稿では,CTDE(Training and Decentralized Execution)パラダイムにおけるマルチロボットマップレスナビゲーションの問題点について考察する。
この問題は、各ロボットが観察を他のロボットと明示的に共有することなく、その経路を考えると困難である。
我々は,集中型状態値ネットワークを用いて共同状態値を計算するCTDEの新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-16T16:47:00Z) - AutoBERT-Zero: Evolving BERT Backbone from Scratch [94.89102524181986]
そこで本稿では,提案するハイブリッドバックボーンアーキテクチャを自動検索するOP-NASアルゴリズムを提案する。
提案するOP-NASの効率を向上させるために,探索アルゴリズムと候補モデルの評価を最適化する。
実験の結果、検索されたアーキテクチャ(AutoBERT-Zero)は、様々な下流タスクにおいてBERTとそのバリエーションの異なるモデル容量を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-07-15T16:46:01Z) - Improved Branch and Bound for Neural Network Verification via Lagrangian
Decomposition [161.09660864941603]
ニューラルネットワークの入出力特性を公式に証明するためのブランチとバウンド(BaB)アルゴリズムのスケーラビリティを改善します。
活性化に基づく新しい分岐戦略とBaBフレームワークであるブランチとデュアルネットワーク境界(BaDNB)を提案する。
BaDNBは、従来の完全検証システムを大きなマージンで上回り、対数特性で平均検証時間を最大50倍に削減した。
論文 参考訳(メタデータ) (2021-04-14T09:22:42Z) - Diverse Branch Block: Building a Convolution as an Inception-like Unit [123.59890802196797]
畳み込みニューラルネットワーク(Convolutional Neural Network、ConvNet)のユニバーサルビルディングブロックを提案し、推論時間コストなしでパフォーマンスを向上させる。
Diverse Branch Block(DBB)は、異なるスケールと複雑さの多様なブランチを組み合わせることで、単一の畳み込みの表現能力を高めます。
トレーニング後、DBBを単一のConv層に等価に変換してデプロイすることができる。
論文 参考訳(メタデータ) (2021-03-24T18:12:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。