論文の概要: Bi-HIL: Bilateral Control-Based Multimodal Hierarchical Imitation Learning via Subtask-Level Progress Rate and Keyframe Memory for Long-Horizon Contact-Rich Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2603.13315v1
- Date: Wed, 04 Mar 2026 09:16:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:47.881828
- Title: Bi-HIL: Bilateral Control-Based Multimodal Hierarchical Imitation Learning via Subtask-Level Progress Rate and Keyframe Memory for Long-Horizon Contact-Rich Robotic Manipulation
- Title(参考訳): Bi-HIL: 双方向制御に基づくマルチモーダル階層的模倣学習
- Authors: Thanpimon Buamanee, Masato Kobayashi, Yuki Uranishi,
- Abstract要約: 長期間の接触に富むロボット操作は、観測可能性と不安定なサブタスク遷移のために困難である。
双方向制御に基づく多モード階層型模倣学習フレームワークBi-HILを提案する。
- 参考スコア(独自算出の注目度): 1.552282932199974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-horizon contact-rich robotic manipulation remains challenging due to partial observability and unstable subtask transitions under contact uncertainty. While hierarchical architectures improve temporal reasoning and bilateral imitation learning enables force-aware control, existing approaches often rely on flat policies that struggle with long-horizon coordination. We propose Bi-HIL, a bilateral control-based multimodal hierarchical imitation learning framework for long-horizon manipulation. Bi-HIL stabilizes hierarchical coordination by integrating keyframe memory with subtask-level progress rate that models phase progression within the active subtask and conditions both high- and low-level policies. We evaluate Bi-HIL on unimanual and bimanual real-robot tasks, demonstrating consistent improvements over flat and ablated variants. The results highlight the importance of explicitly modeling subtask progression together with force-aware control for robust long-horizon manipulation. For additional material, please check: https://mertcookimg.github.io/bi-hil
- Abstract(参考訳): 接触不確実性の下では、部分的な観測可能性や不安定なサブタスク遷移のため、長い水平接触に富んだロボット操作は依然として困難である。
階層的アーキテクチャは時間的推論を改善し、二元的模倣学習は力に敏感な制御を可能にするが、既存のアプローチは長い水平調整に苦しむ平らなポリシーに依存していることが多い。
双方向制御に基づく多モード階層型模倣学習フレームワークBi-HILを提案する。
Bi-HILは、キーフレームメモリとサブタスクレベルの進行率を統合することで階層的コーディネーションを安定化する。
本研究では,一元的および二元的実ロボットタスクに対するBi-HILの評価を行い,フラットおよび短縮版に対する一貫した改善を実証した。
この結果から, 力覚制御を併用し, 頑健なロングホライゾン操作を行う上で, サブタスク進行を明示的にモデル化することの重要性が示された。
追加資料については、https://mertcookimg.github.io/bi-hilを参照してください。
関連論文リスト
- StructBiHOI: Structured Articulation Modeling for Long--Horizon Bimanual Hand--Object Interaction Generation [30.285126708457174]
長期計画不安定性, きめ細かな関節明瞭化, 複雑な手動協調により, コヒーレントな双方向生成が困難になる。
長軸2次元HOI生成のための構造化調音モデルであるStructBiHOIを提案する。
論文 参考訳(メタデータ) (2026-03-09T13:47:06Z) - Cognition to Control - Multi-Agent Learning for Human-Humanoid Collaborative Transport [36.304887250687536]
本稿では,3層階層構造である認知制御(C2C)について述べる。
協調操作タスクの実験は、単一エージェントとエンドツーエンドのベースラインよりも成功と堅牢性を示す。
論文 参考訳(メタデータ) (2026-03-04T06:24:55Z) - Non-Markovian Long-Horizon Robot Manipulation via Keyframe Chaining [56.62125584296097]
Keyframe-Chaining VLAは、キー履歴フレームを抽出し、長い水平依存関係をモデル化するフレームワークである。
本研究では,現在の実行フェーズに対する時間的関連性に基づいて,動的に履歴フレームを検索する進捗対応機構を設計する。
タスク成功率を測定するために,ManiSkillシミュレータ上に構築された4つの非マルコフ操作タスクスイートを紹介する。
論文 参考訳(メタデータ) (2026-03-02T05:26:29Z) - BiManiBench: A Hierarchical Benchmark for Evaluating Bimanual Coordination of Multimodal Large Language Models [30.38546017617527]
MLLM(Multi Large Language Models)を評価するベンチマークであるBiManiBenchを紹介した。
本フレームワークは,腕の到達性や運動的制約など,独特な両面的課題を分離する。
30以上の最先端モデルの解析により、高度推論能力にもかかわらず、MLLMはデュアルアームの空間接地と制御に苦しむことが明らかとなった。
論文 参考訳(メタデータ) (2026-02-09T08:47:14Z) - Toward Ultra-Long-Horizon Agentic Science: Cognitive Accumulation for Machine Learning Engineering [59.18634614089481]
超長距離機械学習工学(MLE)を習得する自律エージェントML-Master 2.0を提案する。
文脈管理を認知的蓄積のプロセスとして考えることで、階層的認知キャッシング(HCC)を導入する。
HCCは、エージェントが短期的な実験戦略から即時実行を分離することを可能にする。
オープンAIのMLE-Benchを24時間予算で評価すると、ML-Master 2.0は56.44%の最先端のメダルを獲得した。
論文 参考訳(メタデータ) (2026-01-15T13:52:04Z) - Heterogeneous Multi-Expert Reinforcement Learning for Long-Horizon Multi-Goal Tasks in Autonomous Forklifts [5.215925647203835]
本稿では,自律フォークリフトに適した異種多目的強化学習(HMER)フレームワークを提案する。
HMERは、長期のタスクをセマンティックタスクプランナーによって制御される特殊なサブポリスに分解する。
本手法は,タスク成功率94.2%(ベースラインの62.5%)を達成し,動作時間を21.4%削減し,配置誤差を1.5cm以内で維持する。
論文 参考訳(メタデータ) (2026-01-12T08:27:24Z) - RoboCerebra: A Large-scale Benchmark for Long-horizon Robotic Manipulation Evaluation [59.9896841079005]
長距離ロボット操作における高レベル推論評価のためのベンチマークであるRoboCerebraを紹介する。
データセットはトップダウンパイプラインを通じて構築され、GPTはタスク命令を生成し、それらをサブタスクシーケンスに分解する。
以前のベンチマークと比較すると、RoboCerebraはアクションシーケンスが大幅に長く、アノテーションがより密度が高い。
論文 参考訳(メタデータ) (2025-06-07T06:15:49Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Modeling Long-horizon Tasks as Sequential Interaction Landscapes [75.5824586200507]
本稿では,一連のデモビデオからのみ,サブタスク間の依存関係と遷移を学習するディープラーニングネットワークを提案する。
これらのシンボルは、画像観察から直接学習し、予測できることが示される。
我々は,(1)人間によって実行されるパズル片のブロック積み重ね,(2)物体のピック・アンド・プレイスとキャビネットドアを7-DoFロボットアームで滑らせるロボット操作という,2つの長期水平作業において,我々の枠組みを評価する。
論文 参考訳(メタデータ) (2020-06-08T18:07:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。