論文の概要: Information-Theoretic Detection of Bimanual Interactions for Dual-Arm Robot Plan Generation
- arxiv url: http://arxiv.org/abs/2601.19832v1
- Date: Tue, 27 Jan 2026 17:38:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 05:27:44.439839
- Title: Information-Theoretic Detection of Bimanual Interactions for Dual-Arm Robot Plan Generation
- Title(参考訳): デュアルアームロボット計画生成のための情報理論による双方向インタラクションの検出
- Authors: Elena Merlo, Marta Lagomarsino, Arash Ajoudani,
- Abstract要約: 本稿では,デュアルアームロボットシステムの実行計画を生成するために,バイマニュアル・タスク・デモの1枚のRGBビデオをワンショットで処理する手法を提案する。
シーン要素間の情報フローを分析し,シーングラフ特性を活用するためにシャノンの情報理論を適用した。
生成された計画は、望まれるアームの調整に基づいて異なる構造を仮定するモジュラー・ビヘイビア・ツリーである。
- 参考スコア(独自算出の注目度): 14.053079591358797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Programming by demonstration is a strategy to simplify the robot programming process for non-experts via human demonstrations. However, its adoption for bimanual tasks is an underexplored problem due to the complexity of hand coordination, which also hinders data recording. This paper presents a novel one-shot method for processing a single RGB video of a bimanual task demonstration to generate an execution plan for a dual-arm robotic system. To detect hand coordination policies, we apply Shannon's information theory to analyze the information flow between scene elements and leverage scene graph properties. The generated plan is a modular behavior tree that assumes different structures based on the desired arms coordination. We validated the effectiveness of this framework through multiple subject video demonstrations, which we collected and made open-source, and exploiting data from an external, publicly available dataset. Comparisons with existing methods revealed significant improvements in generating a centralized execution plan for coordinating two-arm systems.
- Abstract(参考訳): デモによるプログラミングは、人間によるデモンストレーションを通じて、非専門家のためのロボットプログラミングプロセスを単純化する戦略である。
しかし、両手作業への採用は、手作業の複雑化とデータ記録の妨げとなるため、未解決の問題である。
本稿では,デュアルアームロボットシステムの実行計画を生成するために,バイマニュアル・タスク・デモの1枚のRGBビデオをワンショットで処理する手法を提案する。
手動調整ポリシーを検出するため,シーン要素間の情報フローを分析し,シーングラフ特性を活用するためにシャノンの情報理論を適用した。
生成された計画は、望まれるアームの調整に基づいて異なる構造を仮定するモジュラー・ビヘイビア・ツリーである。
我々は、このフレームワークの有効性を、複数の主題のビデオデモを通じて検証し、オープンソースとして収集し、外部から公開されているデータセットからデータを活用した。
既存手法との比較により, 集中型2本腕システムのための集中型実行計画の作成において, 大幅な改善が認められた。
関連論文リスト
- Learning Causal Structure Distributions for Robust Planning [53.753366558072806]
構造情報の不確実性を考慮しながら,機能的関係を学習することで,より堅牢な力学モデルがもたらされることがわかった。
これは、因果構造を無視し、ロボットシステムにおける相互作用の空間性を活用するのに失敗する一般的なモデル学習手法とは対照的である。
本稿では,本モデルを用いてロボットの力学を学習し,新しい環境下での新たな作業を行うためのサンプリング・ベース・プランナーを併用することを提案する。
論文 参考訳(メタデータ) (2025-08-08T22:43:17Z) - Information-Theoretic Graph Fusion with Vision-Language-Action Model for Policy Reasoning and Dual Robotic Control [22.74768543283102]
Graph-Fused Vision-Language-Action (GF-VLA)は、デュアルアームロボットシステムがタスクレベルの推論と実行を可能にするフレームワークである。
GF-VLAはまずシャノン情報に基づく手がかりを抽出し、最も高いタスク関連性を持つ手や物体を識別する。
クロスハンド選択ポリシーは、明示的な幾何学的推論なしで最適な割り当てを推測する。
論文 参考訳(メタデータ) (2025-08-07T12:48:09Z) - Unifying Search and Recommendation with Dual-View Representation Learning in a Generative Paradigm [51.2624255871896]
GenSRは検索とレコメンデーションを統合するための新しい生成パラダイムである。
本研究は,従来の差別的手法と比較して新しい生成パラダイムを導入する。
論文 参考訳(メタデータ) (2025-04-09T09:15:37Z) - Rethinking Bimanual Robotic Manipulation: Learning with Decoupled Interaction Framework [51.39847596489193]
バイオマチックなロボット操作は、ロボティクスコミュニティにおいて、新しくて重要なトピックである。
本稿では,バイマニュアル操作における異なるタスクの特徴を考察した,疎結合なインタラクションフレームワークを提案する。
我々のフレームワークは,SOTA法よりも23.5%向上し,優れた性能を実現している。
論文 参考訳(メタデータ) (2025-03-12T09:28:41Z) - Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation [16.244250979166214]
Generalizable Planning-Guided Diffusion Policy Learning (GLIDE)は、コンタクトリッチな双方向操作タスクを解決するためのアプローチである。
本稿では,特徴抽出,タスク表現,行動予測,データ拡張における重要な設計オプションのセットを提案する。
本手法は, 多様な地形, 寸法, 物理的特性の物体を効果的に操作することができる。
論文 参考訳(メタデータ) (2024-12-03T18:51:39Z) - InterACT: Inter-dependency Aware Action Chunking with Hierarchical Attention Transformers for Bimanual Manipulation [1.4835219023165949]
階層型注意変換器を用いた相互依存認識型アクションチャンキング(InterACT: Inter-Dependency aware Action Chunking)を紹介する。
InterACTは、バイマニュアル操作に特化して設計された新しい模倣学習フレームワークである。
シミュレーションおよび実世界の実世界のバイマニュアル操作タスクで行った実験は、InterACTが既存の手法より優れていることを示した。
論文 参考訳(メタデータ) (2024-09-12T10:30:44Z) - Controlled Training Data Generation with Diffusion Models [48.123126522294015]
本稿では,教師あり学習に有用なトレーニングデータを生成するために,テキスト・画像生成モデルを制御する手法を提案する。
本研究では,2つのフィードバック機構を備えたクローズドループシステムを開発した。
論文 参考訳(メタデータ) (2024-03-22T15:59:24Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。