論文の概要: PhysGraph: Physically-Grounded Graph-Transformer Policies for Bimanual Dexterous Hand-Tool-Object Manipulation
- arxiv url: http://arxiv.org/abs/2603.01436v1
- Date: Mon, 02 Mar 2026 04:32:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.8111
- Title: PhysGraph: Physically-Grounded Graph-Transformer Policies for Bimanual Dexterous Hand-Tool-Object Manipulation
- Title(参考訳): PhysGraph: 2次元デキスタラスハンドツールオブジェクト操作のための物理グラウンドグラフトランスフォーマポリシ
- Authors: Runfa Blark Li, David Kim, Xinshuang Liu, Keito Suzuki, Dwait Bhatt, Nikola Raicevic, Xin Lin, Ki Myung Brian Lee, Nikolay Atanasov, Truong Nguyen,
- Abstract要約: 既存のメソッドは、システム全体の状態を単一の構成ベクタとしてネガリックに表現する。
本稿では,PhysGraphについて述べる。PhysGraphは2次元手動オブジェクト操作に挑戦する物理グラウンドグラフトランスフォーマポリシーである。
- 参考スコア(独自算出の注目度): 15.661420962372441
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Bimanual dexterous manipulation for tool use remains a formidable challenge in robotics due to the high-dimensional state space and complicated contact dynamics. Existing methods naively represent the entire system state as a single configuration vector, disregarding the rich structural and topological information inherent to articulated hands. We present PhysGraph, a physically-grounded graph transformer policy designed explicitly for challenging bimanual hand-tool-object manipulation. Unlike prior works, we represent the bimanual system as a kinematic graph and introduce per-link tokenization to preserve fine-grained local state information. We propose a physically-grounded bias generator that injects structural priors directly into the attention mechanism, including kinematic spatial distance, dynamic contact states, geometric proximity, and anatomical properties. This allows the policy to explicitly reason about physical interactions rather than learning them implicitly from sparse rewards. Extensive experiments show that PhysGraph significantly outperforms baseline - ManipTrans in manipulation precision and task success rates while using only 51% of the parameters of ManipTrans. Furthermore, the inherent topological flexibility of our architecture shows qualitative zero-shot transfer to unseen tool/object geometries, and is sufficiently general to be trained on three robotic hands (Shadow, Allegro, Inspire).
- Abstract(参考訳): ツール使用のための両面的な操作は、高次元の状態空間と複雑な接触ダイナミクスのため、ロボット工学において深刻な課題である。
既存の方法では、システム全体の状態を単一の構成ベクトルとして表現し、手話に固有の豊富な構造的・位相的情報を無視する。
PhysGraphは物理的に座屈したグラフトランスフォーマーで、手動オブジェクト操作に挑戦するために明示的に設計されている。
従来とは違って,両マニュアルシステムをキネマティックグラフとして表現し,きめ細かい局所状態情報を保持するためにリンク単位のトークン化を導入する。
本研究では, 運動空間距離, 動的接触状態, 幾何学的近接状態, 解剖学的特性など, 構造的先行を注意機構に直接注入する物理的に接地したバイアス発生器を提案する。
これにより、政策は、粗末な報酬から暗黙的に学ぶのではなく、物理的相互作用について明確に推論することができる。
大規模な実験により、PhysGraphはベースライン – ManipTransの操作精度とタスク成功率において、ManipTransのパラメータの51%しか使用していない。
さらに、我々のアーキテクチャの固有のトポロジカルな柔軟性は、未知のツールやオブジェクトのジオメトリへの定性的ゼロショットの移動を示しており、3つのロボットハンド(Shadow, Allegro, Inspire)でトレーニングするのに十分な一般性を示している。
関連論文リスト
- UniHM: Unified Dexterous Hand Manipulation with Vision Language Model [39.2419824041854]
身体的に実現可能な器用な手操作を計画することは、ロボット操作と身体的AIにおける中心的な課題である。
自由形式の言語コマンドで案内される手操作を統一する最初のフレームワークであるUniHMを紹介する。
論文 参考訳(メタデータ) (2026-02-28T16:37:11Z) - Grasp-and-Lift: Executable 3D Hand-Object Interaction Reconstruction via Physics-in-the-Loop Optimization [5.146238489510258]
デクサラスハンド操作は、正確にハンドオブジェクトの軌跡データを持つデータセットにますます依存している。
DexYCB や HO3D のような既存のリソースは主に視覚的アライメントに最適化されているが、物理シミュレーターでリプレイすると物理的に不可解な相互作用が生じることが多い。
本稿では,これらの視覚的に整列した軌道を物理的に有効な軌道に変換するシミュレーション・イン・ザ・ループ・リファインメント・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-26T04:08:30Z) - SIGHT: Synthesizing Image-Text Conditioned and Geometry-Guided 3D Hand-Object Trajectories [124.24041272390954]
手動物体の相互作用をモデル化することは、ロボットと具体化されたAIシステムを前進させる大きな可能性を秘めている。
SIGHTは、1つの画像から現実的で物理的に妥当な3Dハンドオブジェクトインタラクショントラジェクトリを生成することに焦点を当てた,新しいタスクである。
SIGHT-Fusionは,データベースから最もよく似た3Dオブジェクトメッシュを抽出し,この課題に対処する,新しい拡散型画像文条件付き生成モデルを提案する。
論文 参考訳(メタデータ) (2025-03-28T20:53:20Z) - LLM-Based Multi-Agent Systems are Scalable Graph Generative Models [73.28294528654885]
GraphAgent-Generator (GAG) は動的でテキスト対応のソーシャルグラフ生成のための新しいシミュレーションベースのフレームワークである。
GAGは、ゼロショットソーシャルグラフ生成のための時間ノードとエッジ生成プロセスをシミュレートする。
得られたグラフは7つの主要なマクロ的ネットワーク特性に付着し、微視的グラフ構造測定において11%の改善が達成される。
論文 参考訳(メタデータ) (2024-10-13T12:57:08Z) - One-shot Video Imitation via Parameterized Symbolic Abstraction Graphs [8.872100864022675]
我々は,Sybolicized Abstraction Graphs (PSAG) によるビデオデモの解釈を提案する。
さらに,非幾何学的,視覚的に知覚できない属性を推定するために,シミュレーションによる幾何学的制約を示す。
我々のアプローチは、Avocado、Cutting Vegetable、Pouring Liquid、Rolling Dough、Slicing Pizzaといった様々なタスクで検証されている。
論文 参考訳(メタデータ) (2024-08-22T18:26:47Z) - Physics-Encoded Graph Neural Networks for Deformation Prediction under
Contact [87.69278096528156]
ロボット工学では、触覚相互作用における物体の変形を理解することが不可欠である。
本稿では,物理符号化グラフニューラルネットワーク(GNN)を用いた予測手法を提案する。
コードとデータセットを公開して、ロボットシミュレーションと把握の研究を進めました。
論文 参考訳(メタデータ) (2024-02-05T19:21:52Z) - "What's This?" -- Learning to Segment Unknown Objects from Manipulation
Sequences [27.915309216800125]
本稿では,ロボットマニピュレータを用いた自己教師型把握対象セグメンテーションのための新しいフレームワークを提案する。
本稿では,モーションキューとセマンティック知識を共同で組み込んだ,エンドツーエンドのトレーニング可能な単一アーキテクチャを提案する。
我々の手法は、運動ロボットや3Dオブジェクトモデルの視覚的登録にも、正確な手眼の校正や追加センサーデータにも依存しない。
論文 参考訳(メタデータ) (2020-11-06T10:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。