論文の概要: EAGG: Embodiment-Aligned Grasp Generation via Geometry-Aware Graph Conditioning
- arxiv url: http://arxiv.org/abs/2606.18092v1
- Date: Tue, 16 Jun 2026 15:56:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.52952
- Title: EAGG: Embodiment-Aligned Grasp Generation via Geometry-Aware Graph Conditioning
- Title(参考訳): EAGG:Geometry-Aware Graph Conditioningによる身体適応型グラフ生成
- Authors: Wanhao Niu, Qiyan Ke, Yuan Sun, Hao Sun, Jie Xu, Muyuan Ma, Ruiqi Hu, Fuchun Sun,
- Abstract要約: クロス・エンド・エフェクター・グリーグジェネレーションは、オブジェクトとエボディメントをまたいで一般化する統一モデルを求める。
本稿では,各実施形態をトポロジ対応のエンドエフェクタグラフと,実施形態固有の低次元エンドエフェクタ制御空間で表現するエボディメント整列型グリップジェネレータであるEAGGについて述べる。
- 参考スコア(独自算出の注目度): 25.550189067906672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-end-effector grasp generation seeks a unified model that generalizes across objects and across embodiments ranging from parallel grippers to dexterous end effectors. Existing grasp generators are typically designed for a fixed embodiment or encode embodiment identity with a static descriptor, which weakens transfer when topology, actuation coupling, and contact geometry differ substantially. We present EAGG, an embodiment-aligned grasp generator that represents each embodiment with a topology-aware end-effector graph and an embodiment-specific low-dimensional end-effector control space. A frozen end-effector-cognition backbone converts the current articulated state into geometry-aware tokens that act as a reusable morphology prior, and iterative geometry injection refreshes these tokens throughout sampling so that conditioning remains synchronized with the evolving end-effector geometry. On the MultiGripperGrasp benchmark, EAGG reaches 56.17% average success across six training end effectors, remaining within 1.10 percentage points of specialized training while preserving transfer to finetuning and zero-shot end effectors. Iterative geometry injection further reduces the pooled median contact distance from 0.239 cm to 0.189 cm. These results show that cross-end-effector grasp generation is strengthened by aligning embodiment structure inside a shared generator rather than suppressing embodiment differences. Code is available at https://github.com/wanhaoniu/EAGG.
- Abstract(参考訳): クロス・エンド・エフェクター・グリップ生成は、並列グリップパーからデキスタラスエンドエフェクターまで、オブジェクトとエボデーションをまたいで一般化する統一モデルを求める。
既存のグリップジェネレータは通常、固定エンボディメントやエンコードエンコードエンボディメントのアイデンティティのために設計されており、トポロジ、アクティベーション結合、接触幾何学が著しく異なるときに転送を弱める静的ディスクリプタで設計されている。
本稿では,各実施形態をトポロジ対応のエンドエフェクタグラフと,実施形態固有の低次元エンドエフェクタ制御空間で表現するエボディメント整列型グリップジェネレータであるEAGGを提案する。
凍結したエンドエフェクター認識バックボーンは、現在の調音状態を再利用可能な形態として機能する幾何学的トークンに変換し、反復幾何注入はこれらのトークンをサンプリングを通して更新し、コンディショニングが進化するエンドエフェクター幾何と同期し続けるようにする。
MultiGripperGraspベンチマークでは、6つのトレーニングエンドエフェクターの平均成功率は56.17%に達し、特別なトレーニングの1.10ポイント以内に留まり、微調整やゼロショットエンドエフェクターへの転送を保っている。
反復幾何注入により、プールされた中央接触距離は0.239cmから0.189cmに減少する。
これらの結果から, 共用発電機内におけるエボディメント構造を, エンボディメントの差を抑えるのではなく整列させることにより, クロス・エフェクター・グリップ生成が強化されることが示唆された。
コードはhttps://github.com/wanhaoniu/EAGGで入手できる。
関連論文リスト
- MeshWeaver: Sparse-Voxel-Guided Surface Weaving for Autoregressive Mesh Generation [53.06620176910962]
MeshWeaverは、メッシュ生成を表面織布プロセスとして扱う自動回帰フレームワークである。
MeshWeaverは18%の最先端圧縮比を実現し、最大16K面のメッシュを生成することができ、以前のアプローチよりも幾何的忠実性を大幅に向上する。
論文 参考訳(メタデータ) (2026-06-03T10:15:43Z) - Sparse Compositional Flow Matching by geometric assembly from motion primitives [15.40404761023639]
ロボットマニピュレータ、水中車両、移動ロボットの実行可能な動作シーケンスなどの身体的軌道は、組込みAIの基本的な出力である。
現代の生成モデルは、しばしばそれらを密度の高いモノリシックな信号生成点として扱い、データの潜在構造をモデル化せずに、複雑な高次元の後方に収まる。
多くの具体化されたタスクは、再利用可能な運動プリミティブの有限レパートリーとして明示できるような反復的な運動断片を共有する。
既存の構成ジェネレータは潜時空間を構成し、サンプル単位と実際の軌跡を関連づけるためにポストホック復号に依存する
論文 参考訳(メタデータ) (2026-05-22T07:55:48Z) - FusionCell: Cross-Attentive Fusion of Layout Geometry and Netlist Topology for Standard-Cell Performance Prediction [10.566387281392915]
FusionCellは、ルーティングされたレイアウト幾何学とネットリストトポロジを入力として扱い、それらを統一されたモデルで明示的にフューズするデュアルモード予測器である。
我々はASAP7 PDKをベースとした7nmのデータセットを構築し、19.5k以上の細胞が149のタイプに分散している。
実験の結果,FusionCellは平均MAPE0.92パーセントの回帰誤差を低減し,ベースラインよりもSpearman/Kendallランキングを改善した。
論文 参考訳(メタデータ) (2026-05-19T06:46:07Z) - Differentiable Multiphysics Co-Optimization via Implicit Neural Representations: A Transient Hamburger-Cooking Benchmark [0.40611352512781856]
本稿では,幾何学の暗黙的表現をJAXコンパイルされたユーレリア多物理解法と組み合わせた,エンドツーエンドの微分可能共最適化フレームワークを提案する。
その結果, 形状のみの最適化は熱的ボトルネックを緩和するために形状を変化させる一方, 共同最適化は形状, 材料状態, プロセス変数, 境界条件に設計応答を分散させることがわかった。
論文 参考訳(メタデータ) (2026-05-01T19:08:14Z) - Structural Action Transformer for 3D Dexterous Manipulation [80.07649565189035]
クロス・エボディメント・スキル・トランスファーは、ハイDoFロボットハンドの課題である。
既存の手法は、しばしば2次元の観測と時間中心の行動表現に依存し、3次元の空間的関係を捉えるのに苦労する。
本稿では、構造中心の視点を導入することで、このパラダイムに挑戦する新しい3Dデクスタラスな操作ポリシーを提案する。
論文 参考訳(メタデータ) (2026-03-04T11:38:12Z) - LinkD: AutoRegressive Diffusion Model for Mechanical Linkage Synthesis [11.69314618713792]
本稿では,リンケージアセンブリの動的性質を生かした自己回帰拡散フレームワークを提案する。
最大20個のノードを含むリンクシステムのNノードアーキテクチャへの合成に成功した。
論文 参考訳(メタデータ) (2026-01-07T16:19:11Z) - Geometry-Editable and Appearance-Preserving Object Compositon [67.98806888489385]
汎用オブジェクト合成(GOC)は、対象オブジェクトを望まれる幾何学的性質を持つ背景シーンにシームレスに統合することを目的としている。
近年のアプローチは意味的埋め込みを導出し、それらを高度な拡散モデルに統合し、幾何学的に編集可能な生成を可能にする。
本稿では,まずセマンティックな埋め込みを活用して,所望の幾何学的変換を暗黙的にキャプチャするDistangled Geometry-editable and Outearance-Preserving Diffusionモデルを提案する。
論文 参考訳(メタデータ) (2025-05-27T09:05:28Z) - Transolver: A Fast Transformer Solver for PDEs on General Geometries [66.82060415622871]
本稿では, 離散化された測地の背後に隠れた本質的な物理状態を学習するTransolverについて述べる。
スライスから符号化された物理認識トークンに注意を向けることで、Transovlerは複雑な物理的相関を効果的に捉えることができる。
Transolverは6つの標準ベンチマークで22%の相対的な利得で一貫した最先端を実現し、大規模産業シミュレーションでも優れている。
論文 参考訳(メタデータ) (2024-02-04T06:37:38Z) - GeoDeformer: Geometric Deformable Transformer for Action Recognition [22.536307401874105]
視覚トランスフォーマーは、近年、行動認識のための畳み込みネットワークの効果的な代替品として登場した。
本稿では,幾何学的理解を直接ViTアーキテクチャに組み込むことで,アクションビデオに固有の変動を捉えるための新しいアプローチであるGeoDeformerを提案する。
論文 参考訳(メタデータ) (2023-11-29T16:55:55Z) - Curve Your Attention: Mixed-Curvature Transformers for Graph
Representation Learning [77.1421343649344]
本稿では,一定曲率空間の積を完全に操作するトランスフォーマーの一般化を提案する。
また、非ユークリッド注意に対するカーネル化されたアプローチを提供し、ノード数とエッジ数に線形に時間とメモリコストでモデルを実行できるようにします。
論文 参考訳(メタデータ) (2023-09-08T02:44:37Z) - TransMOT: Spatial-Temporal Graph Transformer for Multiple Object
Tracking [74.82415271960315]
映像内の物体間の空間的・時間的相互作用を効率的にモデル化するソリューションであるTransMOTを提案する。
TransMOTは従来のTransformerよりも計算効率が高いだけでなく、トラッキング精度も向上している。
提案手法は、MOT15、MOT16、MOT17、MOT20を含む複数のベンチマークデータセット上で評価される。
論文 参考訳(メタデータ) (2021-04-01T01:49:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。