論文の概要: KPGrasp: Scalable Keypoint Flow Matching for Dexterous Grasp Generation
- arxiv url: http://arxiv.org/abs/2606.09314v1
- Date: Mon, 08 Jun 2026 10:19:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.926264
- Title: KPGrasp: Scalable Keypoint Flow Matching for Dexterous Grasp Generation
- Title(参考訳): KPGrasp: Dexterous Grasp生成のためのスケーラブルなキーポイントフローマッチング
- Authors: Yuansen Huang, Jiayi Chen, Haoran Liu, Yubin Ke, Bing Han, Jiangran Lyu, Mi Yan, Li Yi, He Wang,
- Abstract要約: KPGraspは,大規模データから事前の詳細な把握を学習するフローマッチングフレームワークである。
20の多様なオブジェクトに対する実験は、パイプラインを現実世界のセットアップでデプロイできることを示しています。
- 参考スコア(独自算出の注目度): 23.028638559051597
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating high-quality dexterous grasps remains challenging for learning-based methods, which often depend on carefully tuned contact losses or costly contact-based test-time refinement. We present KPGrasp, a flow-matching framework that learns dexterous grasp priors from large-scale data rather than relying on contact losses or contact-based test-time refinement. KPGrasp couples an all-Euclidean 3D hand-keypoint parameterization with a simple yet scalable Transformer flow model. The parameterization avoids the drawbacks of the conventional mixed SE(3) pose and joint-angle output space, expresses grasps in the same frame as the object point cloud, and thus enables native spatial reasoning; the Transformer flow model is trained with only the standard flow-matching loss and scales effectively with data, model capacity, and batch size. Experiments demonstrate state-of-the-art performance on two simulation benchmarks. On the Dexonomy benchmark, it reaches a 76.3% grasp success rate, improving over the strongest directly comparable baseline by 47.4% while reducing penetration depth to 2.4 mm. The same model also achieves the best average performance on the DexGrasp Anything benchmark without fine-tuning. For batched inference, KPGrasp requires only 0.032 s per grasp. Finally, real-world experiments on 20 diverse objects demonstrate that the pipeline can be deployed in a real-world setup.
- Abstract(参考訳): 高度に調整された接触損失や、コストのかかる接触ベースのテスト時間改善に依存する学習ベースの手法では、高品質な巧妙な把握を生成することは依然として困難である。
KPGraspは,接触損失や接触によるテスト時間改善に頼るのではなく,大規模データから詳細な把握先を学習するフローマッチングフレームワークである。
KPGraspは、単純でスケーラブルなTransformerフローモデルと、全ユークリッド3Dハンドキーポイントパラメータ化を結合する。
パラメータ化は、従来の混合SE(3)ポーズとジョイントアングル出力空間の欠点を回避し、オブジェクトポイントクラウドと同じフレームでグリップを表現し、ネイティブな空間推論を可能にし、トランスフォーマーフローモデルは標準的なフローマッチング損失のみをトレーニングし、データ、モデルキャパシティ、バッチサイズを効果的にスケールする。
実験では、2つのシミュレーションベンチマークで最先端の性能を示す。
デキソノミーのベンチマークでは76.3%の成功率に達し、最強のベースラインよりも47.4%向上し、浸透深度は2.4mmに低下した。
同じモデルは、微調整なしでDexGrasp Anythingベンチマークで最高の平均パフォーマンスを達成する。
バッチ推論では、KPGraspはグリップ当たり0.032秒しか必要としない。
最後に、20の多様なオブジェクトに関する実世界の実験は、パイプラインが現実世界のセットアップでデプロイ可能であることを示した。
関連論文リスト
- How Much Capacity Does EEG Denoising Need? Ultra-Compact Networks reveal Benchmark Saturation and Metric-Utility Gap [0.0]
深層学習EEG(Deep Learning EEG Denoising Architectures)は、数万から数千万のパラメータに拡張されているが、実験変数としてモデルキャパシティを分離した以前の研究はない。
アーキテクチャ,損失,データ分割,トレーニングレシピの両ギャップに対処し,最小限の深さ分離可能な畳み込みU-Netで1.05Kから40.26Kパラメータまでのチャネル幅を網羅する。
論文 参考訳(メタデータ) (2026-06-07T12:17:25Z) - Towards Real-Time Autonomous Navigation: Transformer-Based Catheter Tip Tracking in Fluoroscopy [35.565354067805835]
本研究の目的は, 実時間カテーテル先端追跡パイプラインの開発と評価である。
U-Net、U-Net+Transformer、SegFormerなどのディープラーニングセグメンテーションモデルをトレーニングし、ベンチマークした。
2級のSegFormerは平均絶対誤差4.44mm、U-Net(4.60mm)、U-Net+Transformer(6.20mm)、および3級モデル(5.19-7.74mm)を上回った。
論文 参考訳(メタデータ) (2026-05-14T01:42:56Z) - Tail-Aware Post-Training Quantization for 3D Geometry Models [58.79500829118265]
ポストトレーニング量子化(PTQ)は、再トレーニングなしに効率的な推論を可能にする。
PTQは複雑な特徴分布と禁止キャリブレーションオーバーヘッドのために、3Dモデルに効果的に転送できない。
3次元幾何学学習のためのTail-Aware Post-Training Quantization PipelineであるTAPTQを提案する。
論文 参考訳(メタデータ) (2026-02-02T07:21:15Z) - Dimension vs. Precision: A Comparative Analysis of Autoencoders and Quantization for Efficient Vector Retrieval on BEIR SciFact [0.0]
Int8量子化は最も効果的な「スイートスポット」を提供し、nDCG@10の無視可能な[1-2%]ドロップで4倍の圧縮を達成する。
オートエンコーダは優雅な劣化を示すが、同等の4倍圧縮比でより大きな性能損失を被る。
バイナリ量子化は 破滅的な性能低下のため この作業には適さないことが分かりました
論文 参考訳(メタデータ) (2025-11-17T07:02:11Z) - Rectified-CFG++ for Flow Based Models [26.896426878221718]
本稿では,修正フローの決定論的効率を幾何学的条件付きルールと組み合わせた適応型予測器・補正器ガイダンスであるRectified-C++を提案する。
大規模なテキスト・ツー・イメージモデル(Flux, Stable Diffusion 3/3.5, Lumina)の実験では、Rectified-C++がベンチマークデータセットの標準CFGを一貫して上回っていることが示されている。
論文 参考訳(メタデータ) (2025-10-09T00:00:47Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning [71.30276778807068]
サンプルプルーニングとトークンプルーニングを戦略的に協調する統合フレームワークを提案する。
Q-Tuningは、トレーニングデータの12.5%しか使用せず、全データSFTベースラインに対する平均38%の改善を実現している。
論文 参考訳(メタデータ) (2025-09-28T13:27:38Z) - ReSeFlow: Rectifying SE(3)-Equivariant Policy Learning Flows [7.360373380580255]
本稿では, SE(3)-拡散モデルに補正を導入し, 高速かつジオデシックな, 最小計算型ポリシー生成を提供するReSeFlowを提案する。
提案したReSeFlowは,提案手法よりも測地距離が低い場合に高い性能が得られることがわかった。
論文 参考訳(メタデータ) (2025-09-20T06:32:36Z) - ATTS: Asynchronous Test-Time Scaling via Conformal Prediction [112.54016379556073]
大規模な言語モデル(LLM)は、テスト時のスケーリングの恩恵を受けるが、しばしば高い推論遅延によって妨げられる。
統計的に保証された適応スケーリングフレームワークであるATTS(Asynchronous Test-Time Scaling)を紹介する。
ATTSは、テストタイムのスケーリングにおいて最大56.7倍のスピードアップと4.14倍のスループット向上を実現している。
論文 参考訳(メタデータ) (2025-09-18T16:55:09Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - 3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。
提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-02-24T12:01:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。