論文の概要: TOSC: Task-Oriented Shape Completion for Open-World Dexterous Grasp Generation from Partial Point Clouds
- arxiv url: http://arxiv.org/abs/2601.05499v1
- Date: Fri, 09 Jan 2026 03:03:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.709465
- Title: TOSC: Task-Oriented Shape Completion for Open-World Dexterous Grasp Generation from Partial Point Clouds
- Title(参考訳): TOSC:部分点雲からのオープンワールドデクサラスグラフ生成のためのタスク指向形状補完
- Authors: Weishang Wu, Yifei Shi, Zhiping Cai,
- Abstract要約: Task-Oriented Shape Completionは、全形状ではなく、潜在的な接触領域を完成させることに焦点を当てた新しいタスクである。
3次元識別型オートエンコーダを提案し,各生成した候補の妥当性を評価し,最も妥当な候補を最適化する。
FlowGraspという条件付きフローマッチングモデルを開発し、最適化された形状からタスク指向のデクサラスな把握を生成する。
- 参考スコア(独自算出の注目度): 30.01480877745993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Task-oriented dexterous grasping remains challenging in robotic manipulations of open-world objects under severe partial observation, where significant missing data invalidates generic shape completion. In this paper, to overcome this limitation, we study Task-Oriented Shape Completion, a new task that focuses on completing the potential contact regions rather than the entire shape. We argue that shape completion for grasping should be explicitly guided by the downstream manipulation task. To achieve this, we first generate multiple task-oriented shape completion candidates by leveraging the zero-shot capabilities of object functional understanding from several pre-trained foundation models. A 3D discriminative autoencoder is then proposed to evaluate the plausibility of each generated candidate and optimize the most plausible one from a global perspective. A conditional flow-matching model named FlowGrasp is developed to generate task-oriented dexterous grasps from the optimized shape. Our method achieves state-of-the-art performance in task-oriented dexterous grasping and task-oriented shape completion, improving the Grasp Displacement and the Chamfer Distance over the state-of-the-art by 16.17\% and 55.26%, respectively. In particular, it shows good capabilities in grasping objects with severe missing data. It also demonstrates good generality in handling open-set categories and tasks.
- Abstract(参考訳): タスク指向の厳密な把握は、厳密な部分的な観察下でのオープンワールドオブジェクトのロボット操作において依然として困難であり、大きな欠落したデータが汎用的な形状の完成を無効にする。
本稿では,この制限を克服するために,全形状ではなく潜在的接触領域の完成に焦点を当てたタスク指向形状補完について検討する。
我々は、把握のための形状補完は、下流操作タスクによって明示的に導かれるべきであると論じる。
そこで我々はまず,事前学習された基礎モデルから対象関数理解のゼロショット機能を活用することで,複数のタスク指向形状補完候補を生成する。
次に,3次元識別型オートエンコーダを提案し,各候補の妥当性を評価し,大域的な視点から最も高い精度のオートエンコーダを最適化する。
FlowGraspという条件付きフローマッチングモデルを開発し、最適化された形状からタスク指向のデクサラスな把握を生成する。
本手法は,タスク指向のデキスタラス把握とタスク指向の形状完了における最先端性能を実現し,それぞれ16.17\%,55.26%の精度でGrasp変位率とChamfer距離を改善した。
特に、深刻な欠落したデータでオブジェクトをつかむのに優れた機能を示している。
また、オープンセットのカテゴリやタスクを扱う上で、優れた汎用性を示す。
関連論文リスト
- Self-supervised Shape Completion via Involution and Implicit Correspondences [89.18705005095359]
3次元形状の完成は、教師付きトレーニングや、完全な形状の例による分布学習によって伝統的に解決される。
近年, 完全な3次元形状の例を必要としない自己指導型学習手法が注目されている。
形状完遂作業のための非対角的自己教師型手法を提案する。
論文 参考訳(メタデータ) (2024-09-24T10:04:38Z) - RealDiff: Real-world 3D Shape Completion using Self-Supervised Diffusion Models [15.209079637302905]
本稿では,実世界の実測に基づく条件生成問題として,点雲完了を定式化する自己教師型フレームワークであるRealDiffを提案する。
具体的には、RealDiffは、タスクのマルチモーダルな性質に対処するために部分入力の生成を条件付けながら、行方不明なオブジェクト部分での拡散プロセスをシミュレートする。
実験結果から,本手法は実世界のクラウド完成度において常に最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-16T11:18:57Z) - Local Occupancy-Enhanced Object Grasping with Multiple Triplanar Projection [24.00828999360765]
本稿では,一般的な物体をロボットでつかむという課題に対処する。
提案したモデルはまず、シーン内で最も可能性の高いいくつかの把握ポイントを提案する。
各グリップポイントの周囲に、モジュールはその近傍にある任意のボクセルが空か、ある物体に占有されているかを推測するように設計されている。
モデルはさらに、局所占有力向上した物体形状情報を利用して、6-DoFグリップポーズを推定する。
論文 参考訳(メタデータ) (2024-07-22T16:22:28Z) - ShapeGrasp: Zero-Shot Task-Oriented Grasping with Large Language Models through Geometric Decomposition [8.654140442734354]
不慣れな物体のタスク指向の把握は、動的家庭環境におけるロボットにとって必要なスキルである。
本稿では,対象物体の幾何学的分解を簡単な凸形状に生かしたゼロショットタスク指向の把握手法を提案する。
このアプローチでは、ゼロショットタスク指向の把握を容易にするために、最小限の必須情報(オブジェクト名と意図したタスク)を使用します。
論文 参考訳(メタデータ) (2024-03-26T19:26:53Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [71.91424164693422]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - DiffComplete: Diffusion-based Generative 3D Shape Completion [114.43353365917015]
3次元レンジスキャンにおける形状完成のための拡散に基づく新しいアプローチを提案する。
私たちはリアリズム、マルチモダリティ、高忠実さのバランスを取ります。
DiffCompleteは2つの大規模3次元形状補完ベンチマークに新しいSOTA性能を設定する。
論文 参考訳(メタデータ) (2023-06-28T16:07:36Z) - Towards Confidence-guided Shape Completion for Robotic Applications [6.940242990198]
深層学習は、部分的な視覚データから完全な3Dオブジェクト表現を推測する効果的な方法として牽引され始めている。
本稿では,各再構成点に対する信頼度を示す暗黙の3次元表現に基づくオブジェクト形状完備化手法を提案する。
再構成された形状と地上の真実を比較し,ロボットの把握パイプラインに形状完了アルゴリズムを配置することにより,我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2022-09-09T13:48:24Z) - Probabilistic Implicit Scene Completion [6.954686339092988]
大規模3次元シーンの連続幾何学に拡張した確率的形状補完法を提案する。
生成セルオートマタを用いてマルチモーダル分布を学習し,定式化を変換して大規模連続幾何処理を行う。
実験により,入力に忠実な多彩なシーンを生成できることが確認された。
論文 参考訳(メタデータ) (2022-04-04T06:16:54Z) - Cascaded Refinement Network for Point Cloud Completion with
Self-supervision [74.80746431691938]
形状整形のための2分岐ネットワークを提案する。
第1分枝は、完全なオブジェクトを合成するためのカスケード形状補完サブネットワークである。
第2のブランチは、元の部分入力を再構築する自動エンコーダである。
論文 参考訳(メタデータ) (2020-10-17T04:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。