論文の概要: 6-DoF Stability Field via Diffusion Models
- arxiv url: http://arxiv.org/abs/2310.17649v1
- Date: Thu, 26 Oct 2023 17:59:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 18:16:02.765241
- Title: 6-DoF Stability Field via Diffusion Models
- Title(参考訳): 拡散モデルによる6-DoF安定場
- Authors: Takuma Yoneda, Tianchong Jiang, Gregory Shakhnarovich, Matthew R.
Walter
- Abstract要約: 本研究では,シーンの安定な構成を生成するオブジェクトの3次元ポーズを生成可能な生成モデルである6-DoFusionを提案する。
異なるオブジェクト配置と積み重ねタスクでモデルを評価し、安定したシーンを構築する能力を示す。
- 参考スコア(独自算出の注目度): 9.631625582146537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A core capability for robot manipulation is reasoning over where and how to
stably place objects in cluttered environments. Traditionally, robots have
relied on object-specific, hand-crafted heuristics in order to perform such
reasoning, with limited generalizability beyond a small number of object
instances and object interaction patterns. Recent approaches instead learn
notions of physical interaction, namely motion prediction, but require
supervision in the form of labeled object information or come at the cost of
high sample complexity, and do not directly reason over stability or object
placement. We present 6-DoFusion, a generative model capable of generating 3D
poses of an object that produces a stable configuration of a given scene.
Underlying 6-DoFusion is a diffusion model that incrementally refines a
randomly initialized SE(3) pose to generate a sample from a learned,
context-dependent distribution over stable poses. We evaluate our model on
different object placement and stacking tasks, demonstrating its ability to
construct stable scenes that involve novel object classes as well as to improve
the accuracy of state-of-the-art 3D pose estimation methods.
- Abstract(参考訳): ロボット操作のコアとなる能力は、オブジェクトを散らばった環境で安定的に配置する方法を推論することである。
伝統的に、ロボットは、少数のオブジェクトインスタンスやオブジェクトの相互作用パターンを超えて、そのような推論を行うために、オブジェクト固有の手作りのヒューリスティックに依存してきた。
近年のアプローチでは、物理相互作用の概念、すなわち運動予測を学習するが、ラベル付けされたオブジェクト情報の形での監督を必要とするか、高いサンプルの複雑さの犠牲となるか、安定性やオブジェクト配置を直接的に理由づける必要はない。
本研究では,シーンの安定な構成を生成するオブジェクトの3次元ポーズを生成可能な生成モデルである6-DoFusionを提案する。
6-DoFusionの下では、ランダムに初期化されたSE(3)ポーズを漸進的に洗練し、安定したポーズに対する学習された文脈依存分布からサンプルを生成する拡散モデルである。
異なるオブジェクト配置とスタックタスクに関するモデルを評価し、新しいオブジェクトクラスを含む安定したシーンを構築する能力を示し、最先端の3dポーズ推定手法の精度を向上させる。
関連論文リスト
- Mixed Diffusion for 3D Indoor Scene Synthesis [55.94569112629208]
混合離散連続拡散モデルアーキテクチャであるMiDiffusionを提案する。
シーンレイアウトを2次元のフロアプランとオブジェクトの集合で表現し、それぞれがそのカテゴリ、場所、サイズ、方向で定義する。
実験により,MiDiffusionは床条件下での3次元シーン合成において,最先端の自己回帰モデルや拡散モデルよりもかなり優れていることが示された。
論文 参考訳(メタデータ) (2024-05-31T17:54:52Z) - Uncertainty-aware Active Learning of NeRF-based Object Models for Robot Manipulators using Visual and Re-orientation Actions [8.059133373836913]
本稿では,ロボットが対象物の完全な3次元モデルを高速に学習し,不慣れな方向で操作できるアプローチを提案する。
我々は、部分的に構築されたNeRFモデルのアンサンブルを用いて、モデルの不確実性を定量化し、次の動作を決定する。
提案手法は, 部分的NeRFモデルにより対象物をいつ, どのように把握し, 再指向するかを判断し, 相互作用中に導入された不整合を補正するために, 対象のポーズを再推定する。
論文 参考訳(メタデータ) (2024-04-02T10:15:06Z) - Fit-NGP: Fitting Object Models to Neural Graphics Primitives [19.513102875891775]
本研究では, 高精度なポーズ推定法として, 最先端の高効率放射場再構成法によって生成された密度場が適していることを示す。
本稿では,手首にカメラを装着したロボットアームを用いた完全自動ポーズ推定システムを提案する。
論文 参考訳(メタデータ) (2024-01-04T16:57:56Z) - 3D-Aware Hypothesis & Verification for Generalizable Relative Object
Pose Estimation [69.73691477825079]
一般化可能なオブジェクトポーズ推定の問題に対処する新しい仮説検証フレームワークを提案する。
信頼性を計測するために,2つの入力画像から学習した3次元オブジェクト表現に3次元変換を明示的に適用する3D認識検証を導入する。
論文 参考訳(メタデータ) (2023-10-05T13:34:07Z) - ROAM: Robust and Object-Aware Motion Generation Using Neural Pose
Descriptors [73.26004792375556]
本稿では,3次元オブジェクト認識キャラクタ合成における新しいシーンオブジェクトへのロバストさと一般化が,参照オブジェクトを1つも持たないモーションモデルをトレーニングすることで実現可能であることを示す。
我々は、オブジェクト専用のデータセットに基づいて訓練された暗黙的な特徴表現を活用し、オブジェクトの周りのSE(3)-同変記述体フィールドをエンコードする。
本研究では,3次元仮想キャラクタの動作と相互作用の質,および未知のオブジェクトを持つシナリオに対するロバスト性を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-24T17:59:51Z) - Hierarchical Graph Neural Networks for Proprioceptive 6D Pose Estimation
of In-hand Objects [1.8263882169310044]
マルチモーダル(ビジョンとタッチ)データを組み合わせた階層型グラフニューラルネットワークアーキテクチャを提案する。
また、グラフベースのオブジェクト表現を学習するために、モダリティ内および横断的に情報を流す階層的なメッセージパッシング操作を導入する。
論文 参考訳(メタデータ) (2023-06-28T01:18:53Z) - ShapeShift: Superquadric-based Object Pose Estimation for Robotic
Grasping [85.38689479346276]
現在の技術は参照3Dオブジェクトに大きく依存しており、その一般化性を制限し、新しいオブジェクトカテゴリに拡張するのにコストがかかる。
本稿では,オブジェクトに適合するプリミティブな形状に対してオブジェクトのポーズを予測する,オブジェクトのポーズ推定のためのスーパークワッドリックベースのフレームワークであるShapeShiftを提案する。
論文 参考訳(メタデータ) (2023-04-10T20:55:41Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。