Fugu-MT 論文翻訳(概要): ShapeICP: Iterative Category-level Object Pose and Shape Estimation from Depth

論文の概要: ShapeICP: Iterative Category-level Object Pose and Shape Estimation from Depth

arxiv url: http://arxiv.org/abs/2408.13147v1
Date: Fri, 23 Aug 2024 15:12:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-26 14:41:09.638825
Title: ShapeICP: Iterative Category-level Object Pose and Shape Estimation from Depth
Title（参考訳）: ShapeICP:反復カテゴリーレベルのオブジェクトポースと深さからの形状推定
Authors: Yihao Zhang, John J. Leonard,
Abstract要約: 単一深度画像からのカテゴリーレベルのオブジェクトのポーズと形状推定は、ロボット工学や自動運転に広く応用されているため、最近研究の注目を集めている。ポーズアノテートされたデータから学習する必要がない反復的推定法を提案する。われわれのアルゴリズムはShapeICPと呼ばれ、ICPアルゴリズムの基盤となっているが、カテゴリレベルのポーズと形状推定のための追加機能を備えている。
参考スコア（独自算出の注目度）: 15.487722156919988
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Category-level object pose and shape estimation from a single depth image has recently drawn research attention due to its wide applications in robotics and self-driving. The task is particularly challenging because the three unknowns, object pose, object shape, and model-to-measurement correspondences, are compounded together but only a single view of depth measurements is provided. The vast majority of the prior work heavily relies on data-driven approaches to obtain solutions to at least one of the unknowns and typically two, running with the risk of failing to generalize to unseen domains. The shape representations used in the prior work also mainly focus on point cloud and signed distance field (SDF). In stark contrast to the prior work, we approach the problem using an iterative estimation method that does not require learning from any pose-annotated data. In addition, we adopt a novel mesh-based object active shape model that has not been explored by the previous literature. Our algorithm, named ShapeICP, has its foundation in the iterative closest point (ICP) algorithm but is equipped with additional features for the category-level pose and shape estimation task. The results show that even without using any pose-annotated data, ShapeICP surpasses many data-driven approaches that rely on the pose data for training, opening up new solution space for researchers to consider.
Abstract（参考訳）: 単一深度画像からのカテゴリーレベルのオブジェクトのポーズと形状推定は、ロボット工学や自動運転に広く応用されているため、最近研究の注目を集めている。この課題は,3つの未知のポーズ,オブジェクト形状,およびモデル間対応が複合されているため,特に困難である。以前の研究の大部分は、未知の領域の少なくとも1つと典型的には2つの解を得るためのデータ駆動アプローチに大きく依存しており、目に見えない領域への一般化に失敗するリスクがある。以前の研究で使われた形状表現は、主に点雲と符号付き距離場(SDF)に焦点を当てている。従来の研究とは対照的に、ポーズアノテートされたデータから学習する必要のない反復推定手法を用いてこの問題にアプローチする。また,従来の文献では検討されていない,メッシュベースのオブジェクトアクティブな形状モデルを採用した。われわれのアルゴリズムはShapeICPと呼ばれ、ICPアルゴリズムの基盤となっているが、カテゴリレベルのポーズと形状推定のための追加機能を備えている。その結果、ShapeICPはポーズアノテートされたデータを使用しなくても、トレーニングのためにポーズデータに依存する多くのデータ駆動アプローチを超越し、研究者が考慮すべき新しいソリューション空間が開かれた。

関連論文リスト

Detection Based Part-level Articulated Object Reconstruction from Single RGBD Image [52.11275397911693]
本稿では,1枚のRGBD画像から複数の人工関節オブジェクトを再構成する,エンドツーエンドで訓練可能なクロスカテゴリ手法を提案する。私たちは、あらかじめ定義された部分数で人工的なオブジェクトに焦点をあて、インスタンスレベルの潜在空間を学習することに依存する以前の作業から離れています。提案手法は, 従来の作業では処理できない様々な構成された複数インスタンスの再構築に成功し, 形状再構成や運動学推定において, 先行の作業よりも優れていた。
論文参考訳（メタデータ） (2025-04-04T05:08:04Z)
Particle-based 6D Object Pose Estimation from Point Clouds using Diffusion Models [15.582644209879957]
本研究では,6次元オブジェクトのポーズ推定のための拡散モデルを提案する。推論の間、訓練された生成モデルは複数の粒子、すなわち仮説をサンプリングすることができる。本稿では,追加のトレーニングや計算集約的な操作を必要としない2つの新規かつ効果的なポーズ選択戦略を提案する。
論文参考訳（メタデータ） (2024-12-01T14:52:44Z)
Local Occupancy-Enhanced Object Grasping with Multiple Triplanar Projection [24.00828999360765]
本稿では,一般的な物体をロボットでつかむという課題に対処する。提案したモデルはまず、シーン内で最も可能性の高いいくつかの把握ポイントを提案する。各グリップポイントの周囲に、モジュールはその近傍にある任意のボクセルが空か、ある物体に占有されているかを推測するように設計されている。モデルはさらに、局所占有力向上した物体形状情報を利用して、6-DoFグリップポーズを推定する。
論文参考訳（メタデータ） (2024-07-22T16:22:28Z)
Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文参考訳（メタデータ） (2024-05-13T14:44:22Z)
DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。本稿では,DVMNet(Deep Voxel Matching Network)を提案する。提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文参考訳（メタデータ） (2024-03-20T15:41:32Z)
Diffusion-Driven Self-Supervised Learning for Shape Reconstruction and Pose Estimation [26.982199143972835]
本稿では,多目的形状再構成とカテゴリー的ポーズ推定のための拡散駆動型自己教師ネットワークを提案する。提案手法は,最先端の自己監督型カテゴリレベルのベースラインを著しく上回り,完全教師型インスタンスレベルのメソッドやカテゴリレベルのメソッドをはるかに上回っている。
論文参考訳（メタデータ） (2024-03-19T13:43:27Z)
GS-Pose: Category-Level Object Pose Estimation via Geometric and Semantic Correspondence [5.500735640045456]
カテゴリーレベルのポーズ推定は、コンピュータビジョンやロボット工学における多くの潜在的な応用において難しい課題である。本稿では,事前学習した基礎モデルから得られる幾何学的特徴と意味的特徴の両方を活用することを提案する。これは、セマンティックな特徴がオブジェクトのテクスチャや外観に対して堅牢であるため、以前のメソッドよりもトレーニングするデータを大幅に少なくする。
論文参考訳（メタデータ） (2023-11-23T02:35:38Z)
Rigidity-Aware Detection for 6D Object Pose Estimation [60.88857851869196]
最近の6Dオブジェクトのポーズ推定方法は、最初にオブジェクト検出を使用して2Dバウンディングボックスを取得し、実際にポーズを回帰する。本研究では,6次元ポーズ推定において対象物体が剛性であるという事実を利用した剛性認識検出手法を提案する。このアプローチの成功の鍵となるのは可視性マップであり、これは境界ボックス内の各ピクセルとボックス境界の間の最小障壁距離を用いて構築することを提案する。
論文参考訳（メタデータ） (2023-03-22T09:02:54Z)
Generative Category-Level Shape and Pose Estimation with Semantic Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文参考訳（メタデータ） (2022-10-03T17:51:54Z)
RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation [103.74918834553247]
カテゴリーレベルのオブジェクトポーズ推定は、既知のカテゴリの集合からの任意のオブジェクトの3次元メートル法サイズだけでなく、6次元のポーズを予測することを目的としている。近年の手法では, 観測された点雲を標準空間にマッピングし, 梅山アルゴリズムを用いてポーズとサイズを復元する手法が提案されている。本稿では,オブジェクトのポーズと残差ベクトルを共同で予測する,幾何学誘導型残差オブジェクト境界ボックス投影ネットワーク RBP-Pose を提案する。
論文参考訳（メタデータ） (2022-07-30T14:45:20Z)
Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文参考訳（メタデータ） (2022-06-23T16:29:53Z)
Category-Agnostic 6D Pose Estimation with Conditional Neural Processes [19.387280883044482]
未知物体の6次元ポーズ推定のためのメタラーニング手法を提案する。本アルゴリズムは,オブジェクトの表現をカテゴリに依存しない方法で学習し,オブジェクトカテゴリをまたいだ強力な一般化機能を実現する。
論文参考訳（メタデータ） (2022-06-14T20:46:09Z)
FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文参考訳（メタデータ） (2022-03-28T10:31:29Z)
Locally Aware Piecewise Transformation Fields for 3D Human Mesh Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文参考訳（メタデータ） (2021-04-16T15:16:09Z)
Continuous Surface Embeddings [76.86259029442624]
我々は、変形可能な対象カテゴリーにおける密接な対応を学習し、表現するタスクに焦点をあてる。本稿では,高密度対応の新たな学習可能な画像ベース表現を提案する。提案手法は,人間の身近なポーズ推定のための最先端手法と同等以上の性能を示すことを示す。
論文参考訳（メタデータ） (2020-11-24T22:52:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。