Fugu-MT 論文翻訳(概要): CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation

論文の概要: CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation

arxiv url: http://arxiv.org/abs/2211.13398v2
Date: Wed, 6 Sep 2023 16:47:31 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-07 19:56:48.373268
Title: CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation
Title（参考訳）: CPPF++: 投票集約による不確かさを意識したSim2Real Object Poseの推定
Authors: Yang You, Wenhao He, Jin Liu, Hongkai Xiong, Weiming Wang, Cewu Lu
Abstract要約: CPPF++は、sim-to-realのポーズ推定のために設計されている。カテゴリレベルのポーズ推定データセットであるDiversePose 300を提案する。
参考スコア（独自算出の注目度）: 71.13049562721085
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Object pose estimation constitutes a critical area within the domain of 3D vision. While contemporary state-of-the-art methods that leverage real-world pose annotations have demonstrated commendable performance, the procurement of such real-world training data incurs substantial costs. This paper focuses on a specific setting wherein only 3D CAD models are utilized as a priori knowledge, devoid of any background or clutter information. We introduce a novel method, CPPF++, designed for sim-to-real pose estimation. This method builds upon the foundational point-pair voting scheme of CPPF, reconceptualizing it through a probabilistic lens. To address the challenge of voting collision, we model voting uncertainty by estimating the probabilistic distribution of each point pair within the canonical space. This approach is further augmented by iterative noise filtering, employed to eradicate votes associated with backgrounds or clutters. Additionally, we enhance the context provided by each voting unit by introducing $N$-point tuples. In conjunction with this methodological contribution, we present a new category-level pose estimation dataset, DiversePose 300. This dataset is specifically crafted to facilitate a more rigorous evaluation of current state-of-the-art methods, encompassing a broader and more challenging array of real-world scenarios. Empirical results substantiate the efficacy of our proposed method, revealing a significant reduction in the disparity between simulation and real-world performance.
Abstract（参考訳）: オブジェクトのポーズ推定は、3次元視覚領域内の重要な領域を構成する。実世界のポーズアノテーションを利用する現代的最先端の手法は、賞賛できる性能を示しているが、そのような実世界のトレーニングデータの調達は相当なコストをもたらす。本稿では,3次元CADモデルのみを事前知識として利用し,背景情報や乱雑な情報を含まない,特定の環境に着目する。我々は,シミュレートからリアルなポーズ推定のための新しいCPPF++を提案する。この方法はCPPFの基本点対投票方式に基づいており、確率レンズで再認識する。本研究では,各点対の確率分布を正準空間内で推定することにより,投票の不確実性をモデル化する。このアプローチは、バックグラウンドやクラッターに関連する投票を根絶するために使用される反復的ノイズフィルタリングによってさらに強化される。さらに、n$-pointタプルを導入することで、各投票ユニットが提供するコンテキストを強化する。提案手法と合わせて,新たなカテゴリレベルのポーズ推定データセットであるDiversePose 300を提案する。このデータセットは、現在の最先端のメソッドをより厳格に評価し、より広く、より困難な現実のシナリオを包含するように設計されている。実験の結果,提案手法の有効性を実証し,シミュレーションと実世界の性能の相違を著しく低減した。

関連論文リスト

A Multi-Level Similarity Approach for Single-View Object Grasping: Matching, Planning, and Fine-Tuning [17.162675084829242]
一つの視点から3つの重要なステップを通して、未知の物体をしっかりと把握する手法を提案する。本稿では, 意味的, 幾何学的, 次元的特徴を統合し, 包括的評価を行う多層類似性マッチングフレームワークを提案する。さらに,大規模言語モデルの導入,半指向境界ボックスの導入,平面検出に基づく新たなポイントクラウド登録手法の開発などを行い,単一ビュー条件下でのマッチング精度の向上を図る。
論文参考訳（メタデータ） (2025-07-16T06:07:57Z)
BoxDreamer: Dreaming Box Corners for Generalizable Object Pose Estimation [58.14071520415005]
本稿では、スパースビュー設定における課題に対処するために、オブジェクトポーズ推定のための汎用RGBベースのアプローチを提案する。これらの制約を克服するために、オブジェクトのポーズの中間表現としてオブジェクト境界ボックスのコーナーポイントを導入する。 3Dオブジェクトコーナーはスパース入力ビューから確実に復元でき、対象ビューの2Dコーナーポイントは、新しい参照ベースポイントデータセットによって推定される。
論文参考訳（メタデータ） (2025-04-10T17:58:35Z)
Boundary Exploration of Next Best View Policy in 3D Robotic Scanning [6.1938383008964495]
NBV問題(Next Best View)は、3Dロボットスキャンにおける重要な課題である。そこで本研究では,次の視点でスキャンした点雲の境界を内在的に検討したNBVポリシーを提案する。本稿では,参照モデルに基づいて候補ビューを反復的に提案するモデルベースアプローチを提案する。さらに,NBVをスキャンデータから直接予測する境界探索NBVネットワーク(BENBV-Net)を提案する。
論文参考訳（メタデータ） (2024-12-11T16:11:13Z)
Can foundation models actively gather information in interactive environments to test hypotheses? [56.651636971591536]
隠れた報酬関数に影響を与える要因をモデルが決定しなければならない枠組みを導入する。自己スループットや推論時間の増加といったアプローチが情報収集効率を向上させるかどうかを検討する。
論文参考訳（メタデータ） (2024-12-09T12:27:21Z)
UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文参考訳（メタデータ） (2024-04-23T00:18:00Z)
Visibility-Aware Keypoint Localization for 6DoF Object Pose Estimation [56.07676459156789]
2次元画像における3Dキーポイントの局所化は、6DoFオブジェクトのポーズ推定のための3D-2D対応を確立する効果的な方法である。本稿では、重要なキーポイントを可視性の観点からローカライズすることでこの問題に対処する。我々は、可視性を考慮した重要度と最先端のポーズ推定アルゴリズムを統合することにより、VAPO(Visibility-Aware POse estimator)を構築する。
論文参考訳（メタデータ） (2024-03-21T16:59:45Z)
Source-Free and Image-Only Unsupervised Domain Adaptation for Category Level Object Pose Estimation [18.011044932979143]
3DUDAは、3Dや深度データを使わずに、ニュアンスドライデンのターゲットドメインに適応できる手法である。対象のカテゴリを単純な立方体メッシュとして表現し、ニューラル特徴活性化の生成モデルを利用する。本手法は,グローバルな擬似ラベル付きデータセットの微調整を軽度な仮定でシミュレートする。
論文参考訳（メタデータ） (2024-01-19T17:48:05Z)
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文参考訳（メタデータ） (2023-12-13T18:28:09Z)
Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文参考訳（メタデータ） (2022-04-12T15:03:51Z)
CPPF: Towards Robust Category-Level 9D Pose Estimation in the Wild [45.93626858034774]
カテゴリーレベルのPPF投票法は、野生における正確で堅牢で一般化可能な9Dポーズ推定を実現する。ノイズの多い点対のサンプルを排除し、個体群から最終的な予測を生成するために、新しい粗大な投票アルゴリズムを提案する。我々の手法は実世界のトレーニングデータと同等である。
論文参考訳（メタデータ） (2022-03-07T01:36:22Z)
Sim2Real Object-Centric Keypoint Detection and Description [40.58367357980036]
キーポイントの検出と記述はコンピュータビジョンにおいて中心的な役割を果たす。対象中心の定式化を提案し、各関心点が属する対象をさらに特定する必要がある。我々はシミュレーションで訓練されたモデルを現実のアプリケーションに一般化できるsim2realコントラスト学習機構を開発した。
論文参考訳（メタデータ） (2022-02-01T15:00:20Z)
Robust Ego and Object 6-DoF Motion Estimation and Tracking [5.162070820801102]
本稿では,動的多体視覚計測における高精度な推定と一貫した追跡性を実現するためのロバストな解を提案する。セマンティック・インスタンスレベルのセグメンテーションと正確な光フロー推定の最近の進歩を活用して、コンパクトで効果的なフレームワークを提案する。追従点の品質と運動推定精度を向上させる新しい定式化SE(3)運動と光流が導入された。
論文参考訳（メタデータ） (2020-07-28T05:12:56Z)
Inference Stage Optimization for Cross-scenario 3D Human Pose Estimation [97.93687743378106]
既存の3Dポーズ推定モデルは、目に見えないポーズを持つ新しいシナリオに適用する場合、パフォーマンス低下を被る。本稿では、3次元ポーズモデルの一般化性を改善するための新しいフレームワークである推論段階最適化(ISO)を提案する。注目すべきは、MPI-INF-3DHPで83.6%の最先端の3D PCKが得られることだ。
論文参考訳（メタデータ） (2020-07-04T09:45:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。