論文の概要: Learning Positive-Incentive Point Sampling in Neural Implicit Fields for Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2602.19937v1
- Date: Mon, 23 Feb 2026 15:10:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.872799
- Title: Learning Positive-Incentive Point Sampling in Neural Implicit Fields for Object Pose Estimation
- Title(参考訳): 物体姿勢推定のためのニューラルインプシティフィールドにおける正のインセンティブ点サンプリングの学習
- Authors: Yifei Shi, Boyan Wan, Xin Xu, Kai Xu,
- Abstract要約: 3次元形状の暗黙的学習は、任意の解像度での形状表現を可能にする急速に発展する分野である。
本稿では,SO(3)-等価な畳み込み型暗黙ネットワークとPIPS戦略を組み合わせた手法を提案する。
提案手法は3つのポーズ推定データセットにおいて最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 17.52581598592474
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning neural implicit fields of 3D shapes is a rapidly emerging field that enables shape representation at arbitrary resolutions. Due to the flexibility, neural implicit fields have succeeded in many research areas, including shape reconstruction, novel view image synthesis, and more recently, object pose estimation. Neural implicit fields enable learning dense correspondences between the camera space and the object's canonical space-including unobserved regions in camera space-significantly boosting object pose estimation performance in challenging scenarios like highly occluded objects and novel shapes. Despite progress, predicting canonical coordinates for unobserved camera-space regions remains challenging due to the lack of direct observational signals. This necessitates heavy reliance on the model's generalization ability, resulting in high uncertainty. Consequently, densely sampling points across the entire camera space may yield inaccurate estimations that hinder the learning process and compromise performance. To alleviate this problem, we propose a method combining an SO(3)-equivariant convolutional implicit network and a positive-incentive point sampling (PIPS) strategy. The SO(3)-equivariant convolutional implicit network estimates point-level attributes with SO(3)-equivariance at arbitrary query locations, demonstrating superior performance compared to most existing baselines. The PIPS strategy dynamically determines sampling locations based on the input, thereby boosting the network's accuracy and training efficiency. Our method outperforms the state-of-the-art on three pose estimation datasets. Notably, it demonstrates significant improvements in challenging scenarios, such as objects captured with unseen pose, high occlusion, novel geometry, and severe noise.
- Abstract(参考訳): 3次元形状の暗黙的学習は、任意の解像度での形状表現を可能にする急速に発展する分野である。
この柔軟性のため、形状再構成、新しいビュー画像合成、最近ではオブジェクトポーズ推定など、多くの研究領域でニューラル暗黙フィールドが成功している。
ニューラル暗黙のフィールドは、カメラ空間とオブジェクトの標準空間を含む未観測領域との間の密接な対応を学習することができる。
進歩にもかかわらず、観測されていないカメラ空間領域の標準座標の予測は、直接観測信号が欠如しているため、依然として困難である。
これはモデルの一般化能力に大きく依存する必要があり、高い不確実性をもたらす。
したがって、カメラ空間全体にわたる高密度サンプリングポイントは、学習過程を妨げ、性能を損なう不正確な推定をもたらす可能性がある。
この問題を軽減するために,SO(3)-同変の畳み込み型暗黙ネットワークと正インセンティブ点サンプリング(PIPS)戦略を組み合わせた手法を提案する。
SO(3)-equivariant convolutional implicit network estimates point-level attribute with SO(3)-equivariance at arbitrary query location, showed excellent performance than most existing baselines。
PIPS戦略は、入力に基づいてサンプリング位置を動的に決定し、ネットワークの精度とトレーニング効率を高める。
提案手法は3つのポーズ推定データセットにおいて最先端の手法より優れている。
特に、目に見えないポーズでキャプチャされたオブジェクト、高い閉塞性、新しい幾何学、厳しい騒音など、困難なシナリオにおいて、大きな改善が示されています。
関連論文リスト
- Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - Unsupervised Occupancy Learning from Sparse Point Cloud [8.732260277121547]
Inlicit Neural Representationsは、複雑なデータモダリティをキャプチャする強力なフレームワークとして注目されている。
本稿では,ニューラルサイン付き距離関数の代わりに占有領域を推定する手法を提案する。
ベースラインに対する暗黙の形状推論を改善する能力と、合成データと実データを用いた最先端技術について強調する。
論文 参考訳(メタデータ) (2024-04-03T14:05:39Z) - IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - Source-Free and Image-Only Unsupervised Domain Adaptation for Category
Level Object Pose Estimation [18.011044932979143]
3DUDAは、3Dや深度データを使わずに、ニュアンスドライデンのターゲットドメインに適応できる手法である。
対象のカテゴリを単純な立方体メッシュとして表現し、ニューラル特徴活性化の生成モデルを利用する。
本手法は,グローバルな擬似ラベル付きデータセットの微調整を軽度な仮定でシミュレートする。
論文 参考訳(メタデータ) (2024-01-19T17:48:05Z) - CheckerPose: Progressive Dense Keypoint Localization for Object Pose
Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。
近年の研究では、高密度対応型解の大きな可能性を示している。
そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:30:53Z) - Semi-signed neural fitting for surface reconstruction from unoriented
point clouds [53.379712818791894]
より優れた符号付き距離場を再構成するためのSN-Fittingを提案する。
SSNフィッティングは半署名の監督と損失に基づく領域サンプリング戦略で構成されている。
我々は,SSN-Fittingが,異なる設定下で最先端の性能を達成することを示す実験を行う。
論文 参考訳(メタデータ) (2022-06-14T09:40:17Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。