論文の概要: OneViewAll: Semantic Prior Guided One-View 6D Pose Estimation for Novel Objects
- arxiv url: http://arxiv.org/abs/2605.07023v1
- Date: Thu, 07 May 2026 23:11:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.666018
- Title: OneViewAll: Semantic Prior Guided One-View 6D Pose Estimation for Novel Objects
- Title(参考訳): OneViewAll:新しいオブジェクトに対するセマンティック事前ガイド1-View 6D Poseの推定
- Authors: Yang Luo, Yan Gong, Yongsheng Gao, Jie Zhao, Xinyu Zhang, Huaping Liu,
- Abstract要約: 多くの実用的な6Dオブジェクトのポーズ推定シナリオでは、CADモデルなしで、オブジェクトごとに1つの実世界のRGB-D参照ビューしかアクセスできないことが多い。
我々は,新しいプロジェクト・アンド・コンペアパラダイムを用いてポーズ推定を行うセマンティック・プライア・ガイダンス・フレームワークである textbfOneViewAll を提案する。
- 参考スコア(独自算出の注目度): 31.001161060131622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many practical 6D object pose estimation scenarios, we often have access to only a single real-world RGB-D reference view per object, typically without CAD models. Existing methods largely rely on explicit 3D models or multi-view data, which limits their scalability. To address this challenging single-reference model-free setting, we propose \textbf{OneViewAll}, a semantic-prior-guided framework that performs pose estimation via a novel Project-and-Compare paradigm. Instead of relying on computationally expensive CAD-based rendering, our method directly aligns reference and query observations within a projection-equivariant space. OneViewAll progressively integrates hierarchical semantic priors across three levels: (1) \textit{category- and scene-level} priors for efficient hypothesis initialization; (2) \textit{object-level symmetry} priors for geometry completion via mirror fusion; and (3) \textit{patch-level} priors for discriminative refinement. Extensive experiments demonstrate that OneViewAll achieves \textbf{92.5\%} ADD-0.1 accuracy on the LINEMOD dataset using only one real reference view -- significantly outperforming the CVPR 2025 baseline One2Any (52.6\%). It also yields consistent improvements on YCB-V, Real275, and Toyota-Light while maintaining low inference latency. Our results underscore the efficacy of symmetry-aware projection in handling symmetric, texture-less, and occluded objects.
- Abstract(参考訳): 多くの実用的な6Dオブジェクトのポーズ推定シナリオでは、CADモデルなしで、オブジェクトごとに1つの実世界のRGB-D参照ビューしかアクセスできないことが多い。
既存の方法は、スケーラビリティを制限する明示的な3Dモデルやマルチビューデータに大きく依存している。
この挑戦的な単一参照モデルフリー設定を解決するために,新しいProject-and-Compareパラダイムを通じてポーズ推定を行うセマンティック・プライア・ガイド付きフレームワークである‘textbf{OneViewAll} を提案する。
計算コストのかかるCADベースのレンダリングに頼る代わりに,提案手法は投射同変空間内の参照とクエリの観察を直接調整する。
OneViewAllは、効率的な仮説初期化のための(1) \textit{category- and scene-level} pres、(2) \textit{object-level symmetric} pres for geometry completion via mirror fusion; (3) \textit{patch-level} pres for discriminative refinement という3つの階層的セマンティクスを段階的に統合する。
大規模な実験によると、OneViewAllは1つの実参照ビューのみを使用してLINEMODデータセット上で、textbf{92.5\%} ADD-0.1精度を達成する。
また、低推論レイテンシを維持しながら、CB-V、Real275、Toyota-Lightを一貫して改善する。
本研究は, 対称, テクスチャレス, 隠蔽対象の対応において, 対称性を考慮した投射が有効であることを示すものである。
関連論文リスト
- Object Pose Transformer: Unifying Unseen Object Pose Estimation [54.20344997573707]
モデルなしのオブジェクトポーズ推定を未知のインスタンスで学習することは、3Dビジョンにおける根本的な課題である。
我々のチームは、RGB入力から深度、ポイントマップ、カメラパラメータ、正規化されたオブジェクト座標を共同で予測します。
当社はカメラ非依存で、カメラ固有の知識をオンザフライで学習し、メトリックスケールリカバリのためのオプションの深度入力をサポートします。
論文 参考訳(メタデータ) (2026-03-24T16:04:16Z) - AlignPose: Generalizable 6D Pose Estimation via Multi-view Feature-metric Alignment [18.198789096671245]
本稿では,複数のRGBビューから情報を集約する6次元オブジェクトポーズ推定手法であるAlignPoseを紹介する。
このアプローチの鍵となるコンポーネントは、オブジェクトのポーズ用に特別に設計された、新しいマルチビュー特徴量改善である。
単一の一貫した世界フレームオブジェクトのポーズを最適化し、オンザフライでレンダリングされたオブジェクト特徴と観察された画像特徴との間の特徴差を最小限にする。
論文 参考訳(メタデータ) (2025-12-23T17:29:08Z) - Zero-shot Inexact CAD Model Alignment from a Single Image [53.37898107159792]
1つの画像から3Dシーン構造を推測する実践的なアプローチは、データベースから密に一致する3Dモデルを検索し、画像内のオブジェクトと整列させることである。
既存のメソッドは、イメージによる教師付きトレーニングとアノテーションのポーズに依存しており、オブジェクトカテゴリの狭いセットに制限されている。
ポーズアノテーションを必要とせず、未知のカテゴリに一般化する不正確な3次元モデルの弱い教師付き9-DoFアライメント法を提案する。
論文 参考訳(メタデータ) (2025-07-04T04:46:59Z) - Novel Object 6D Pose Estimation with a Single Reference View [51.61766126145154]
既存のオブジェクト6Dのポーズ推定手法はCADモデルや高密度参照ビューに依存するのが一般的である。
単一参照に基づく新しいオブジェクト6D(SinRef-6D)のポーズ推定法を提案する。
私たちのキーとなるアイデアは、共通座標系において、ポイントワイドアライメントを反復的に確立することです。
論文 参考訳(メタデータ) (2025-03-07T17:00:41Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - FoundPose: Unseen Object Pose Estimation with Foundation Features [11.32559845631345]
FoundPoseは、単一のRGB画像から見えないオブジェクトを6Dポーズで推定するモデルベースの手法である。
この方法は、オブジェクトやタスク固有のトレーニングを必要とせずに、3Dモデルを使って、新しいオブジェクトを素早くオンボードできる。
論文 参考訳(メタデータ) (2023-11-30T18:52:29Z) - Next-best-view Regression using a 3D Convolutional Neural Network [0.9449650062296823]
本論文では,次のベストビュー問題に対するデータ駆動アプローチを提案する。
提案手法は、次のベストビューのbtxtpositionを抑えるために、以前の再構成で3D畳み込みニューラルネットワークを訓練する。
提案手法を2つの実験グループを用いて検証した。
論文 参考訳(メタデータ) (2021-01-23T01:50:26Z) - Monocular 3D Detection with Geometric Constraints Embedding and
Semi-supervised Training [3.8073142980733]
我々は,KM3D-Netと呼ばれる,RGB画像のみを用いたモノクル3Dオブジェクト検出のための新しいフレームワークを提案する。
我々は、対象のキーポイント、次元、方向を予測するための完全な畳み込みモデルを設計し、これらの推定を視点幾何学的制約と組み合わせて位置属性を計算する。
論文 参考訳(メタデータ) (2020-09-02T00:51:51Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。