論文の概要: Training-free zero-shot 3D symmetry detection with visual features back-projected to geometry
- arxiv url: http://arxiv.org/abs/2505.24162v1
- Date: Fri, 30 May 2025 03:09:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.744431
- Title: Training-free zero-shot 3D symmetry detection with visual features back-projected to geometry
- Title(参考訳): 幾何学に逆投影された視覚特徴を用いた無訓練ゼロショット3次元対称性検出
- Authors: Isaac Aguirre, Ivan Sipiran,
- Abstract要約: DINOv2のような基礎視覚モデルから視覚的特徴を利用するゼロショット3次元対称性検出のための訓練不要アプローチを提案する。
我々の研究は、基礎視覚モデルが対称性検出のような複雑な3次元幾何学的問題を解くのにどのように役立つかを示す。
- 参考スコア(独自算出の注目度): 0.6445605125467574
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a simple yet effective training-free approach for zero-shot 3D symmetry detection that leverages visual features from foundation vision models such as DINOv2. Our method extracts features from rendered views of 3D objects and backprojects them onto the original geometry. We demonstrate the symmetric invariance of these features and use them to identify reflection-symmetry planes through a proposed algorithm. Experiments on a subset of ShapeNet demonstrate that our approach outperforms both traditional geometric methods and learning-based approaches without requiring any training data. Our work demonstrates how foundation vision models can help in solving complex 3D geometric problems such as symmetry detection.
- Abstract(参考訳): DINOv2のような基礎視覚モデルからの視覚的特徴を生かした、ゼロショット3次元対称性検出のための、シンプルで効果的なトレーニング不要なアプローチを提案する。
提案手法は3次元オブジェクトの描画ビューから特徴を抽出し,元の形状にバックプロジェクションする。
これらの特徴の対称不変性を実証し,提案アルゴリズムを用いて反射対称性平面を同定する。
ShapeNetのサブセットでの実験では、従来の幾何学的手法と学習に基づくアプローチの両方において、トレーニングデータを必要としない性能が向上していることが示されている。
我々の研究は、基礎視覚モデルが対称性検出のような複雑な3次元幾何学的問題を解くのにどのように役立つかを示す。
関連論文リスト
- Symmetry Strikes Back: From Single-Image Symmetry Detection to 3D Generation [29.732780338284353]
我々は,多種多様な実世界のシナリオに対して堅牢な一般化が可能なスケーラブルなゼロショット対称性検出器であるReflect3Dを紹介する。
検出された対称性を単一画像の3D生成パイプラインに組み込むことの実用的利点を示す。
論文 参考訳(メタデータ) (2024-11-26T04:14:31Z) - Partial Symmetry Detection for 3D Geometry using Contrastive Learning
with Geodesic Point Cloud Patches [10.48309709793733]
我々は,測地線点雲パッチの回転,反射,翻訳,スケール不変な局所形状の特徴を学習することを提案する。
この曖昧な問題に対して,本手法は複数の有効な解を抽出可能であることを示す。
検出された対称性を領域成長アルゴリズムと組み合わせて下流タスクを実証する。
論文 参考訳(メタデータ) (2023-12-13T15:48:50Z) - Beyond 3DMM: Learning to Capture High-fidelity 3D Face Shape [77.95154911528365]
3Dモーフィブルモデル(3DMM)の適合性は、その強力な3D先行性のため、顔解析に広く有用である。
以前に再建された3次元顔は、微細な形状が失われるため、視差の低下に悩まされていた。
本論文は, パーソナライズされた形状が対応する人物と同一に見えるよう, パーソナライズされた形状を捉えるための完全な解を提案する。
論文 参考訳(メタデータ) (2022-04-09T03:46:18Z) - SIDER: Single-Image Neural Optimization for Facial Geometric Detail
Recovery [54.64663713249079]
SIDERは、教師なしの方法で単一の画像から詳細な顔形状を復元する新しい光度最適化手法である。
以前の作業とは対照的に、SIDERはデータセットの事前に依存せず、複数のビュー、照明変更、地上の真実の3D形状から追加の監視を必要としない。
論文 参考訳(メタデータ) (2021-08-11T22:34:53Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Learning 3D Face Reconstruction with a Pose Guidance Network [49.13404714366933]
ポーズ誘導ネットワーク(PGN)を用いた単眼3次元顔再構成学習のための自己指導型学習手法を提案する。
まず,従来のパラメトリックな3次元顔の学習手法におけるポーズ推定のボトルネックを明らかにし,ポーズパラメータの推定に3次元顔のランドマークを活用することを提案する。
我々のデザインしたPGNでは、完全にラベル付けされた3Dランドマークと無制限にラベル付けされた未使用の顔画像で両方の顔から学習できる。
論文 参考訳(メタデータ) (2020-10-09T06:11:17Z) - Pix2Surf: Learning Parametric 3D Surface Models of Objects from Images [64.53227129573293]
1つ以上の視点から見れば、新しいオブジェクトの3次元パラメトリック表面表現を学習する際の課題について検討する。
ビュー間で一貫した高品質なパラメトリックな3次元表面を生成できるニューラルネットワークを設計する。
提案手法は,共通対象カテゴリからの形状の公開データセットに基づいて,教師と訓練を行う。
論文 参考訳(メタデータ) (2020-08-18T06:33:40Z) - SymmetryNet: Learning to Predict Reflectional and Rotational Symmetries
of 3D Shapes from Single-View RGB-D Images [26.38270361331076]
本稿では3次元物体の反射対称性と回転対称性の両方を予測できるエンドツーエンドのディープニューラルネットワークを提案する。
単視点RGB-D画像に基づく3次元対称性検出のベンチマークにも貢献する。
論文 参考訳(メタデータ) (2020-08-02T14:10:09Z) - Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction [32.14605731030579]
単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。
従来の手法は通常データ駆動であり、不正確な3次元形状の復元と限定的な一般化能力をもたらす。
本稿では,人造物体によく見られる反射対称性の鏡面を初めて検出し,その対称性の画素内対応を見いだして深度マップを予測する。
論文 参考訳(メタデータ) (2020-06-17T17:58:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。