論文の概要: ArchSym: Detecting 3D-Grounded Architectural Symmetries in the Wild
- arxiv url: http://arxiv.org/abs/2604.22202v1
- Date: Fri, 24 Apr 2026 04:12:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.337106
- Title: ArchSym: Detecting 3D-Grounded Architectural Symmetries in the Wild
- Title(参考訳): ArchSymは、野生の3Dグラウンドアーキテクチャの対称性を検知する
- Authors: Hanyu Chen, Ruojin Cai, Steve Marschner, Noah Snavely,
- Abstract要約: 建築ランドマークに焦点を絞った1枚のRGB画像から3次元地上反射対称性を検出するための最初のフレームワークを提案する。
本研究では,(1)SfM再構成の大規模データセットであるArchSymを自動的にキュレートするスケーラブルなデータアノテーションパイプライン,(2)予測されたシーン幾何に比例して定義された符号付き距離マップをパラメータ化して3次元の対称性を正確にローカライズするシングルビュー対称性検出器を導入する。
- 参考スコア(独自算出の注目度): 29.918676050874964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symmetry detection is a fundamental problem in computer vision, and symmetries serve as powerful priors for downstream tasks. However, existing learning-based methods for detecting 3D symmetries from single images have been almost exclusively trained and evaluated on object-centric or synthetic datasets, and thus fail to generalize to real-world scenes. Furthermore, due to the inherent scale ambiguity of monocular inputs, which makes localizing the 3D plane an ill-posed problem, many existing works only predict the plane's orientation. In this paper, we address these limitations by presenting the first framework for detecting 3D-grounded reflectional symmetries from single, in-the-wild RGB images, focusing on architectural landmarks. We introduce two key innovations: (1) a scalable data annotation pipeline to automatically curate a large-scale dataset of architectural symmetries, ArchSym, from SfM reconstructions by leveraging cross-view image matching; and building on the dataset, (2) a single-view symmetry detector that accurately localizes symmetries in 3D by parameterizing them as signed distance maps defined relative to predicted scene geometry. We validate our symmetry annotation pipeline against geometry-based alternatives and demonstrate that our symmetry detector significantly outperforms state-of-the-art baselines on our new benchmark.
- Abstract(参考訳): 対称性検出はコンピュータビジョンの基本的な問題であり、下流タスクの強力な先行要因として機能する。
しかし、既存の学習に基づく1枚の画像から3次元対称性を検出する方法は、オブジェクト中心または合成データセットでほとんど訓練され評価されており、現実世界のシーンに一般化することができない。
さらに、単分子入力の本質的にのスケールの曖昧さにより、3次元平面の局所化が不適切な問題となるため、既存の多くの研究は平面の向きを予測しているだけである。
本稿では,建築ランドマークに焦点をあて,単一のRGB画像から3次元地上反射対称性を検出するための最初のフレームワークを提示することによって,これらの制約に対処する。
本稿では,(1)SfM再構成の大規模データセットであるArchSymを自動的にキュレートするスケーラブルなデータアノテーションパイプライン,(2)3次元の対称性を正確に定位する単一視点対称性検出器,の2点を紹介する。
我々は,我々の対称性アノテーションパイプラインを幾何学に基づく代替品に対して検証し,我々の対称性検出器が我々の新しいベンチマークで最先端のベースラインを著しく上回っていることを示す。
関連論文リスト
- Learning 3D Representations for Spatial Intelligence from Unposed Multi-View Images [81.94999489820974]
UniSplat (UniSplat) は、未提示のマルチビュー画像から3D表現を学習するためのフィードフォワードフレームワークである。
エンコーダにおける幾何誘導を強化するデュアルマスキング戦略を導入する。
第2に,外見のセマンティックな矛盾を解消する粗大なガウス的スプレイティング戦略を開発する。
第3に、予測された3次元点と意味マップを画像平面に相互に関連付ける、ポーズ条件の補正機構を導入する。
論文 参考訳(メタデータ) (2026-04-12T10:36:18Z) - PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting [56.188624157291024]
提案するPLANA3Rは,提案しない2次元画像から平面3次元再構成を計測するためのポーズレスフレームワークである。
トレーニング中に3次元平面アノテーションを必要とする以前のフィードフォワード法とは異なり、PLANA3Rは明確な平面監督なしで平面3次元構造を学習する。
本研究は,複数の室内環境データセットに対するPLANA3Rの有効性を検証するとともに,領域外屋内環境への強力な一般化を実証する。
論文 参考訳(メタデータ) (2025-10-21T15:15:33Z) - Zero-shot Inexact CAD Model Alignment from a Single Image [53.37898107159792]
1つの画像から3Dシーン構造を推測する実践的なアプローチは、データベースから密に一致する3Dモデルを検索し、画像内のオブジェクトと整列させることである。
既存のメソッドは、イメージによる教師付きトレーニングとアノテーションのポーズに依存しており、オブジェクトカテゴリの狭いセットに制限されている。
ポーズアノテーションを必要とせず、未知のカテゴリに一般化する不正確な3次元モデルの弱い教師付き9-DoFアライメント法を提案する。
論文 参考訳(メタデータ) (2025-07-04T04:46:59Z) - Training-free zero-shot 3D symmetry detection with visual features back-projected to geometry [0.6445605125467574]
DINOv2のような基礎視覚モデルから視覚的特徴を利用するゼロショット3次元対称性検出のための訓練不要アプローチを提案する。
我々の研究は、基礎視覚モデルが対称性検出のような複雑な3次元幾何学的問題を解くのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2025-05-30T03:09:18Z) - Symmetry Strikes Back: From Single-Image Symmetry Detection to 3D Generation [29.732780338284353]
我々は,多種多様な実世界のシナリオに対して堅牢な一般化が可能なスケーラブルなゼロショット対称性検出器であるReflect3Dを紹介する。
検出された対称性を単一画像の3D生成パイプラインに組み込むことの実用的利点を示す。
論文 参考訳(メタデータ) (2024-11-26T04:14:31Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Partial Symmetry Detection for 3D Geometry using Contrastive Learning
with Geodesic Point Cloud Patches [10.48309709793733]
我々は,測地線点雲パッチの回転,反射,翻訳,スケール不変な局所形状の特徴を学習することを提案する。
この曖昧な問題に対して,本手法は複数の有効な解を抽出可能であることを示す。
検出された対称性を領域成長アルゴリズムと組み合わせて下流タスクを実証する。
論文 参考訳(メタデータ) (2023-12-13T15:48:50Z) - NeRD: Neural 3D Reflection Symmetry Detector [27.626579746101292]
ニューラル3次元反射対称性検出器NeRDについて述べる。
まず、粗大な戦略で対称性平面を列挙し、それから3次元のコストボリュームを構築することで最良の平面を見つける。
実験の結果,本手法で検出した対称性平面は直接CNN回帰から検出した平面よりもかなり精度が高いことがわかった。
論文 参考訳(メタデータ) (2021-04-19T17:25:51Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - SymmetryNet: Learning to Predict Reflectional and Rotational Symmetries
of 3D Shapes from Single-View RGB-D Images [26.38270361331076]
本稿では3次元物体の反射対称性と回転対称性の両方を予測できるエンドツーエンドのディープニューラルネットワークを提案する。
単視点RGB-D画像に基づく3次元対称性検出のベンチマークにも貢献する。
論文 参考訳(メタデータ) (2020-08-02T14:10:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。