論文の概要: Lookalike3D: Seeing Double in 3D
- arxiv url: http://arxiv.org/abs/2603.24713v1
- Date: Wed, 25 Mar 2026 18:36:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:47.937311
- Title: Lookalike3D: Seeing Double in 3D
- Title(参考訳): Lookalike 3Dは3Dで2倍に
- Authors: Chandan Yeshwanth, Angela Dai,
- Abstract要約: 本研究は,屋内シーンにおける被写体検出の課題について紹介する。
入力シーンを与えられたタスクは、複数ビューイメージを入力として、オブジェクトのペアを同一、類似、あるいは異なるものとして分類することである。
このようなオブジェクト対を効果的に識別する多視点画像変換器であるLookalike3Dを提案する。
- 参考スコア(独自算出の注目度): 36.41420761431174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D object understanding and generation methods produce impressive results, yet they often overlook a pervasive source of information in real-world scenes: repeated objects. We introduce the task of lookalike object detection in indoor scenes, which leverages repeated and complementary cues from identical and near-identical object pairs. Given an input scene, the task is to classify pairs of objects as identical, similar or different using multiview images as input. To address this, we present Lookalike3D, a multiview image transformer that effectively distinguishes such object pairs by harnessing strong semantic priors from large image foundation models. To support this task, we collected the 3DTwins dataset, containing 76k manually annotated identical, similar and different pairs of objects based on ScanNet++, and show an improvement of 104% IoU over baselines. We demonstrate how our method improves downstream tasks such as enabling joint 3D object reconstruction and part co-segmentation, turning repeated and lookalike objects into a powerful cue for consistent, high-quality 3D perception. Our code, dataset and models will be made publicly available.
- Abstract(参考訳): 3Dオブジェクトの理解と生成は印象的な結果をもたらすが、現実のシーンにおける情報の拡散源である繰り返しオブジェクトを見落としてしまうことが多い。
室内のシーンにおいて,同一の物体対とほぼ同一の物体対から繰り返し,相補的な手がかりを活用できるような物体検出タスクを導入する。
入力シーンを与えられたタスクは、複数ビューイメージを入力として、オブジェクトのペアを同一、類似、あるいは異なるものとして分類することである。
そこで本稿では,Lookalike3Dを提案する。Lookalike3Dは,大規模な画像基盤モデルから強力なセマンティック事前情報を活用することで,そのようなオブジェクトペアを効果的に識別するマルチビューイメージトランスフォーマである。
このタスクをサポートするために、3DTwinsデータセットを収集し、ScanNet++をベースとした76kのアノテート、類似、および異なるオブジェクトのペアを手動でアノテートし、ベースラインよりも104%のIoUの改善を示した。
提案手法は, 連続した3次元オブジェクトの再構成や部分分割, 繰り返し, 外観的なオブジェクトを, 一貫性のある高品質な3次元知覚のための強力なキューに変換するなど, 下流作業の改善を実証する。
私たちのコード、データセット、モデルは公開されます。
関連論文リスト
- Common3D: Self-Supervised Learning of 3D Morphable Models for Common Objects in Neural Feature Space [58.623106094568776]
3Dモデル(3DMM)は、オブジェクトカテゴリの形状や外観を表現する強力なツールである。
我々は,オブジェクト中心ビデオのコレクションから,オブジェクトの3DMMを自己管理的に学習する新しい手法であるCommon3Dを導入する。
Common3Dは、様々な視覚タスクをゼロショットで解くことができる最初の完全に自己教師された方法である。
論文 参考訳(メタデータ) (2025-04-30T15:42:23Z) - DenseMatcher: Learning 3D Semantic Correspondence for Category-Level Manipulation from a Single Demo [22.659984212937907]
DenseMatcher(DenseMatcher)は、類似した構造を持つ線内オブジェクト間の3次元対応を計算できる手法である。
DenseMatcherは、以前の3Dマッチングベースラインを43.5%上回っている。
論文 参考訳(メタデータ) (2024-12-06T18:55:09Z) - ComboVerse: Compositional 3D Assets Creation Using Spatially-Aware Diffusion Guidance [76.7746870349809]
複雑な構成で高品質な3Dアセットを生成する3D生成フレームワークであるComboVerseについて,複数のモデルを組み合わせることを学習して紹介する。
提案手法は,標準スコア蒸留法と比較して,物体の空間的アライメントを重視している。
論文 参考訳(メタデータ) (2024-03-19T03:39:43Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown
Objects [89.2314092102403]
モノクロRGBDビデオシーケンスから未知物体の6-DoF追跡をリアルタイムに行う手法を提案する。
視覚的テクスチャがほとんど欠如している場合でも,任意の剛体オブジェクトに対して有効である。
論文 参考訳(メタデータ) (2023-03-24T17:13:49Z) - Explicit3D: Graph Network with Spatial Inference for Single Image 3D
Object Detection [35.85544715234846]
本稿では,オブジェクトの幾何学的特徴と意味論的特徴に基づいて,Explicit3Dという動的スパースグラフパイプラインを提案する。
SUN RGB-Dデータセットによる実験結果から,我々のExplicit3Dは最先端技術よりも優れた性能バランスを実現することが示された。
論文 参考訳(メタデータ) (2023-02-13T16:19:54Z) - OA-DET3D: Embedding Object Awareness as a General Plug-in for Multi-Camera 3D Object Detection [77.43427778037203]
我々は3Dオブジェクト検出を改善するプラグインモジュールであるOA-DET3Dを紹介する。
OA-DET3Dは、オブジェクト中心の深度情報と前景の擬似点を活用することにより、オブジェクトの表現を高める。
我々は、OA-DET3Dの有効性を検証するために、nuScenesデータセットとArgoverse 2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2023-01-13T06:02:31Z) - Point2Seq: Detecting 3D Objects as Sequences [58.63662049729309]
我々は、ポイントクラウドから3次元オブジェクトを検出するためのシンプルで効果的なフレームワーク、Point2Seqを提案する。
我々は,各3Dオブジェクトを単語列とみなし,その3Dオブジェクト検出タスクを,自動回帰的に3Dシーンからの単語の復号化として再構成する。
論文 参考訳(メタデータ) (2022-03-25T00:20:31Z) - 3D Object Recognition By Corresponding and Quantizing Neural 3D Scene
Representations [29.61554189447989]
本稿では,RGB-D画像からオブジェクトを検出し,その3Dポーズを推測するシステムを提案する。
多くの既存のシステムはオブジェクトを識別し、3Dのポーズを推測できるが、それらは人間のラベルや3Dアノテーションに大きく依存している。
論文 参考訳(メタデータ) (2020-10-30T13:56:09Z) - Object Detection on Single Monocular Images through Canonical
Correlation Analysis [3.4722706398428493]
点雲や深度画像のような余分な3次元データを用いることなく、単分子画像から3次元オブジェクト情報を検索する。
本稿では,単眼画像とそれに対応する深度画像とを融合する2次元CCAフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-13T05:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。