論文の概要: Name That Part: 3D Part Segmentation and Naming
- arxiv url: http://arxiv.org/abs/2512.18003v1
- Date: Fri, 19 Dec 2025 19:02:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.147423
- Title: Name That Part: 3D Part Segmentation and Naming
- Title(参考訳): 名前:3Dパーツのセグメンテーションとナーミング
- Authors: Soumava Paul, Prakhar Kaushik, Ankit Vaidya, Anand Bhattad, Alan Yuille,
- Abstract要約: 直列アライメントタスクとして部品命名を定式化するALIGN-Partsを提案する。
本手法では, 形状を3次元の暗黙的な部分表現であるパーレットに分解し, バイパーティイト代入による部分記述とマッチングする。
我々のモデルは、任意の記述に対するゼロショットマッチングと、既知のカテゴリに対する信頼度校正予測をサポートします。
- 参考スコア(独自算出の注目度): 13.782629682520422
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address semantic 3D part segmentation: decomposing objects into parts with meaningful names. While datasets exist with part annotations, their definitions are inconsistent across datasets, limiting robust training. Previous methods produce unlabeled decompositions or retrieve single parts without complete shape annotations. We propose ALIGN-Parts, which formulates part naming as a direct set alignment task. Our method decomposes shapes into partlets - implicit 3D part representations - matched to part descriptions via bipartite assignment. We combine geometric cues from 3D part fields, appearance from multi-view vision features, and semantic knowledge from language-model-generated affordance descriptions. Text-alignment loss ensures partlets share embedding space with text, enabling a theoretically open-vocabulary matching setup, given sufficient data. Our efficient and novel, one-shot, 3D part segmentation and naming method finds applications in several downstream tasks, including serving as a scalable annotation engine. As our model supports zero-shot matching to arbitrary descriptions and confidence-calibrated predictions for known categories, with human verification, we create a unified ontology that aligns PartNet, 3DCoMPaT++, and Find3D, consisting of 1,794 unique 3D parts. We also show examples from our newly created Tex-Parts dataset. We also introduce 2 novel metrics appropriate for the named 3D part segmentation task.
- Abstract(参考訳): 意味的な3D部分のセグメンテーションに対処する: オブジェクトを意味のある名前を持つ部分に分解する。
データセットにはパートアノテーションがあるが、その定義はデータセット間で一貫性がなく、堅牢なトレーニングを制限している。
従来の方法では、完全な形状アノテーションなしで、ラベルなしの分解や単一部品の回収が行なわれていた。
直列アライメントタスクとして部品命名を定式化するALIGN-Partsを提案する。
本手法では, 形状を3次元の暗黙的な部分表現であるパーレットに分解し, バイパーティイト代入による部分記述とマッチングする。
我々は,3次元部分場からの幾何学的手がかり,多視点視覚特徴からの出現,および言語モデルによるアベイランス記述からの意味的知識を組み合わせる。
テキストアライメントの損失は、パーレットが埋め込みスペースをテキストと共有することを保証する。
我々の効率的で斬新な3D部分分割と命名法は、スケーラブルなアノテーションエンジンとして機能するなど、下流タスクのアプリケーションを見つけ出す。
我々のモデルは、任意の記述に対するゼロショットマッチングと、人間による検証により、既知のカテゴリに対する信頼度校正予測をサポートし、PartNet, 3DCoMPaT++, Find3Dを1,794個のユニークな3Dパーツで整列する統一オントロジーを作成する。
新たに作成したTex-Partsデータセットの例も紹介します。
また,命名された3次元部分分割作業に適した2つの新しい指標についても紹介する。
関連論文リスト
- PARTFIELD: Learning 3D Feature Fields for Part Segmentation and Beyond [70.95930509071451]
PartFieldは、パートベースの3D機能を学ぶためのフィードフォワードアプローチである。
PartFieldは、他のクラスに依存しない部分分割方法よりも最大20%正確で、多くの場合、桁違いに高速です。
論文 参考訳(メタデータ) (2025-04-15T17:58:16Z) - 3D Part Segmentation via Geometric Aggregation of 2D Visual Features [57.20161517451834]
監督された3D部分分割モデルは、固定されたオブジェクトと部品のセットに合わせて調整されており、それらの転送可能性は、オープンセットの現実世界のシナリオに制限される。
近年、視覚言語モデル(VLM)を多視点レンダリングとテキストプロンプトを用いてオブジェクト部品の識別に活用する研究が進められている。
これらの制約に対処するために,視覚概念から抽出した意味論と3次元幾何学をブレンドし,対象部品を効果的に同定するCOPSを提案する。
論文 参考訳(メタデータ) (2024-12-05T15:27:58Z) - LESS: Label-Efficient and Single-Stage Referring 3D Segmentation [55.06002976797879]
参照3Dは、クエリの文で記述された3Dポイントクラウドから、指定されたオブジェクトのすべてのポイントをセグメントする視覚言語タスクである。
本稿では,LESSと呼ばれるレファレンス3次元パイプラインを提案する。
ScanReferデータセット上での最先端のパフォーマンスは、バイナリラベルのみを使用して、以前の3.7% mIoUの手法を上回ります。
論文 参考訳(メタデータ) (2024-10-17T07:47:41Z) - Search3D: Hierarchical Open-Vocabulary 3D Segmentation [78.47704793095669]
本稿では,階層的なオープンな3Dシーン表現を構築するためのアプローチであるSearch3Dを紹介する。
従来の方法とは異なり、Search3Dはより柔軟なオープンな3D検索パラダイムにシフトする。
体系的な評価のために,MultiScanに基づくシーンスケールのオープンボキャブラリ3D部分セグメンテーションベンチマークを提案する。
論文 参考訳(メタデータ) (2024-09-27T03:44:07Z) - PanopticRecon: Leverage Open-vocabulary Instance Segmentation for Zero-shot Panoptic Reconstruction [23.798691661418253]
シーンのRGB-D画像から新たなゼロショットパノビュート再構成手法を提案する。
我々は、高密度な一般化特徴の助けを借りて部分ラベルを伝播させることにより、両方の課題に取り組む。
本手法は,屋内データセットScanNet V2と屋外データセットKITTI-360の最先端手法より優れている。
論文 参考訳(メタデータ) (2024-07-01T15:06:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。