論文の概要: HierOctFusion: Multi-scale Octree-based 3D Shape Generation via Part-Whole-Hierarchy Message Passing
- arxiv url: http://arxiv.org/abs/2508.11106v1
- Date: Thu, 14 Aug 2025 23:12:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.690472
- Title: HierOctFusion: Multi-scale Octree-based 3D Shape Generation via Part-Whole-Hierarchy Message Passing
- Title(参考訳): HierOctFusion:Part-Whole-Hierarchy Message Passingによるマルチスケールオクタリーベース3次元形状生成
- Authors: Xinjie Gao, Bi'an Du, Wei Hu,
- Abstract要約: 3Dコンテンツ生成は、3Dデータの本質的な構造的複雑さのため、基本的な課題でありながら難しい課題である。
細粒度および疎粒度オブジェクト構造を生成するための階層的特徴相互作用を強化する部分認識型マルチスケールオクツリー拡散モデルであるHierOctFusionを提案する。
実験により,HierOctFusionは従来の方法よりも優れた形状品質と効率が得られることが示された。
- 参考スコア(独自算出の注目度): 9.953394373473621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D content generation remains a fundamental yet challenging task due to the inherent structural complexity of 3D data. While recent octree-based diffusion models offer a promising balance between efficiency and quality through hierarchical generation, they often overlook two key insights: 1) existing methods typically model 3D objects as holistic entities, ignoring their semantic part hierarchies and limiting generalization; and 2) holistic high-resolution modeling is computationally expensive, whereas real-world objects are inherently sparse and hierarchical, making them well-suited for layered generation. Motivated by these observations, we propose HierOctFusion, a part-aware multi-scale octree diffusion model that enhances hierarchical feature interaction for generating fine-grained and sparse object structures. Furthermore, we introduce a cross-attention conditioning mechanism that injects part-level information into the generation process, enabling semantic features to propagate effectively across hierarchical levels from parts to the whole. Additionally, we construct a 3D dataset with part category annotations using a pre-trained segmentation model to facilitate training and evaluation. Experiments demonstrate that HierOctFusion achieves superior shape quality and efficiency compared to prior methods.
- Abstract(参考訳): 3Dコンテンツ生成は、3Dデータの本質的な構造的複雑さのため、基本的な課題でありながら難しい課題である。
最近のオクツリーベースの拡散モデルは、階層的生成を通じて効率と品質の間に有望なバランスを提供するが、彼らはしばしば2つの重要な洞察を見落としている。
1) 既存の手法は典型的には3Dオブジェクトを全体論的実体としてモデル化し,その意味的部分の階層を無視し,一般化を制限する。
2) 全体論的高解像度モデリングは計算コストが高いが,現実の物体は本質的に疎らで階層的であり,層状生成に適している。
これらの観測によって動機づけられたHierOctFusionは、細粒度とスパースなオブジェクト構造を生成する階層的特徴相互作用を強化する部分認識型マルチスケールオクツリー拡散モデルである。
さらに,部分レベルの情報を生成プロセスに注入するクロスアテンション条件付け機構を導入し,各部分間の階層レベルのセマンティック特徴を効果的に伝播させる。
さらに,事前学習したセグメンテーションモデルを用いて,パートカテゴリアノテーションを用いた3次元データセットを構築し,トレーニングと評価を容易にする。
実験により,HierOctFusionは従来の方法よりも優れた形状品質と効率が得られることが示された。
関連論文リスト
- From One to More: Contextual Part Latents for 3D Generation [33.43336981984443]
CoPartは、コヒーレントなマルチパーツ生成のために、3Dオブジェクトをコンテキスト部分潜在子に分解する、部分認識拡散フレームワークである。
そこで我々は,メッシュセグメンテーションと人間検証アノテーションから得られた新しい3次元部分データセットを構築した。
実験では、パートレベルの編集、オブジェクト生成、シーン構成において、前例のない制御性を持つCoPartの優れた能力を実証した。
論文 参考訳(メタデータ) (2025-07-11T17:33:18Z) - Proto-FG3D: Prototype-based Interpretable Fine-Grained 3D Shape Classification [59.68055837500357]
本稿では,3次元形状のきめ細かい分類のためのプロトタイプベースフレームワークProto-FG3Dを提案する。
Proto-FG3Dは、Prototype Associationを介して、共同でマルチビューとマルチカテゴリ表現学習を確立する。
Proto-FG3Dは、精度、透明な予測、そして視覚化によるアドホックな解釈可能性において最先端の手法を超越している。
論文 参考訳(メタデータ) (2025-05-23T09:31:02Z) - IAAO: Interactive Affordance Learning for Articulated Objects in 3D Environments [56.85804719947]
IAAOは知的エージェントのための明示的な3Dモデルを構築するフレームワークで,対話を通して環境内の明瞭な物体の理解を得る。
マスク特徴とビュー一貫性ラベルを多視点画像から抽出し,まず3次元ガウススティング(3DGS)を用いて各オブジェクト状態の階層的特徴とラベルフィールドを構築する。
次に、3Dガウスプリミティブ上でオブジェクトと部分レベルのクエリを実行し、静的および明瞭な要素を識別し、大域的な変換と局所的な調音パラメータをアベイランスとともに推定する。
論文 参考訳(メタデータ) (2025-04-09T12:36:48Z) - Chirpy3D: Creative Fine-grained 3D Object Fabrication via Part Sampling [128.23917788822948]
Chirpy3Dは、ゼロショット設定で微細な3Dオブジェクトを生成するための新しいアプローチである。
モデルは、可塑性な3D構造を推測し、きめ細かい細部を捉え、新しい物体に一般化する必要がある。
我々の実験では、Cirpy3Dは、高品質できめ細かな細部を持つ創造的な3Dオブジェクトを生成する既存の手法を超越していることが示されている。
論文 参考訳(メタデータ) (2025-01-07T21:14:11Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - ClusteringSDF: Self-Organized Neural Implicit Surfaces for 3D Decomposition [32.99080359375706]
ClusteringSDFは、ニューラルな暗黙の表面表現を通して3次元のセグメンテーションと再構成を実現するための新しいアプローチである。
ScanNetとReplicaのデータセットから得られた挑戦的なシーンにおける実験結果から,ClusteringSDFが競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-03-21T17:59:16Z) - OcTr: Octree-based Transformer for 3D Object Detection [30.335788698814444]
LiDARベースの3Dオブジェクト検出の重要な課題は、大規模な3Dシーンから十分な特徴をキャプチャすることだ。
我々はこの問題に対処するためにOcTrというOcreeベースのトランスフォーマーを提案する。
本研究では,前景の知覚性を高めるために,セマンティック・アウェアな位置埋め込みとアテンションマスクを組み合わせたハイブリッドな位置埋め込みを提案する。
論文 参考訳(メタデータ) (2023-03-22T15:01:20Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。