論文の概要: Self-Attention Based Multi-Scale Graph Auto-Encoder Network of 3D Meshes
- arxiv url: http://arxiv.org/abs/2507.05304v1
- Date: Mon, 07 Jul 2025 07:36:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.252994
- Title: Self-Attention Based Multi-Scale Graph Auto-Encoder Network of 3D Meshes
- Title(参考訳): 自己注意に基づく3次元メッシュのマルチスケールグラフオートエンコーダネットワーク
- Authors: Saqib Nazir, Olivier Lézoray, Sébastien Bougleux,
- Abstract要約: 3D Geometric Mesh Network(3DGeoMeshNet)は、異方性畳み込み層を用いて空間領域内でグローバルな特徴とローカルな特徴を直接学習する新しいGCNベースのフレームワークである。
我々のアーキテクチャはマルチスケールエンコーダ・デコーダ構造を特徴とし、大域的および局所的な経路は大規模な幾何学的構造と微細な局所的詳細の両方を捉えている。
- 参考スコア(独自算出の注目度): 1.573038298640368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D meshes are fundamental data representations for capturing complex geometric shapes in computer vision and graphics applications. While Convolutional Neural Networks (CNNs) have excelled in structured data like images, extending them to irregular 3D meshes is challenging due to the non-Euclidean nature of the data. Graph Convolutional Networks (GCNs) offer a solution by applying convolutions to graph-structured data, but many existing methods rely on isotropic filters or spectral decomposition, limiting their ability to capture both local and global mesh features. In this paper, we introduce 3D Geometric Mesh Network (3DGeoMeshNet), a novel GCN-based framework that uses anisotropic convolution layers to effectively learn both global and local features directly in the spatial domain. Unlike previous approaches that convert meshes into intermediate representations like voxel grids or point clouds, our method preserves the original polygonal mesh format throughout the reconstruction process, enabling more accurate shape reconstruction. Our architecture features a multi-scale encoder-decoder structure, where separate global and local pathways capture both large-scale geometric structures and fine-grained local details. Extensive experiments on the COMA dataset containing human faces demonstrate the efficiency of 3DGeoMeshNet in terms of reconstruction accuracy.
- Abstract(参考訳): 3Dメッシュは、コンピュータビジョンやグラフィックアプリケーションにおいて複雑な幾何学的形状をキャプチャするための基本的なデータ表現である。
畳み込みニューラルネットワーク(CNN)は画像のような構造化データに優れていますが、データの非ユークリッド性のため、それらを不規則な3Dメッシュに拡張することは困難です。
グラフ畳み込みネットワーク(GCN)は、グラフ構造化データに畳み込みを適用することで、ソリューションを提供するが、既存の多くのメソッドは等方性フィルタやスペクトル分解に依存しており、ローカルとグローバル両方のメッシュ機能をキャプチャする能力を制限している。
本稿では、異方性畳み込み層を用いて空間領域におけるグローバルな特徴と局所的な特徴を直接学習する新しいGCNベースのフレームワークである3D Geometric Mesh Network(3DGeoMeshNet)を紹介する。
メッシュをボクセル格子や点雲などの中間表現に変換する従来の手法とは異なり、本手法は再構成過程を通して元のポリゴンメッシュフォーマットを保存し、より正確な形状復元を可能にする。
我々のアーキテクチャはマルチスケールエンコーダ・デコーダ構造を特徴とし、大域的および局所的な経路は大規模な幾何学的構造と微細な局所的詳細の両方を捉えている。
人間の顔を含むCOMAデータセットの大規模な実験は、復元精度の観点から3DGeoMeshNetの効率を実証している。
関連論文リスト
- GALA: Geometry-Aware Local Adaptive Grids for Detailed 3D Generation [28.299293407423455]
GALAは複雑な幾何学や表面の細部を捉え再現する3次元形状の斬新な表現である。
最適化されたC++/CUDA実装では、GALAをオブジェクトに10秒以内で適用することができます。
幾何学的なディテールで3次元形状を生成することができるカスケード生成パイプラインを提供する。
論文 参考訳(メタデータ) (2024-10-13T22:53:58Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - T-Pixel2Mesh: Combining Global and Local Transformer for 3D Mesh Generation from a Single Image [84.08705684778666]
本稿では,P2Mの粗大なアプローチにインスパイアされたトランスフォーマーブーストアーキテクチャT-Pixel2Meshを提案する。
具体的には,大域変換器を用いて局所的な形状を制御し,局所的な幾何学的詳細を洗練させる。
ShapeNetの実験では最先端の性能が実証され,実世界のデータでは一般化能力が示された。
論文 参考訳(メタデータ) (2024-03-20T15:14:22Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Dual Octree Graph Networks for Learning Adaptive Volumetric Shape
Representations [21.59311861556396]
本手法は,3次元形状の体積場を,オクツリーによって構成された適応的特徴量で符号化する。
エンコーダ・デコーダネットワークは、オクツリーノードの二重グラフ上のグラフ畳み込みに基づいて、適応的な特徴量を学ぶように設計されている。
提案手法は, 形状詳細を効果的に符号化し, 高速な3次元形状復元を可能にし, 訓練カテゴリから3次元形状をモデル化するための優れた汎用性を示す。
論文 参考訳(メタデータ) (2022-05-05T17:56:34Z) - Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D
Shapes [77.6741486264257]
本稿では,高忠実度ニューラルネットワークSDFのリアルタイムレンダリングを可能にする,効率的なニューラル表現を提案する。
我々の表現は、以前の作品に比べてレンダリング速度の点で2~3桁の効率であることを示す。
論文 参考訳(メタデータ) (2021-01-26T18:50:22Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。