論文の概要: Semantic Segmentation of Textured Non-manifold 3D Meshes using Transformers
- arxiv url: http://arxiv.org/abs/2604.01836v1
- Date: Thu, 02 Apr 2026 09:50:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.65983
- Title: Semantic Segmentation of Textured Non-manifold 3D Meshes using Transformers
- Title(参考訳): 変圧器を用いたテクスチャ非多様体3次元メッシュのセマンティックセグメンテーション
- Authors: Mohammadreza Heidarianbaei, Max Mehltretter, Franz Rottensteiner,
- Abstract要約: 本稿では,各メッシュ面に関連付けられた生画素から直接学習するテクスチャ対応トランスフォーマーを提案する。
テクスチャブランチは、すべての顔レベルのピクセルを、幾何学的記述子で融合した学習可能なトークンに要約する。
本研究では,SUM(Semantic Urban Meshes)ベンチマークと新たに収集した文化遺産データセットを用いて,そのモデルを評価する。
- 参考スコア(独自算出の注目度): 1.0650780147044159
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Textured 3D meshes jointly represent geometry, topology, and appearance, yet their irregular structure poses significant challenges for deep-learning-based semantic segmentation. While a few recent methods operate directly on meshes without imposing geometric constraints, they typically overlook the rich textural information also provided by such meshes. We introduce a texture-aware transformer that learns directly from raw pixels associated with each mesh face, coupled with a new hierarchical learning scheme for multi-scale feature aggregation. A texture branch summarizes all face-level pixels into a learnable token, which is fused with geometrical descriptors and processed by a stack of Two-Stage Transformer Blocks (TSTB), which allow for both a local and a global information flow. We evaluate our model on the Semantic Urban Meshes (SUM) benchmark and a newly curated cultural-heritage dataset comprising textured roof tiles with triangle-level annotations for damage types. Our method achieves 81.9\% mF1 and 94.3\% OA on SUM and 49.7\% mF1 and 72.8\% OA on the new dataset, substantially outperforming existing approaches.
- Abstract(参考訳): テクスチャ付き3Dメッシュは、幾何学、トポロジ、外観を共同で表現するが、その不規則な構造はディープラーニングに基づくセマンティックセグメンテーションに重大な課題をもたらす。
幾何的制約を課すことなくメッシュ上で直接動作する最近の手法はいくつかあるが、一般的にそのようなメッシュによって提供されるリッチなテクスチャ情報を見落としている。
本稿では,各メッシュ面に関連付けられた生画素から直接学習するテクスチャ対応変換器と,マルチスケール特徴集約のための階層的学習手法を提案する。
テクスチャブランチは、すべての顔レベルのピクセルを学習可能なトークンに要約し、幾何学的記述子で融合し、2段階トランスフォーマーブロック(TSTB)のスタックで処理することで、局所情報フローとグローバル情報フローの両方を可能にする。
我々は,SUM(Semantic Urban Meshes)ベンチマークと,テクスチャ付き屋根タイルと三角形のアノテーションを併用した新しい文化遺産データセットについて評価を行った。
提案手法は,SUM上の81.9\% mF1,94.3\% OA,新しいデータセット上では49.7\% mF1,72.8\% OAを実現し,既存手法よりも大幅に優れていた。
関連論文リスト
- TriTex: Learning Texture from a Single Mesh via Triplane Semantic Features [78.13246375582906]
本研究では,1つのテクスチャメッシュから体積テクスチャ場を学習し,セマンティックな特徴を対象色にマッピングする手法を提案する。
本手法は,ゲーム開発などのアプリケーションにおいて,3次元モデル間で優れたテクスチャ品質を実現する。
論文 参考訳(メタデータ) (2025-03-20T18:35:03Z) - SpaceMesh: A Continuous Representation for Learning Manifold Surface Meshes [61.110517195874074]
本稿では,ニューラルネットワークの出力として,複雑な接続性を持つ多様体多角形メッシュを直接生成する手法を提案する。
私たちの重要なイノベーションは、各メッシュで連続的な遅延接続空間を定義することです。
アプリケーションでは、このアプローチは生成モデルから高品質な出力を得るだけでなく、メッシュ修復のような挑戦的な幾何処理タスクを直接学習することを可能にする。
論文 参考訳(メタデータ) (2024-09-30T17:59:03Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Geometrically-driven Aggregation for Zero-shot 3D Point Cloud Understanding [11.416392706435415]
ゼロショット3Dポイントクラウド理解は2Dビジョンランゲージモデル(VLM)によって達成できる
既存の戦略は、ヴィジュアル・ランゲージ・モデル(Vision-Language Model)をレンダリングまたはキャプチャされた2Dピクセルから3Dポイントにマッピングし、固有かつ表現可能な雲の幾何学構造を見渡す。
本稿では, 点雲の3次元幾何学的構造を利用して, 移動したビジョン・ランゲージモデルの品質を向上させるための, 初となるトレーニングフリーアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2023-12-04T12:30:07Z) - 3D-TexSeg: Unsupervised Segmentation of 3D Texture using Mutual
Transformer Learning [11.510823733292519]
本稿ではメッシュ多様体上の3次元テクスチャの教師なしセグメンテーションのための独自のフレームワークを提案する。
ラベル生成器とクリーナーを組み合わせた相互変換器を考案する。
多様なテクスチャパターンを持つ3つの公開データセットの実験は、提案フレームワークが標準およびSOTA教師なし技術より優れていることを示した。
論文 参考訳(メタデータ) (2023-11-17T17:13:14Z) - Zero-shot point cloud segmentation by transferring geometric primitives [68.18710039217336]
ゼロショットポイントクラウドセマンティックセマンティックセマンティックセマンティクスについて検討し、そこではネットワークが見えないオブジェクトに対してトレーニングされ、見えないオブジェクトをセマンティクスできる。
本研究では,視覚的および視覚的カテゴリーのオブジェクトで共有される幾何学的プリミティブを学習し,言語と学習された幾何学的プリミティブとの微粒なアライメントを利用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-18T15:06:54Z) - Deep Geometric Texture Synthesis [83.9404865744028]
幾何学的テクスチャを合成するための新しい枠組みを提案する。
単一の参照3Dモデルの局所的な近傍からテクスチャ統計を学習する。
我々のネットワークはメッシュ頂点を任意の方向に変位させ、幾何学的テクスチャの合成を可能にする。
論文 参考訳(メタデータ) (2020-06-30T19:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。