論文の概要: LMSeg: An end-to-end geometric message-passing network on barycentric dual graphs for large-scale landscape mesh segmentation
- arxiv url: http://arxiv.org/abs/2407.04326v3
- Date: Sat, 08 Nov 2025 19:42:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.263143
- Title: LMSeg: An end-to-end geometric message-passing network on barycentric dual graphs for large-scale landscape mesh segmentation
- Title(参考訳): LMSeg:大規模ランドスケープメッシュセグメンテーションのためのバリ中心双対グラフ上のエンドツーエンドの幾何学的メッセージパッシングネットワーク
- Authors: Zexian Huang, Kourosh Khoshelham, Martin Tomko,
- Abstract要約: オーストラリアのビクトリア州にあるユネスコ世界遺産に登録されているBudj Bim文化景観から得られた大規模なアノテートメッシュデータセットであるBudjBim Wallデータセットを紹介した。
大規模メッシュのセマンティックセグメンテーションのためのディープグラフメッセージパッシングネットワークであるLMSegを提案する。
3つの大規模ベンチマーク(SUM、H3D、BBW)の実験では、LMSegはSUMで75.1% mIoU、H3Dで78.4% O.A.、BBWで62.4% mIoUを達成した。
- 参考スコア(独自算出の注目度): 5.698076346359676
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Semantic segmentation of large-scale 3D landscape meshes is critical for geospatial analysis in complex environments, yet existing approaches face persistent challenges of scalability, end-to-end trainability, and accurate segmentation of small and irregular objects. To address these issues, we introduce the BudjBim Wall (BBW) dataset, a large-scale annotated mesh dataset derived from high-resolution LiDAR scans of the UNESCO World Heritage-listed Budj Bim cultural landscape in Victoria, Australia. The BBW dataset captures historic dry-stone wall structures that are difficult to detect under vegetation occlusion, supporting research in underrepresented cultural heritage contexts. Building on this dataset, we propose LMSeg, a deep graph message-passing network for semantic segmentation of large-scale meshes. LMSeg employs a barycentric dual graph representation of mesh faces and introduces the Geometry Aggregation+ (GA+) module, a learnable softmax-based operator that adaptively combines neighborhood features and captures high-frequency geometric variations. A hierarchical-local dual pooling integrates hierarchical and local geometric aggregation to balance global context with fine-detail preservation. Experiments on three large-scale benchmarks (SUM, H3D, and BBW) show that LMSeg achieves 75.1% mIoU on SUM, 78.4% O.A. on H3D, and 62.4% mIoU on BBW, using only 2.4M lightweight parameters. In particular, LMSeg demonstrates accurate segmentation across both urban and natural scenes-capturing small-object classes such as vehicles and high vegetation in complex city environments, while also reliably detecting dry-stone walls in dense, occluded rural landscapes. Together, the BBW dataset and LMSeg provide a practical and extensible method for advancing 3D mesh segmentation in cultural heritage, environmental monitoring, and urban applications.
- Abstract(参考訳): 大規模3次元ランドスケープメッシュのセマンティックセグメンテーションは、複雑な環境における地理空間解析において重要であるが、既存のアプローチでは、拡張性、エンドツーエンドのトレーニング容易性、小さく不規則なオブジェクトの正確なセグメンテーションといった、永続的な課題に直面している。
これらの問題に対処するために,オーストラリアのビクトリア州にあるユネスコ世界遺産登録のブジビム文化景観の高解像度LiDARスキャンから得られた,大規模なアノテートメッシュデータセットであるBudjBim Wall (BBW)データセットを紹介した。
BBWデータセットは、植生の排除下では検出が難しい歴史的な乾岩の壁構造を捉え、あまり表現されていない文化遺産の文脈での研究を支援する。
このデータセットに基づいて,大規模メッシュのセマンティックセグメンテーションのためのディープグラフメッセージパッシングネットワークであるLMSegを提案する。
LMSegは、メッシュ面のバリ中心の二重グラフ表現を採用し、近隣の特徴を適応的に組み合わせ、高周波の幾何学的バリエーションをキャプチャする学習可能なソフトマックスベースの演算子であるGeometry Aggregation+ (GA+)モジュールを導入した。
階層的な局所的な双対プールは、階層的および局所的な幾何学的アグリゲーションを統合し、グローバルなコンテキストと細部保存のバランスをとる。
3つの大規模ベンチマーク(SUM、H3D、BBW)の実験では、LMSegはSUMで75.1% mIoU、H3Dで78.4% O.A.、BBWで62.4% mIoUを達成した。
特にLMSegは、複雑な都市環境における車両や高い植生など、都市と自然の両方のシーンを正確に区分けすると同時に、密集した田園地帯の乾燥した岩壁を確実に検出する。
BBWデータセットとLMSegは、文化的遺産、環境モニタリング、都市アプリケーションにおいて、3Dメッシュセグメンテーションを進めるための実用的で拡張可能な方法を提供する。
関連論文リスト
- Self-Attention Based Multi-Scale Graph Auto-Encoder Network of 3D Meshes [1.573038298640368]
3D Geometric Mesh Network(3DGeoMeshNet)は、異方性畳み込み層を用いて空間領域内でグローバルな特徴とローカルな特徴を直接学習する新しいGCNベースのフレームワークである。
我々のアーキテクチャはマルチスケールエンコーダ・デコーダ構造を特徴とし、大域的および局所的な経路は大規模な幾何学的構造と微細な局所的詳細の両方を捉えている。
論文 参考訳(メタデータ) (2025-07-07T07:36:03Z) - Textured Mesh Saliency: Bridging Geometry and Texture for Human Perception in 3D Graphics [50.23625950905638]
6自由度(6-DOF)VR環境下での革新的な視線追跡実験により構築したテクスチャメッシュ・サリエンシのための新しいデータセットを提案する。
本モデルでは,各三角形の面を個々の単位として扱い,各局所表面領域の重要性を反映した塩分濃度値を割り当てることで,テクスチャメッシュ表面の塩分濃度マップを推定する。
論文 参考訳(メタデータ) (2024-12-11T08:27:33Z) - Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - Semi-Weakly Supervised Object Kinematic Motion Prediction [56.282759127180306]
3Dオブジェクトが与えられた場合、運動予測は移動部と対応する運動パラメータを識別することを目的としている。
階層的部分分割と移動部パラメータのマップを学習するグラフニューラルネットワークを提案する。
ネットワーク予測は、擬似ラベル付き移動情報を持つ大規模な3Dオブジェクトを生成する。
論文 参考訳(メタデータ) (2023-03-31T02:37:36Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - MDA-Net: Multi-Dimensional Attention-Based Neural Network for 3D Image
Segmentation [4.221871357181261]
マルチ次元アテンションネットワーク(MDA-Net)を提案し,スライスワイド,空間,チャネルワイドアテンションを効率よくU-Netネットワークに統合する。
MICCAI iSegおよびIBSRデータセット上のモデルを評価し、実験結果が既存の方法よりも一貫した改善を示した。
論文 参考訳(メタデータ) (2021-05-10T16:58:34Z) - PIG-Net: Inception based Deep Learning Architecture for 3D Point Cloud
Segmentation [0.9137554315375922]
そこで我々はPIG-Netと呼ばれるインセプションに基づくディープネットワークアーキテクチャを提案し,点雲の局所的および大域的幾何学的詳細を効果的に特徴付ける。
我々は2つの最先端データセット上でPIG-Netアーキテクチャの徹底的な実験的解析を行う。
論文 参考訳(メタデータ) (2021-01-28T13:27:55Z) - Weakly Supervised Semantic Segmentation in 3D Graph-Structured Point
Clouds of Wild Scenes [36.07733308424772]
3Dセグメンテーションラベルの欠如は、効率的な点雲セグメンテーションの主な障害の1つである。
本稿では,2D のみを監督する点群における大規模セマンティックシーンセグメンテーションのための,新しいディープグラフ畳み込みネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-26T23:02:23Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。