論文の概要: Data-Efficient Point Cloud Semantic Segmentation Pipeline for Unimproved Roads
- arxiv url: http://arxiv.org/abs/2508.20135v1
- Date: Tue, 26 Aug 2025 20:00:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:01.59397
- Title: Data-Efficient Point Cloud Semantic Segmentation Pipeline for Unimproved Roads
- Title(参考訳): 統一道路におけるデータ効率の良いポイントクラウドセマンティックセマンティックセグメンテーションパイプライン
- Authors: Andrew Yarovoi, Christopher R. Valenta,
- Abstract要約: 未改良道路のロバストなセグメンテーションのための,データ効率のよいポイントクラウドセグメンテーションパイプラインとトレーニングフレームワークを提案する。
まず、プロジェクションベースの畳み込みニューラルネットワークを、公共の都市データセットと、小規模でキュレートされた内部データセットの混合で事前訓練する。
対象領域からの50個のラベル付き点雲を用いて、提案したトレーニング手法により、平均インターセクションオーバーユニオンが33.5%から51.8%に改善され、全体的な精度が85.5%から90.8%に向上したことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this case study, we present a data-efficient point cloud segmentation pipeline and training framework for robust segmentation of unimproved roads and seven other classes. Our method employs a two-stage training framework: first, a projection-based convolutional neural network is pre-trained on a mixture of public urban datasets and a small, curated in-domain dataset; then, a lightweight prediction head is fine-tuned exclusively on in-domain data. Along the way, we explore the application of Point Prompt Training to batch normalization layers and the effects of Manifold Mixup as a regularizer within our pipeline. We also explore the effects of incorporating histogram-normalized ambients to further boost performance. Using only 50 labeled point clouds from our target domain, we show that our proposed training approach improves mean Intersection-over-Union from 33.5% to 51.8% and the overall accuracy from 85.5% to 90.8%, when compared to naive training on the in-domain data. Crucially, our results demonstrate that pre-training across multiple datasets is key to improving generalization and enabling robust segmentation under limited in-domain supervision. Overall, this study demonstrates a practical framework for robust 3D semantic segmentation in challenging, low-data scenarios. Our code is available at: https://github.com/andrewyarovoi/MD-FRNet.
- Abstract(参考訳): 本稿では,未改良道路と他の7つのクラスのロバストなセグメンテーションのための,データ効率のよいポイントクラウドセグメンテーションパイプラインとトレーニングフレームワークを提案する。
まず、プロジェクションベースの畳み込みニューラルネットワークを、パブリックな都市データセットと、小規模でキュレートされたインドメインデータセットの混合で事前訓練し、軽量な予測ヘッドをドメイン内のデータのみに微調整する。
その過程で、ノードの正規化レイヤのバッチ化に対するPoint Prompt Trainingの適用と、パイプライン内の正規化子としてのManifold Mixupの効果について検討する。
また,ヒストグラム正規化環境を取り入れた性能向上効果についても検討した。
対象領域からの50個のラベル付き点雲を用いて、提案したトレーニング手法により、平均インターセクションオーバーユニオンを33.5%から51.8%に改善し、全体的な精度を85.5%から90.8%に改善した。
重要なことは、複数のデータセットにまたがる事前トレーニングが、一般化を改善し、ドメイン内の限られた監督の下で堅牢なセグメンテーションを可能にするための鍵であることを示す。
本研究は,挑戦的で低データなシナリオにおいて,ロバストな3次元セマンティックセマンティックセグメンテーションを実現するための実践的な枠組みを示す。
私たちのコードは、https://github.com/andrewyarovoi/MD-FRNet.comで利用可能です。
関連論文リスト
- E$^3$-Net: Efficient E(3)-Equivariant Normal Estimation Network [47.77270862087191]
正規推定のための等価性を実現するために,E3-Netを提案する。
本稿では,この作業に必要なトレーニングリソースを,従来の作業の1/8に大幅に削減する,効率的なランダムフレーム手法を提案する。
提案手法は, 合成と実世界の両方のデータセットにおいて優れた結果が得られ, 最先端技術よりもかなり優れている。
論文 参考訳(メタデータ) (2024-06-01T07:53:36Z) - Point Cloud Pre-training with Diffusion Models [62.12279263217138]
我々は、ポイントクラウド拡散事前学習(PointDif)と呼ばれる新しい事前学習手法を提案する。
PointDifは、分類、セグメンテーション、検出など、さまざまな下流タスクのために、さまざまな現実世界のデータセット間で大幅に改善されている。
論文 参考訳(メタデータ) (2023-11-25T08:10:05Z) - Pseudo-keypoint RKHS Learning for Self-supervised 6DoF Pose Estimation [0.9208007322096533]
6自由度ポーズ推定(6DoF PE)におけるシミュレーションと実領域ギャップに対処する。
本稿では,RKHS の学習可能なカーネルを用いて,このギャップを効果的に狭める,自己監督型キーポイント投票ベースの 6DoF PE フレームワークを提案する。
提案手法は,合成真実のポーズを持つ純粋合成データに基づいて事前学習されたアダプタネットワークであり,この元となる合成ドメインからターゲットとなる実領域へネットワークパラメータを進化させる。
論文 参考訳(メタデータ) (2023-11-16T01:52:24Z) - Less is More: Reducing Task and Model Complexity for 3D Point Cloud
Semantic Segmentation [26.94284739177754]
新しいパイプラインは、より優れたセグメンテーション精度を達成するために、より少ない地平線アノテーションを必要とする。
Sparse Depthwise Separable Convolutionモジュールは、ネットワークパラメータ数を著しく削減する。
新しいspatio-Temporal Redundant Frame Downsampling (ST-RFD) 法は、トレーニングデータフレームのより多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2023-03-20T15:36:10Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - Unsupervised Intra-domain Adaptation for Semantic Segmentation through
Self-Supervision [73.76277367528657]
畳み込みニューラルネットワークに基づくアプローチは、セマンティックセグメンテーションにおいて顕著な進歩を遂げた。
この制限に対処するために、グラフィックエンジンから生成された注釈付きデータを使用してセグメンテーションモデルをトレーニングする。
ドメイン間およびドメイン間ギャップを最小化する2段階の自己教師付きドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T15:24:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。