論文の概要: GFNet: Geometric Flow Network for 3D Point Cloud Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2207.02605v1
- Date: Wed, 6 Jul 2022 11:48:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 20:20:36.676132
- Title: GFNet: Geometric Flow Network for 3D Point Cloud Semantic Segmentation
- Title(参考訳): gfnet:3dポイントクラウドセマンティクスセグメンテーションのための幾何フローネットワーク
- Authors: Haibo Qiu, Baosheng Yu and Dacheng Tao
- Abstract要約: 本稿では,異なるビュー間の幾何対応性を検討するための幾何フローネットワーク (GFNet) を提案する。
具体的には、異なる視点にまたがって補完情報を双方向に整列し、伝播する新しい幾何フローモジュール(GFM)を考案する。
- 参考スコア(独自算出の注目度): 91.15865862160088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Point cloud semantic segmentation from projected views, such as range-view
(RV) and bird's-eye-view (BEV), has been intensively investigated. Different
views capture different information of point clouds and thus are complementary
to each other. However, recent projection-based methods for point cloud
semantic segmentation usually utilize a vanilla late fusion strategy for the
predictions of different views, failing to explore the complementary
information from a geometric perspective during the representation learning. In
this paper, we introduce a geometric flow network (GFNet) to explore the
geometric correspondence between different views in an align-before-fuse
manner. Specifically, we devise a novel geometric flow module (GFM) to
bidirectionally align and propagate the complementary information across
different views according to geometric relationships under the end-to-end
learning scheme. We perform extensive experiments on two widely used benchmark
datasets, SemanticKITTI and nuScenes, to demonstrate the effectiveness of our
GFNet for project-based point cloud semantic segmentation. Concretely, GFNet
not only significantly boosts the performance of each individual view but also
achieves state-of-the-art results over all existing projection-based models.
Code is available at \url{https://github.com/haibo-qiu/GFNet}.
- Abstract(参考訳): 射程ビュー (RV) や鳥眼ビュー (BEV) などの投影ビューからのポイントクラウドセマンティックセマンティックセマンティクスを集中的に検討した。
異なるビューは点雲の異なる情報をキャプチャし、互いに補完する。
しかし、最近の射影的クラウドセマンティックセグメンテーションの手法は、通常、異なる視点の予測にバニラララトフュージョン戦略を使用し、表現学習の幾何学的視点から補完的な情報を探索することができない。
本稿では,異なる視点間の幾何学的対応をアライメント・プレ・ヒューズ方式で探究する幾何フローネットワーク(gfnet)を提案する。
具体的には,エンド・ツー・エンドの学習方式において,異なる視点にまたがる補完的情報を双方向に調整・伝達する新たな幾何フローモジュール(gfm)を考案する。
プロジェクトベースのポイントクラウドセマンティクスセグメンテーションにおけるgfnetの有効性を実証するために,semantickittiとnusceneという2つのベンチマークデータセットを広範囲に実験した。
具体的には、GFNetは個々のビューのパフォーマンスを大幅に向上するだけでなく、既存のプロジェクションベースのモデルに対して最先端の結果も達成する。
コードは \url{https://github.com/haibo-qiu/gfnet} で入手できる。
関連論文リスト
- PointeNet: A Lightweight Framework for Effective and Efficient Point
Cloud Analysis [28.54939134635978]
PointeNetは、ポイントクラウド分析に特化したネットワークである。
本手法は,分類/分割ヘッドとシームレスに統合したり,市販の3Dオブジェクト検出ネットワークに埋め込んだりすることで,柔軟性を示す。
ModelNet40、ScanObjectNN、ShapeNet KITTI、およびシーンレベルのデータセットKITTIを含むオブジェクトレベルのデータセットの実験は、ポイントクラウド分析における最先端メソッドよりもPointeNetの方が優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-12-20T03:34:48Z) - Geometrically-driven Aggregation for Zero-shot 3D Point Cloud
Understanding [12.471588883720615]
ゼロショット3Dポイントクラウド理解は2Dビジョンランゲージモデル(VLM)によって達成できる
既存の戦略は、ヴィジュアル・ランゲージ・モデル(Vision-Language Model)をレンダリングまたはキャプチャされた2Dピクセルから3Dポイントにマッピングし、固有かつ表現可能な雲の幾何学構造を見渡す。
本稿では, 点雲の3次元幾何学的構造を利用して, 移動したビジョン・ランゲージモデルの品質を向上させるための, 初となるトレーニングフリーアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2023-12-04T12:30:07Z) - Generalized Few-Shot Point Cloud Segmentation Via Geometric Words [54.32239996417363]
ショットポイントクラウドセグメンテーションアルゴリズムは、ベースクラスのセグメンテーション精度を犠牲にして、新しいクラスに適応するように学習する。
一般化された数ショット点雲のセグメンテーションというより実践的なパラダイムの最初の試みを示す。
基本クラスと新規クラス間で共有される幾何学的要素を表す幾何学的単語を提案し,それらを新しい幾何学的意味表現に組み込む。
論文 参考訳(メタデータ) (2023-09-20T11:24:33Z) - Adaptive Edge-to-Edge Interaction Learning for Point Cloud Analysis [118.30840667784206]
ポイントクラウドデータ処理の大きな問題は、ローカルリージョンから有用な情報を抽出することだ。
従来の研究は、局所的な形状情報を符号化する地域におけるエッジ間の関係を無視していた。
本稿では,Adaptive Edge-to-Edge Interaction Learningモジュールを提案する。
論文 参考訳(メタデータ) (2022-11-20T07:10:14Z) - Multi-scale Network with Attentional Multi-resolution Fusion for Point
Cloud Semantic Segmentation [2.964101313270572]
ローカルおよびグローバルなマルチスケール情報を集約する総合的なポイントクラウドセマンティックセマンティックセマンティクスネットワークを提案する。
点の局所的な形状を効果的に学習するアングル相関点畳み込みモジュールを提案する。
第3に、2Dイメージビジョンタスクのパフォーマンスに優れたHRNetにインスパイアされた私たちは、ポイントクラウド用にカスタマイズされたHRNetを構築し、グローバルなマルチスケールコンテキストを学習します。
論文 参考訳(メタデータ) (2022-06-27T21:03:33Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Learning point embedding for 3D data processing [2.12121796606941]
現在の点ベース法は本質的に空間関係処理ネットワークである。
PE-Netは高次元空間における点雲の表現を学習する。
実験によると、PE-Netは複数の挑戦的なデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-07-19T00:25:28Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z) - Refinement of Predicted Missing Parts Enhance Point Cloud Completion [62.997667081978825]
点雲完了は、部分的な観測から3次元形状の点集合表現を用いて完全な幾何学を予測するタスクである。
従来のアプローチでは、不完全点集合によって供給されるエンコーダ・デコーダモデルにより、点雲全体を直接推定するニューラルネットワークが提案されていた。
本稿では、欠落した幾何を計算し、既知の入力と予測点クラウドを融合することに焦点を当てたエンドツーエンドニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-08T22:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。