論文の概要: ProtoSeg: A Prototype-Based Point Cloud Instance Segmentation Method
- arxiv url: http://arxiv.org/abs/2410.02352v1
- Date: Thu, 3 Oct 2024 10:05:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 03:50:17.192484
- Title: ProtoSeg: A Prototype-Based Point Cloud Instance Segmentation Method
- Title(参考訳): ProtoSeg: プロトタイプベースのポイントクラウドインスタンスセグメンテーション手法
- Authors: Remco Royen, Leon Denis, Adrian Munteanu,
- Abstract要約: 本稿では,3次元点雲上でインスタンスセグメンテーションを行うニューラルネットワークアーキテクチャを提案する。
本稿では, 並列に係数とプロトタイプを学習し, 組み合わせて実例予測を行う手法を提案する。
提案手法は,最先端技術よりも28%高速であるだけでなく,標準偏差が低いことを示す。
- 参考スコア(独自算出の注目度): 6.632158868486343
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D instance segmentation is crucial for obtaining an understanding of a point cloud scene. This paper presents a novel neural network architecture for performing instance segmentation on 3D point clouds. We propose to jointly learn coefficients and prototypes in parallel which can be combined to obtain the instance predictions. The coefficients are computed using an overcomplete set of sampled points with a novel multi-scale module, dubbed dilated point inception. As the set of obtained instance mask predictions is overcomplete, we employ a non-maximum suppression algorithm to retrieve the final predictions. This approach allows to omit the time-expensive clustering step and leads to a more stable inference time. The proposed method is not only 28% faster than the state-of-the-art, it also exhibits the lowest standard deviation. Our experiments have shown that the standard deviation of the inference time is only 1.0% of the total time while it ranges between 10.8 and 53.1% for the state-of-the-art methods. Lastly, our method outperforms the state-of-the-art both on S3DIS-blocks (4.9% in mRec on Fold-5) and PartNet (2.0% on average in mAP).
- Abstract(参考訳): 3Dインスタンスのセグメンテーションは、ポイントクラウドシーンの理解を得るために不可欠である。
本稿では,3次元点雲上でインスタンスセグメンテーションを行うニューラルネットワークアーキテクチャを提案する。
本稿では, 並列に係数とプロトタイプを学習し, 組み合わせて実例予測を行う手法を提案する。
これらの係数は、拡張点開始と呼ばれる新しいマルチスケールモジュールを持つサンプル点のオーバーコンプリートセットを用いて計算される。
得られたインスタンスマスク予測のセットはオーバーコンプリートであるため、最終的な予測を検索するために、最大ではない抑制アルゴリズムを用いる。
このアプローチは、時間的拡張的なクラスタリングステップを省略し、より安定した推論時間をもたらす。
提案手法は,最先端技術よりも28%高速であるだけでなく,標準偏差が低いことを示す。
実験の結果, 推定時間の標準偏差は総時間の1.0%に過ぎず, 最先端の手法では10.8から53.1%の範囲であることがわかった。
最後に,本手法はS3DISブロック(Fold-5におけるmRecの4.9%)とPartNet(mAPにおける平均2.0%)において,最先端の手法よりも優れていた。
関連論文リスト
- Joint prototype and coefficient prediction for 3D instance segmentation [6.632158868486343]
3Dインスタンスのセグメンテーションは、包括的な3Dシーン理解を必要とするアプリケーションにとって不可欠である。
本稿では,係数とプロトタイプを同時に学習する新しい手法を提案する。
提案手法はS3DISブロック上での優れた性能を示し,mRecおよびmPrecの既存手法よりも一貫して優れていた。
推定時間は0.8%に過ぎず,既存手法に比べて20倍以上の差がみられた。
論文 参考訳(メタデータ) (2024-07-09T15:36:13Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Multi-modality Affinity Inference for Weakly Supervised 3D Semantic
Segmentation [47.81638388980828]
本稿では,マルチモーダルポイント親和性推論モジュールを新たに導入した,シンプルで効果的なシーンレベルの弱教師付きポイントクラウドセグメンテーション法を提案する。
ScanNet と S3DIS のベンチマークでは,最先端の ScanNet と S3DIS のベンチマークでは 4% から 6% の mIoU を達成している。
論文 参考訳(メタデータ) (2023-12-27T14:01:35Z) - Grad-PU: Arbitrary-Scale Point Cloud Upsampling via Gradient Descent
with Learned Distance Functions [77.32043242988738]
我々は、任意のアップサンプリングレートをサポートする、正確なポイントクラウドアップサンプリングのための新しいフレームワークを提案する。
提案手法は,まず,所定のアップサンプリング率に応じて低解像度の雲を補間する。
論文 参考訳(メタデータ) (2023-04-24T06:36:35Z) - Post-Processing Temporal Action Detection [134.26292288193298]
時間的行動検出(TAD)法は、通常、入力された可変長のビデオを固定長のスニペット表現シーケンスに変換する際に、前処理のステップを踏む。
この前処理ステップは、ビデオを時間的にダウンサンプリングし、推論の解像度を低減し、元の時間分解における検出性能を阻害する。
モデルの再設計や再学習を伴わない新しいモデル非依存のポストプロセッシング手法を提案する。
論文 参考訳(メタデータ) (2022-11-27T19:50:37Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - A Coarse-to-Fine Instance Segmentation Network with Learning Boundary
Representation [10.967299485260163]
境界ベースのインスタンスセグメンテーションは、その魅力的な効率性から多くの注目を集めている。
既存の手法は長距離回帰の難しさに悩まされている。
この問題に対処する粗大なモジュールを提案する。
論文 参考訳(メタデータ) (2021-06-18T16:37:28Z) - 3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。
提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-02-24T12:01:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。