論文の概要: SoftGroup++: Scalable 3D Instance Segmentation with Octree Pyramid
Grouping
- arxiv url: http://arxiv.org/abs/2209.08263v1
- Date: Sat, 17 Sep 2022 06:36:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 18:03:14.802717
- Title: SoftGroup++: Scalable 3D Instance Segmentation with Octree Pyramid
Grouping
- Title(参考訳): SoftGroup++:Octree Pyramid Groupingによるスケーラブルな3Dインスタンスセグメンテーション
- Authors: Thang Vu, Kookhoi Kim, Tung M. Luu, Thanh Nguyen, Junyeong Kim, Chang
D. Yoo
- Abstract要約: 既存の3Dポイントクラウドインスタンスのセグメンテーションメソッドは、グループがオブジェクトインスタンスを取得するためにポイントをグループ化するアプローチに依存している。
数百万のポイントでシーンを処理するために、既存の最速のメソッドであるSoftGroup citevu2022softgroupは数十秒を要する。
本稿では,この計算ボトルネックに対処し,ネットワーク全体の推論速度をさらに最適化するために,SoftGroup++を提案する。
- 参考スコア(独自算出の注目度): 20.679509793287465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing state-of-the-art 3D point cloud instance segmentation methods rely
on a grouping-based approach that groups points to obtain object instances.
Despite improvement in producing accurate segmentation results, these methods
lack scalability and commonly require dividing large input into multiple parts.
To process a scene with millions of points, the existing fastest method
SoftGroup \cite{vu2022softgroup} requires tens of seconds, which is under
satisfaction. Our finding is that $k$-Nearest Neighbor ($k$-NN), which serves
as the prerequisite of grouping, is a computational bottleneck. This bottleneck
severely worsens the inference time in the scene with a large number of points.
This paper proposes SoftGroup++ to address this computational bottleneck and
further optimize the inference speed of the whole network. SoftGroup++ is built
upon SoftGroup, which differs in three important aspects: (1) performs octree
$k$-NN instead of vanilla $k$-NN to reduce time complexity from
$\mathcal{O}(n^2)$ to $\mathcal{O}(n \log n)$, (2) performs pyramid scaling
that adaptively downsamples backbone outputs to reduce search space for $k$-NN
and grouping, and (3) performs late devoxelization that delays the conversion
from voxels to points towards the end of the model such that intermediate
components operate at a low computational cost. Extensive experiments on
various indoor and outdoor datasets demonstrate the efficacy of the proposed
SoftGroup++. Notably, SoftGroup++ processes large scenes of millions of points
by a single forward without dividing the input into multiple parts, thus
enriching contextual information. Especially, SoftGroup++ achieves 2.4 points
AP$_{50}$ improvement while nearly $6\times$ faster than the existing fastest
method on S3DIS dataset. The code and trained models will be made publicly
available.
- Abstract(参考訳): 既存の最先端の3Dポイントクラウドインスタンスセグメンテーションメソッドは、グループがオブジェクトインスタンスを取得するために指しているグループベースのアプローチに依存している。
正確なセグメンテーション結果の生成の改善にもかかわらず、これらの手法はスケーラビリティに欠け、通常、大きな入力を複数の部分に分割する必要がある。
数百万のポイントでシーンを処理するために、既存の最速のメソッドであるSoftGroup \cite{vu2022softgroup}は、満足のいく数秒を必要とする。
我々の発見は、グループ化の前提条件である$k$-Nearest Neighbor(k$-NN)が計算ボトルネックであることである。
このボトルネックは、多数のポイントを持つシーンの推論時間を著しく悪化させる。
本稿では,この計算ボトルネックに対処するためにsoftgroup++を提案し,ネットワーク全体の推論速度をさらに最適化する。
SoftGroup++ is built upon SoftGroup, which differs in three important aspects: (1) performs octree $k$-NN instead of vanilla $k$-NN to reduce time complexity from $\mathcal{O}(n^2)$ to $\mathcal{O}(n \log n)$, (2) performs pyramid scaling that adaptively downsamples backbone outputs to reduce search space for $k$-NN and grouping, and (3) performs late devoxelization that delays the conversion from voxels to points towards the end of the model such that intermediate components operate at a low computational cost.
様々な屋内および屋外データセットに対する大規模な実験は、提案したSoftGroup++の有効性を示す。
特にsoftgroup++は、入力を複数の部分に分割することなく、何百万ものポイントの大きなシーンを1回ずつ処理し、コンテキスト情報を豊かにする。
特にsoftgroup++ は 2.4 ポイント ap$_{50}$ 改善を達成し、s3dis データセットの既存の最速メソッドよりも 6\times$ に近い。
コードとトレーニングされたモデルは公開されます。
関連論文リスト
- Simple, Scalable and Effective Clustering via One-Dimensional
Projections [10.807367640692021]
クラスタリングは、教師なし機械学習における基本的な問題であり、データ分析に多くの応用がある。
任意の$k$に対して、期待時間$O(mathrmnnz(X) + nlog n)$で確実に動作する単純なランダム化クラスタリングアルゴリズムを導入する。
我々は,このアルゴリズムが$k$-means目的の任意の入力データセットに対して,近似比$smashwidetildeO(k4)$を達成することを証明した。
論文 参考訳(メタデータ) (2023-10-25T16:37:45Z) - Do you know what q-means? [50.045011844765185]
クラスタリングは、大規模なデータセットを分析する上で最も重要なツールの1つである。
クラスタリングのための"$q$-means"アルゴリズムの改良版を提案する。
また、$Obig(frack2varepsilon2(sqrtkd + log(Nd))big で実行される $varepsilon に対する "dequantized" アルゴリズムも提示する。
論文 参考訳(メタデータ) (2023-08-18T17:52:12Z) - MaskGroup: Hierarchical Point Grouping and Masking for 3D Instance
Segmentation [36.28586460186891]
本稿では,ロボット工学や拡張現実といった現実的な応用の多種多様な3Dインスタンスセグメンテーション問題について検討する。
本稿では,3Dインスタンスをグループ化し,洗練するための新しいフレームワークを提案する。
提案手法は,ScanNetV2テストセットの0.5IoU閾値で66.4%のmAPを達成する。
論文 参考訳(メタデータ) (2022-03-28T11:22:58Z) - SoftGroup for 3D Instance Segmentation on Point Clouds [16.746879832626036]
既存の最先端の3Dインスタンスセグメンテーションメソッドはセグメンテーションを行い、次にグループ化する。
本稿では,ボトムアップソフトグループ化とトップダウンリファインメントを併用して,SoftGroupと呼ばれる3次元インスタンスセグメンテーション手法を提案する。
異なるデータセットと複数の評価指標の実験結果から,SoftGroupの有効性が示された。
論文 参考訳(メタデータ) (2022-03-03T04:35:37Z) - TURF: A Two-factor, Universal, Robust, Fast Distribution Learning
Algorithm [64.13217062232874]
最も強力で成功したモダリティの1つは、全ての分布を$ell$距離に近似し、基本的に最も近い$t$-piece次数-$d_$の少なくとも1倍大きい。
本稿では,この数値をほぼ最適に推定する手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T03:49:28Z) - Systematically improving existing k-means initialization algorithms at
nearly no cost, by pairwise-nearest-neighbor smoothing [1.2570180539670577]
PNN-smoothingと呼ばれる$k$-meansクラスタリングアルゴリズムを初期化するメタメソッドを提案する。
与えられたデータセットを$J$のランダムなサブセットに分割し、各データセットを個別にクラスタリングし、結果のクラスタリングをペアワイズ・アネレス・ニーバーメソッドとマージする。
論文 参考訳(メタデータ) (2022-02-08T15:56:30Z) - GSIP: Green Semantic Segmentation of Large-Scale Indoor Point Clouds [64.86292006892093]
GSIP (Green of Indoor Point clouds) は大規模屋内シーンポイント雲のセマンティックセグメンテーションの効率的なソリューションである。
GSIPには2つの新しいコンポーネントがある: 1) 更なる処理のためにポイントの適切なサブセットを選択するルームスタイルのデータ前処理方法、2) ポイントホップから拡張された新しい特徴抽出器。
実験の結果、GSIPはS3DISデータセットのセグメンテーション性能においてPointNetよりも優れていた。
論文 参考訳(メタデータ) (2021-09-24T09:26:53Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - Faster DBSCAN via subsampled similarity queries [42.93847281082316]
DBSCANは密度に基づくクラスタリングアルゴリズムとして人気がある。
本稿では,サブサンプルである$epsilon$-neighborhoodグラフに基づいてクラスタをクラスタ化するSNG-DBSCANを提案する。
論文 参考訳(メタデータ) (2020-06-11T18:57:54Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。