論文の概要: Dynamic Convolution for 3D Point Cloud Instance Segmentation
- arxiv url: http://arxiv.org/abs/2107.08392v1
- Date: Sun, 18 Jul 2021 09:05:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-20 14:59:58.624996
- Title: Dynamic Convolution for 3D Point Cloud Instance Segmentation
- Title(参考訳): 3次元クラウドインスタンスセグメンテーションのための動的畳み込み
- Authors: Tong He, Chunhua Shen, Anton van den Hengel
- Abstract要約: 動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
- 参考スコア(独自算出の注目度): 146.7971476424351
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose an approach to instance segmentation from 3D point clouds based on
dynamic convolution. This enables it to adapt, at inference, to varying feature
and object scales. Doing so avoids some pitfalls of bottom up approaches,
including a dependence on hyper-parameter tuning and heuristic post-processing
pipelines to compensate for the inevitable variability in object sizes, even
within a single scene. The representation capability of the network is greatly
improved by gathering homogeneous points that have identical semantic
categories and close votes for the geometric centroids. Instances are then
decoded via several simple convolution layers, where the parameters are
generated conditioned on the input. The proposed approach is proposal-free, and
instead exploits a convolution process that adapts to the spatial and semantic
characteristics of each instance. A light-weight transformer, built on the
bottleneck layer, allows the model to capture long-range dependencies, with
limited computational overhead. The result is a simple, efficient, and robust
approach that yields strong performance on various datasets: ScanNetV2, S3DIS,
and PartNet. The consistent improvements on both voxel- and point-based
architectures imply the effectiveness of the proposed method. Code is available
at: https://git.io/DyCo3D
- Abstract(参考訳): 動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
これにより、推論において、さまざまな機能やオブジェクトスケールに適応することができる。
例えば、ハイパーパラメータチューニングやヒューリスティックな後処理パイプラインに依存して、単一のシーン内であっても、オブジェクトサイズの避けられない変動を補償する、という方法だ。
ネットワークの表現能力は、同じ意味圏を持つ均質な点を収集し、幾何中心体に対する近接投票を行うことで大幅に向上する。
インスタンスはいくつかの単純な畳み込みレイヤを通じてデコードされ、そこでパラメータは入力に条件付きで生成される。
提案手法は提案なしであり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
ボトルネック層上に構築された軽量トランスフォーマーにより、計算オーバーヘッドが制限された長い範囲の依存関係をキャプチャできる。
その結果、ScanNetV2、S3DIS、PartNetといったさまざまなデータセット上で、シンプルで効率的で堅牢なアプローチが実現した。
ボクセルおよび点ベースアーキテクチャにおける一貫した改良により,提案手法の有効性が示唆された。
https://git.io/dyco3d
関連論文リスト
- ISBNet: a 3D Point Cloud Instance Segmentation Network with
Instance-aware Sampling and Box-aware Dynamic Convolution [14.88505076974645]
ISBNetは、インスタンスをカーネルとして表現し、動的畳み込みを通じてインスタンスマスクをデコードする新しい方法である。
我々は,ScanNetV2 (55.9), S3DIS (60.8), S3LS3D (49.2) にAPの条件で新たな最先端結果を設定し,ScanNetV2のシーンあたり237msの高速推論時間を保持する。
論文 参考訳(メタデータ) (2023-03-01T06:06:28Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Stratified Transformer for 3D Point Cloud Segmentation [89.9698499437732]
Stratified Transformerは、長距離コンテキストをキャプチャし、強力な一般化能力と高性能を示す。
不規則な点配置によって引き起こされる課題に対処するために,局所情報を集約する第1層点埋め込みを提案する。
S3DIS, ScanNetv2およびShapeNetPartデータセットにおける本手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2022-03-28T05:35:16Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。