論文の概要: Joint prototype and coefficient prediction for 3D instance segmentation
- arxiv url: http://arxiv.org/abs/2407.06958v1
- Date: Tue, 9 Jul 2024 15:36:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-10 17:37:36.936345
- Title: Joint prototype and coefficient prediction for 3D instance segmentation
- Title(参考訳): 3次元インスタンスセグメンテーションのための共同プロトタイプと係数予測
- Authors: Remco Royen, Leon Denis, Adrian Munteanu,
- Abstract要約: 3Dインスタンスのセグメンテーションは、包括的な3Dシーン理解を必要とするアプリケーションにとって不可欠である。
本稿では,係数とプロトタイプを同時に学習する新しい手法を提案する。
提案手法はS3DISブロック上での優れた性能を示し,mRecおよびmPrecの既存手法よりも一貫して優れていた。
推定時間は0.8%に過ぎず,既存手法に比べて20倍以上の差がみられた。
- 参考スコア(独自算出の注目度): 6.632158868486343
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: 3D instance segmentation is crucial for applications demanding comprehensive 3D scene understanding. In this paper, we introduce a novel method that simultaneously learns coefficients and prototypes. Employing an overcomplete sampling strategy, our method produces an overcomplete set of instance predictions, from which the optimal ones are selected through a Non-Maximum Suppression (NMS) algorithm during inference. The obtained prototypes are visualizable and interpretable. Our method demonstrates superior performance on S3DIS-blocks, consistently outperforming existing methods in mRec and mPrec. Moreover, it operates 32.9% faster than the state-of-the-art. Notably, with only 0.8% of the total inference time, our method exhibits an over 20-fold reduction in the variance of inference time compared to existing methods. These attributes render our method well-suited for practical applications requiring both rapid inference and high reliability.
- Abstract(参考訳): 3Dインスタンスのセグメンテーションは、包括的な3Dシーン理解を必要とするアプリケーションにとって不可欠である。
本稿では,係数とプロトタイプを同時に学習する新しい手法を提案する。
オーバーコンプリートサンプリング戦略を用いることで,提案手法はインスタンス予測のオーバーコンプリートセットを生成し,その最適化手法は推論中にNon-Maximum Suppression (NMS) アルゴリズムによって選択される。
得られたプロトタイプは、可視化可能で解釈可能である。
提案手法はS3DISブロック上での優れた性能を示し,mRecおよびmPrecの既存手法よりも一貫して優れていた。
さらに、最先端技術よりも32.9%高速で動作する。
特に,提案手法は推定時間の0.8%に過ぎず,既存の手法に比べて20倍以上の時間差の減少を示す。
これらの属性は、高速な推論と高信頼性の両方を必要とする実用的な応用に適している。
関連論文リスト
- Importance of Aligning Training Strategy with Evaluation for Diffusion
Models in 3D Multiclass Segmentation [8.649603931882227]
DDPMに基づく2つの大規模マルチクラスデータセット上の3次元マルチクラスセグメンテーションのためのセグメンテーションモデルについて検討した。
その結果,既存のDDPM法では訓練方法と試験方法の違いが劣ることがわかった。
この不整合を緩和するため, モデルの予測に基づいて, 劣化したマスクを生成するリサイクル手法を提案した。
論文 参考訳(メタデータ) (2023-03-10T16:30:09Z) - 3D-QueryIS: A Query-based Framework for 3D Instance Segmentation [74.6998931386331]
従来の3Dインスタンスセグメンテーションの方法は、しばしばタスク間の依存関係と堅牢性の欠如の傾向を維持する。
本稿では,3D-QueryISと呼ばれる新しい問合せ方式を提案する。
私たちの3D-QueryISは、タスク間の依存関係による累積エラーから解放されています。
論文 参考訳(メタデータ) (2022-11-17T07:04:53Z) - 3D Cross Pseudo Supervision (3D-CPS): A semi-supervised nnU-Net
architecture for abdominal organ segmentation [8.538887194517763]
そこで我々は,Cross Pseudo Supervision法によるnnU-Netに基づく半教師付きネットワークアーキテクチャである,新しい3Dクロス擬似スーパービジョン(3D-CPS)手法を提案する。
提案手法は,MICCAI FLARE2022 検証セット上で 0.881 の平均サイス類似度係数 (DSC) と 0.913 の平均正規化表面距離 (NSD) を達成する。
論文 参考訳(メタデータ) (2022-09-19T11:46:43Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Revitalizing Optimization for 3D Human Pose and Shape Estimation: A
Sparse Constrained Formulation [21.710205047008916]
そこで我々は,新しいスパース制約型定式化を提案し,そこから3次元人間のポーズと形状推定のリアルタイム最適化手法を導出した。
この計算は、複雑な3次元人体モデルの関節の数と線形にスケールすることを示し、より密集した非拘束的な定式化のために立方的にスケールする以前の作業とは対照的である。
本研究では,30FPS以上の1枚の画像から3次元の人間のポーズと形状を推定するリアルタイムモーションキャプチャフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T16:44:56Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - Learning Expectation of Label Distribution for Facial Age and
Attractiveness Estimation [65.5880700862751]
本稿では,2つの最先端手法(Ranking-CNNとDLDL)の本質的な関係を解析し,ランキング法が実際にラベル分布を暗黙的に学習していることを示す。
軽量なネットワークアーキテクチャを提案し、顔属性の分布と回帰属性の値を共同で学習できる統一的なフレームワークを提案する。
提案手法は,36$times$パラメータが小さく,3$times$が顔の年齢/魅力度推定における高速な推論速度を持つ単一モデルを用いて,新しい最先端結果を実現する。
論文 参考訳(メタデータ) (2020-07-03T15:46:53Z) - 3DSSD: Point-based 3D Single Stage Object Detector [61.67928229961813]
本稿では,3DSSDと命名された点ベース3次元単段物体検出器を提案し,精度と効率のバランスが良好であることを示す。
提案手法は,最先端のボクセルをベースとした一段法を大差で上回り,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-02-24T12:01:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。