論文の概要: EipFormer: Emphasizing Instance Positions in 3D Instance Segmentation
- arxiv url: http://arxiv.org/abs/2312.05602v1
- Date: Sat, 9 Dec 2023 16:08:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 19:46:19.104947
- Title: EipFormer: Emphasizing Instance Positions in 3D Instance Segmentation
- Title(参考訳): EipFormer: 3Dインスタンスセグメンテーションにおけるインスタンス位置の強調
- Authors: Mengnan Zhao, Lihe Zhang, Yuqiu Kong and Baocai Yin
- Abstract要約: 本稿では, プログレッシブアグリゲーションとデュアル位置埋め込みを組み合わせた新しいトランスフォーマーアーキテクチャ, EipFormerを提案する。
EipFormerは最先端のアプローチよりも優れた、あるいは同等のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 51.996943482875366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D instance segmentation plays a crucial role in comprehending 3D scenes.
Despite recent advancements in this field, existing approaches exhibit certain
limitations. These methods often rely on fixed instance positions obtained from
sampled representative points in vast 3D point clouds, using center prediction
or farthest point sampling. However, these selected positions may deviate from
actual instance centers, posing challenges in precisely grouping instances.
Moreover, the common practice of grouping candidate instances from a single
type of coordinates introduces difficulties in identifying neighboring
instances or incorporating edge points. To tackle these issues, we present a
novel Transformer-based architecture, EipFormer, which comprises progressive
aggregation and dual position embedding. The progressive aggregation mechanism
leverages instance positions to refine instance proposals. It enhances the
initial instance positions through weighted farthest point sampling and further
refines the instance positions and proposals using aggregation averaging and
center matching. Additionally, dual position embedding superposes the original
and centralized position embeddings, thereby enhancing the model performance in
distinguishing adjacent instances. Extensive experiments on popular datasets
demonstrate that EipFormer achieves superior or comparable performance compared
to state-of-the-art approaches.
- Abstract(参考訳): 3Dインスタンスのセグメンテーションは、3Dシーンの理解において重要な役割を果たす。
この分野での最近の進歩にもかかわらず、既存のアプローチには一定の制限がある。
これらの手法はしばしば、中心予測や最遠点サンプリングを用いて、広大な3次元点雲のサンプル代表点から得られる固定されたインスタンス位置に依存する。
しかし、これらの選択されたポジションは実際のインスタンスセンターから外れる可能性があり、正確にインスタンスをグループ化する上での課題となる。
さらに、一つの座標から候補インスタンスをグループ化する一般的な手法は、隣接するインスタンスを識別したり、エッジポイントを組み込むのに困難をもたらす。
これらの問題に対処するため,我々は,プログレッシブアグリゲーションと2重位置埋め込みを含む新しいトランスフォーマーアーキテクチャ eipformer を提案する。
プログレッシブアグリゲーションメカニズムはインスタンスの位置を利用してインスタンスの提案を洗練する。
加重極点サンプリングにより初期インスタンス位置を強化し、アグリゲーション平均とセンターマッチングを用いてインスタンス位置と提案をさらに洗練する。
さらに、双対位置埋め込みは原位置埋め込みと集中位置埋め込みを重畳し、隣接するインスタンスを区別するモデル性能を向上させる。
一般的なデータセットに関する大規模な実験は、EipFormerが最先端のアプローチよりも優れた、あるいは同等のパフォーマンスを実現していることを示している。
関連論文リスト
- Instance-free Text to Point Cloud Localization with Relative Position Awareness [37.22900045434484]
テキスト・ツー・ポイント・クラウド クロスモーダル・ローカライゼーションは、未来のロボットと人間のコラボレーションにとって重要な視覚言語タスクである。
既存のアプローチの2つの重要な制限に対処する: 1) 地中実例への依存を入力とし、2) 潜在事例間の相対的な位置を無視する。
提案モデルは,テキストセル検索のための粗いステージと位置推定のための微細なステージを含む,2段階のパイプラインに従う。
論文 参考訳(メタデータ) (2024-04-27T09:46:49Z) - AutoInst: Automatic Instance-Based Segmentation of LiDAR 3D Scans [41.17467024268349]
3D環境を理解するには、きめ細かい風景を理解する必要がある。
教師なしの方法で3次元シーンのインスタンスセグメンテーションを予測することを提案する。
平均精度は13.3%,F1スコアは9.1%向上した。
論文 参考訳(メタデータ) (2024-03-24T22:53:16Z) - Position-Guided Point Cloud Panoptic Segmentation Transformer [118.17651196656178]
この作業は、LiDARベースのポイントクラウドセグメンテーションにこの魅力的なパラダイムを適用し、シンプルだが効果的なベースラインを得ることから始まります。
スパース点雲のインスタンスはシーン全体に対して比較的小さく、しばしば類似した形状を持つが、画像領域では珍しいセグメンテーションの外観が欠如している。
position-guided Point cloud Panoptic segmentation transFormer (P3Former) と名付けられたこの手法は、Semantic KITTI と nuScenes のベンチマークでそれぞれ3.4%、そして 1.2%の性能をそれぞれ上回っている。
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。