論文の概要: Push-the-Boundary: Boundary-aware Feature Propagation for Semantic
Segmentation of 3D Point Clouds
- arxiv url: http://arxiv.org/abs/2212.12402v1
- Date: Fri, 23 Dec 2022 15:42:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 16:52:42.136930
- Title: Push-the-Boundary: Boundary-aware Feature Propagation for Semantic
Segmentation of 3D Point Clouds
- Title(参考訳): プッシュ・ザ・バウンダリ:3次元点雲のセマンティックセグメンテーションのための境界認識特徴伝搬
- Authors: Shenglan Du, Nail Ibrahimli, Jantien Stoter, Julian Kooij, Liangliang
Nan
- Abstract要約: 本研究では,オブジェクト境界近傍のセマンティックセグメンテーションを改善するための境界対応特徴伝搬機構を提案する。
1つの共有エンコーダで、ネットワークは、(i)境界ローカライゼーション、(ii)オブジェクトの内部を指す方向の予測、(iii)セマンティックセグメンテーションを3つの並列ストリームで出力する。
提案手法は境界誤差を低減することによって一貫した改善をもたらす。
- 参考スコア(独自算出の注目度): 0.5249805590164901
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feedforward fully convolutional neural networks currently dominate in
semantic segmentation of 3D point clouds. Despite their great success, they
suffer from the loss of local information at low-level layers, posing
significant challenges to accurate scene segmentation and precise object
boundary delineation. Prior works either address this issue by post-processing
or jointly learn object boundaries to implicitly improve feature encoding of
the networks. These approaches often require additional modules which are
difficult to integrate into the original architecture.
To improve the segmentation near object boundaries, we propose a
boundary-aware feature propagation mechanism. This mechanism is achieved by
exploiting a multi-task learning framework that aims to explicitly guide the
boundaries to their original locations. With one shared encoder, our network
outputs (i) boundary localization, (ii) prediction of directions pointing to
the object's interior, and (iii) semantic segmentation, in three parallel
streams. The predicted boundaries and directions are fused to propagate the
learned features to refine the segmentation. We conduct extensive experiments
on the S3DIS and SensatUrban datasets against various baseline methods,
demonstrating that our proposed approach yields consistent improvements by
reducing boundary errors. Our code is available at
https://github.com/shenglandu/PushBoundary.
- Abstract(参考訳): フィードフォワード完全畳み込みニューラルネットワークは現在、3Dポイントクラウドのセマンティックセグメンテーションを支配している。
その大きな成功にもかかわらず、低レベル層での局所的な情報の喪失に苦しみ、正確なシーンのセグメンテーションと正確なオブジェクト境界のデライン化に重大な挑戦をした。
以前の作業では、後処理によってこの問題に対処するか、ネットワークの機能的エンコーディングを暗黙的に改善するためにオブジェクト境界を共同で学習する。
これらのアプローチは、しばしば元のアーキテクチャに組み込むのが難しい追加モジュールを必要とする。
オブジェクト境界近傍のセグメンテーションを改善するために,境界認識特徴伝播機構を提案する。
このメカニズムは、境界を元の場所に明示的に導くことを目的としたマルチタスク学習フレームワークを活用することで実現される。
1つの共有エンコーダで、我々のネットワーク出力は
(i)境界ローカライゼーション
(ii)対象物の内部を向いた方向の予測、及び
(iii)3つの並列ストリームにおける意味セグメンテーション。
予測された境界と方向は融合し、学習した特徴を伝播させ、セグメンテーションを洗練させる。
我々は,s3disおよびsensaturbanデータセットの様々なベースライン法に対する広範囲な実験を行い,提案手法が境界誤差を低減し一貫した改善をもたらすことを示す。
私たちのコードはhttps://github.com/shenglandu/pushboundaryで利用可能です。
関連論文リスト
- PnPNet: Pull-and-Push Networks for Volumetric Segmentation with Boundary
Confusion [25.12551124399544]
U字型ネットワークは境界形状制約の欠如によりこの課題を効果的に解決できない。
隣接領域の相互作用ダイナミクスを包含することで境界生成を再認識する。
Netの中核成分は、境界領域を絞り込むプッシュとプルの枝を含む。
論文 参考訳(メタデータ) (2023-12-13T17:50:31Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - Temporal Action Localization with Enhanced Instant Discriminability [66.76095239972094]
時間的行動検出(TAD)は、すべての行動境界とその対応するカテゴリを、トリミングされていないビデオで検出することを目的としている。
本稿では,既存の手法による動作境界の不正確な予測を解決するために,TriDetという一段階のフレームワークを提案する。
実験結果から,複数のTADデータセット上でのTriDetの堅牢性と最先端性能が示された。
論文 参考訳(メタデータ) (2023-09-11T16:17:50Z) - Contrastive Boundary Learning for Point Cloud Segmentation [81.7289734276872]
本稿では,ポイントクラウドセグメンテーションのための新しい対照的な境界学習フレームワークを提案する。
実験により、CBLは、異なるベースラインを一貫して改善し、バウンダリにおける魅力的なパフォーマンスを達成するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-10T10:08:09Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - S3Net: 3D LiDAR Sparse Semantic Segmentation Network [1.330528227599978]
S3NetはLiDARポイントクラウドセマンティックセグメンテーションのための新しい畳み込みニューラルネットワークである。
sparse intra-channel attention module (sintraam)とsparse inter-channel attention module (sinteram)で構成されるエンコーダ-デコーダバックボーンを採用する。
論文 参考訳(メタデータ) (2021-03-15T22:15:24Z) - Active Boundary Loss for Semantic Segmentation [58.72057610093194]
本稿では,セマンティックセグメンテーションのための新しいアクティブ境界損失を提案する。
エンド・ツー・エンドのトレーニングにおいて、予測境界とグランド・トゥルース・バウンダリのアライメントを徐々に促進することができる。
実験結果から, アクティブ境界損失によるトレーニングは, 境界Fスコアと平均インターセクションオーバ・ユニオンを効果的に改善できることが示された。
論文 参考訳(メタデータ) (2021-02-04T15:47:54Z) - Boundary-Aware Geometric Encoding for Semantic Segmentation of Point
Clouds [45.270215729464056]
境界情報は2Dイメージセグメンテーションにおいて重要な役割を果たすが、通常は3Dポイントクラウドセグメンテーションでは無視される。
境界点を予測するための境界予測モジュール(BPM)を提案する。
予測された境界に基づいて、境界認識ジオメトリック。
GEMは、幾何学的情報をエンコードし、近隣の差別を伴う特徴を集約するように設計されている。
論文 参考訳(メタデータ) (2021-01-07T05:38:19Z) - JSENet: Joint Semantic Segmentation and Edge Detection Network for 3D
Point Clouds [37.703770427574476]
本稿では,初めて3次元意味的エッジ検出タスクに取り組む。
本稿では,2つのタスクを共同で行う2ストリーム完全畳み込みネットワークを提案する。
特に,両タスクの性能向上のために,領域情報とエッジ情報を明示的に関連付ける共同改良モジュールを設計する。
論文 参考訳(メタデータ) (2020-07-14T08:00:35Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。