論文の概要: Towards Bounding-Box Free Panoptic Segmentation
- arxiv url: http://arxiv.org/abs/2002.07705v3
- Date: Mon, 27 Jul 2020 17:48:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 20:26:05.159995
- Title: Towards Bounding-Box Free Panoptic Segmentation
- Title(参考訳): バウンディングボックスフリーパンオプティカルセグメンテーションに向けて
- Authors: Ujwal Bonde and Pablo F. Alcantarilla and Stefan Leutenegger
- Abstract要約: パン光学セグメンテーションのための新しいBunding-Box Free Network (BBFNet) を提案する。
BBFNetは、粗い流域レベルを予測し、境界が適切に定義された大きなインスタンス候補を検出するためにそれらを使用する。
境界が信頼性の低い小さなインスタンスでは、BBFNetはHoughの投票によってインスタンス中心を予測し、続いて平均シフトによって小さなオブジェクトを確実に検出する。
- 参考スコア(独自算出の注目度): 16.4548904544277
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work we introduce a new Bounding-Box Free Network (BBFNet) for
panoptic segmentation. Panoptic segmentation is an ideal problem for
proposal-free methods as it already requires per-pixel semantic class labels.
We use this observation to exploit class boundaries from off-the-shelf semantic
segmentation networks and refine them to predict instance labels. Towards this
goal BBFNet predicts coarse watershed levels and uses them to detect large
instance candidates where boundaries are well defined. For smaller instances,
whose boundaries are less reliable, BBFNet also predicts instance centers by
means of Hough voting followed by mean-shift to reliably detect small objects.
A novel triplet loss network helps merging fragmented instances while refining
boundary pixels. Our approach is distinct from previous works in panoptic
segmentation that rely on a combination of a semantic segmentation network with
a computationally costly instance segmentation network based on bounding box
proposals, such as Mask R-CNN, to guide the prediction of instance labels using
a Mixture-of-Expert (MoE) approach. We benchmark our proposal-free method on
Cityscapes and Microsoft COCO datasets and show competitive performance with
other MoE based approaches while outperforming existing non-proposal based
methods on the COCO dataset. We show the flexibility of our method using
different semantic segmentation backbones.
- Abstract(参考訳): 本稿では,パンオプティカルセグメンテーションのための新しいバウンディングボックスフリーネットワーク(bbfnet)を提案する。
ピクセルごとのセマンティッククラスラベルを必要とするため、パノプティックセグメンテーションはプロポーザルフリーメソッドにとって理想的な問題である。
この観測は、既製のセマンティックセグメンテーションネットワークからクラス境界を利用して、それらを洗練してインスタンスラベルを予測する。
この目標に向かってBBFNetは、粗い流域レベルを予測し、境界が適切に定義された大きなインスタンス候補を検出するためにそれらを使用する。
境界が信頼性の低い小さなインスタンスの場合、bbfnetはハフ投票によってインスタンス中心を予測し、次いで平均シフトによって小さなオブジェクトを確実に検出する。
新しい三重項損失ネットワークは、境界画素を精錬しながら断片化されたインスタンスをマージするのに役立つ。
提案手法は,Mixture-of-Expert (MoE) アプローチを用いて,意味的セグメンテーションネットワークと,Mask R-CNN などのバウンディングボックス提案に基づく計算コストのかかるインスタンスセグメンテーションネットワークを併用して,インスタンスラベルの予測を導出する,従来のパン光学的セグメンテーションとは異なっている。
我々は,提案手法をcityscapesとmicrosoft cocoデータセットにベンチマークし,既存の非プロポッサルベース手法よりも優れながら,他のmoeベースの手法との競合性能を示す。
異なるセグメンテーションバックボーンを用いて,本手法の柔軟性を示す。
関連論文リスト
- BAISeg: Boundary Assisted Weakly Supervised Instance Segmentation [9.6046915661065]
インスタンスレベルの監視なしにインスタンスレベルのマスクを抽出する方法は、弱教師付きインスタンスセグメンテーション(WSIS)の主な課題である
人気のあるWSIS手法は、画素間関係の学習を通じて変位場(DF)を推定し、インスタンスを識別するためのクラスタリングを実行する。
本稿では,画素レベルのアノテーションでインスタンスセグメンテーションを実現するWSISの新しいパラダイムであるBundary-Assisted Instance(BAISeg)を提案する。
論文 参考訳(メタデータ) (2024-05-27T15:14:09Z) - Label-efficient Segmentation via Affinity Propagation [27.016747627689288]
ラベル効率のよいスパースアノテーションを用いた弱教師付きセグメンテーションは、手間のかかるピクセルワイドラベリングプロセスのコストを削減するために研究の注目を集めている。
親和性モデリングを親和性伝播過程として定式化し、局所的および大域的親和性項を提案して、正確な擬似ラベルを生成する。
計算コストを大幅に削減する効率的なアルゴリズムも開発されている。
論文 参考訳(メタデータ) (2023-10-16T15:54:09Z) - Side Adapter Network for Open-Vocabulary Semantic Segmentation [69.18441687386733]
本稿では,Side Adapter Network (SAN) という,事前学習された視覚言語モデルを用いたオープン語彙セマンティックセマンティックセマンティックセマンティクスのための新しいフレームワークを提案する。
サイドネットワークは凍結したCLIPモデルにアタッチされ、ひとつはマスクの提案を予測し、もうひとつは注意バイアスを予測する。
トレーニング可能なパラメータは最大で18倍,推論速度は19倍に向上した。
論文 参考訳(メタデータ) (2023-02-23T18:58:28Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - Panoptic-PolarNet: Proposal-free LiDAR Point Cloud Panoptic Segmentation [21.296942497092402]
我々は、Panoptic-PolarNetと呼ばれる高速で堅牢なLiDARポイントクラウドパノラマセグメンテーションフレームワークを提示します。
ポーラバードのアイビュー表現を用いて,セマンティックセグメンテーションとクラス非依存のインスタンスクラスタリングの両方を単一推論ネットワークで学習する。
実験の結果,Panoptic-PolarNetは,Semantic KITTIおよびnuScenesデータセットのベースライン手法をほぼリアルタイムな推論速度で上回っていることがわかった。
論文 参考訳(メタデータ) (2021-03-27T18:31:40Z) - SPICE: Semantic Pseudo-labeling for Image Clustering [5.357314252311141]
SPICEはSemantic Pseudo-labeling framework for Image ClustEringである。
自己学習を通じて擬似ラベルを生成し、擬似ラベルベースの分類損失を使用してディープクラスタリングネットワークを訓練する。
本手法は,調整ランドインデックス,正規化相互情報,クラスタリング精度において,現在の最良値を約10%向上させる。
論文 参考訳(メタデータ) (2021-03-17T00:52:27Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Deep Affinity Net: Instance Segmentation via Affinity [48.498706304017674]
Deep Affinity Netは、グラフ分割アルゴリズムCascade-GAECを伴って、効果的なアフィニティベースのアプローチである。
すべてのアフィニティベースのモデルの中で、最高のシングルショット結果と最速のランニングタイムを達成する。
また、リージョンベースのMask R-CNNよりも優れています。
論文 参考訳(メタデータ) (2020-03-15T15:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。