論文の概要: Boosting Semantic Segmentation with Semantic Boundaries
- arxiv url: http://arxiv.org/abs/2304.09427v1
- Date: Wed, 19 Apr 2023 05:53:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 15:29:22.522364
- Title: Boosting Semantic Segmentation with Semantic Boundaries
- Title(参考訳): セマンティック境界によるセマンティックセグメンテーションの促進
- Authors: Haruya Ishikawa and Yoshimitsu Aoki
- Abstract要約: 本稿ではセグメンテーション性能を高めるモデルに依存しないトレーニングフレームワークであるセマンティック境界条件付きバックボーン(SBCB)フレームワークを提案する。
本研究では,Cityscapesデータセットにおいて,各種のセグメンテーションヘッドとバックボーンを0.5%のIoUで改善することにより,SBCBフレームワークの有効性を示す。
また、このフレームワークをカスタマイズしたバックボーンと新しいビジョントランスフォーマーモデルに適用し、SBCBフレームワークの有効性を示す。
- 参考スコア(独自算出の注目度): 3.8377728124578865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present the Semantic Boundary Conditioned Backbone (SBCB)
framework, a simple yet effective training framework that is model-agnostic and
boosts segmentation performance, especially around the boundaries. Motivated by
the recent development in improving semantic segmentation by incorporating
boundaries as auxiliary tasks, we propose a multi-task framework that uses
semantic boundary detection (SBD) as an auxiliary task. The SBCB framework
utilizes the nature of the SBD task, which is complementary to semantic
segmentation, to improve the backbone of the segmentation head. We apply an SBD
head that exploits the multi-scale features from the backbone, where the model
learns low-level features in the earlier stages, and high-level semantic
understanding in the later stages. This head perfectly complements the common
semantic segmentation architectures where the features from the later stages
are used for classification. We can improve semantic segmentation models
without additional parameters during inference by only conditioning the
backbone. Through extensive evaluations, we show the effectiveness of the SBCB
framework by improving various popular segmentation heads and backbones by 0.5%
~ 3.0% IoU on the Cityscapes dataset and gains 1.6% ~ 4.1% in boundary Fscores.
We also apply this framework on customized backbones and the emerging vision
transformer models and show the effectiveness of the SBCB framework.
- Abstract(参考訳): 本稿では,セマンティック境界条件付きバックボーン(SBCB)フレームワークを提案する。
近年のセマンティクスセグメンテーションの改善において,境界を補助タスクとして組み込むことにより,セマンティクス境界検出(sbd)を補助タスクとして用いるマルチタスクフレームワークを提案する。
SBCBフレームワークは、セグメンテーションヘッドのバックボーンを改善するためにセグメンテーションを補完するSBDタスクの性質を利用する。
バックボーンのマルチスケール機能を利用するSBDヘッドを適用し,モデルが早期の低レベル特徴を学習し,後期の高レベル意味理解を行う。
このヘッドは、後段の特徴が分類に使用される一般的なセマンティックセグメンテーションアーキテクチャを完全に補完する。
バックボーンを条件付けするだけで、推論中に追加パラメータなしでセマンティックセグメンテーションモデルを改善することができる。
本研究では,Cityscapesデータセットにおいて,各種のセグメンテーションヘッドとバックボーンを0.5%~3.0%改善し,境界Fスコアが1.6%~4.1%向上したSBCBフレームワークの有効性を示す。
また、このフレームワークをカスタマイズされたバックボーンと新たなビジョントランスフォーマーモデルに適用し、sbcbフレームワークの有効性を示す。
関連論文リスト
- More than the Sum of Its Parts: Ensembling Backbone Networks for
Few-Shot Segmentation [49.090592800481616]
異なるバックボーンから特徴を融合させることで、よりリッチな視覚的特徴を捉えることができるかどうかを検討する。
Independent Voting と Feature Fusion という2つのアンサンブル手法を提案し,比較する。
当社のアプローチは、ワンショットの学習シナリオに挑戦しても、従来の単一バックボーンPANetを標準ベンチマークで上回ります。
論文 参考訳(メタデータ) (2024-02-09T18:01:15Z) - Multi-Scale Semantic Segmentation with Modified MBConv Blocks [29.026787888644474]
セマンティックセグメンテーションに適したMBConvブロックの新規適応を導入する。
これらの変更を実装することで、Cityscapesのテストおよび検証データセットにおいて、IoU(Intersection over Union)の84.5%と84.0%という印象的な平均値が得られる。
論文 参考訳(メタデータ) (2024-02-07T07:01:08Z) - Panoptic Out-of-Distribution Segmentation [11.388678390784195]
連立画素レベルのセマンティック・イン・ディストリビューションとインスタンス予測を用いたアウト・オブ・ディストリビューション分類のためのパノプティカル・アウト・オブ・ディストリビューションを提案する。
データセット、コード、トレーニングされたモデルをhttp://pods.cs.uni-freiburg.deで公開しています。
論文 参考訳(メタデータ) (2023-10-18T08:38:31Z) - FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation [42.89720785573885]
FreeSegはUnified、Universal、Open-Vocabulary Imageを実現するための汎用フレームワークである。
我々は,FreeSegが3つのセグメンテーションタスクの性能と一般化に新たな成果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-03-30T08:42:49Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - GaitStrip: Gait Recognition via Effective Strip-based Feature
Representations and Multi-Level Framework [34.397404430838286]
本稿では,様々なレベルの歩行情報を抽出するために,GaitStripという名前のストリップベースマルチレベル歩行認識ネットワークを提案する。
具体的には、私たちの高レベルブランチは歩行シーケンスのコンテキストを探求し、低レベルブランチは詳細な姿勢変化に焦点を当てています。
我々のGaitStripは、通常の歩行条件と複雑な歩行条件の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-03-08T09:49:48Z) - PSSNet: Planarity-sensible Semantic Segmentation of Large-scale Urban
Meshes [3.058685580689605]
テクスチャメッシュとして表現された3次元都市シーンを解釈するための,新しいディープラーニングベースのフレームワークを提案する。
我々のフレームワークは2つのステップでセマンティックセグメンテーションを実現する: 計画性に敏感なオーバーセグメンテーションとセマンティックセグメンテーション。
我々のアプローチは、境界品質とIoU(組合間)の平均で最先端の手法より優れています。
論文 参考訳(メタデータ) (2022-02-07T14:16:10Z) - A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained
Vision-language Model [61.58071099082296]
オブジェクト検出やセマンティックセグメンテーションといった、より広範な視覚問題に対して、ゼロショット認識をどのようにうまく機能させるかは定かではない。
本稿では,既訓練の視覚言語モデルであるCLIPを用いて,ゼロショットセマンティックセマンティックセマンティックセマンティクスを構築することを目的とした。
実験結果から, この単純なフレームワークは, 従来の最先端をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-12-29T18:56:18Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - Panoster: End-to-end Panoptic Segmentation of LiDAR Point Clouds [81.12016263972298]
我々は,LiDAR点雲のための提案不要なパノプティックセグメンテーション手法であるパノスターを提案する。
従来のアプローチとは異なり、Panosterでは、インスタンスを識別するための学習ベースのクラスタリングソリューションを組み込んだ、シンプルなフレームワークを提案している。
推論時に、これはクラスに依存しないセグメンテーションとして機能し、パノスターは高速で、精度の点で先行メソッドよりも優れている。
論文 参考訳(メタデータ) (2020-10-28T18:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。