論文の概要: HS3: Learning with Proper Task Complexity in Hierarchically Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2111.02333v1
- Date: Wed, 3 Nov 2021 16:33:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 14:00:49.990599
- Title: HS3: Learning with Proper Task Complexity in Hierarchically Supervised
Semantic Segmentation
- Title(参考訳): hs3:階層的教師付き意味セグメンテーションにおける適切なタスク複雑性を伴う学習
- Authors: Shubhankar Borse, Hong Cai, Yizhe Zhang, Fatih Porikli
- Abstract要約: 本稿では,タスクの複雑さによって意味のある表現を学習するためのセグメンテーションネットワークの中間層を監督するトレーニングスキームである階層的意味論(Hierarchically Supervised Semantic,HS3)を提案する。
提案するHS3-Fuseフレームワークはセグメンテーション予測をさらに改善し、2つの大きなセグメンテーションベンチマークであるNYUD-v2とCityscapesで最先端の結果を得る。
- 参考スコア(独自算出の注目度): 81.87943324048756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While deeply supervised networks are common in recent literature, they
typically impose the same learning objective on all transitional layers despite
their varying representation powers.
In this paper, we propose Hierarchically Supervised Semantic Segmentation
(HS3), a training scheme that supervises intermediate layers in a segmentation
network to learn meaningful representations by varying task complexity. To
enforce a consistent performance vs. complexity trade-off throughout the
network, we derive various sets of class clusters to supervise each
transitional layer of the network. Furthermore, we devise a fusion framework,
HS3-Fuse, to aggregate the hierarchical features generated by these layers,
which can provide rich semantic contexts and further enhance the final
segmentation. Extensive experiments show that our proposed HS3 scheme
considerably outperforms vanilla deep supervision with no added inference cost.
Our proposed HS3-Fuse framework further improves segmentation predictions and
achieves state-of-the-art results on two large segmentation benchmarks: NYUD-v2
and Cityscapes.
- Abstract(参考訳): 近年の文献では、深く監視されたネットワークが一般的であるが、表現力が異なるにもかかわらず、それらは通常、全ての遷移層に同じ学習目標を課す。
本稿では,階層的教師付きセマンティックセグメンテーション(hs3)を提案する。これは,セグメンテーションネットワークの中間層を監督し,タスクの複雑さを変化させて意味のある表現を学習するトレーニングスキームである。
ネットワーク全体にわたる一貫したパフォーマンス対複雑性のトレードオフを実施するため、ネットワークの各遷移層を監督するさまざまなクラスクラスタを導出する。
さらに,これらの層が生成する階層的特徴を集約するために,hs3-fuseという融合フレームワークを考案した。
広範な実験により,提案するhs3スキームは推定コストを増すことなく,バニラ深層監視をかなり上回ることがわかった。
提案するHS3-Fuseフレームワークはセグメンテーション予測をさらに改善し、2つの大きなセグメンテーションベンチマークであるNYUD-v2とCityscapesで最先端の結果を得る。
関連論文リスト
- S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving [12.406655155106424]
そこで本稿では,S3PTによるシーンセマンティクスと構造案内クラスタリングを提案する。
まず、セマンティックな分布一貫したクラスタリングを取り入れて、オートバイや動物のような稀なクラスをよりよく表現できるようにします。
第2に,広い背景領域から歩行者や交通標識などの小さな物体まで,不均衡で多様な物体の大きさを扱うために,一貫した空間クラスタリングを導入する。
第3に,シーンの幾何学的情報に基づいて学習を規則化するための深度誘導空間クラスタリングを提案する。
論文 参考訳(メタデータ) (2024-10-30T15:00:06Z) - Weakly Supervised Semantic Segmentation by Knowledge Graph Inference [11.056545020611397]
本稿では、Wakly Supervised Semantic (WSSS)を強化するグラフ推論に基づくアプローチを提案する。
本研究の目的は,マルチラベル分類とセグメンテーションネットワークの段階を同時に拡張することで,WSSSを全体的改善することである。
PASCAL VOC 2012およびMS-COCOデータセット上でWSSSの最先端性能を達成した。
論文 参考訳(メタデータ) (2023-09-25T11:50:19Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Deep Hierarchical Semantic Segmentation [76.40565872257709]
階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文 参考訳(メタデータ) (2022-03-27T15:47:44Z) - Towards holistic scene understanding: Semantic segmentation and beyond [2.7920304852537536]
この論文は、視覚的なシーン理解に対処し、セグメンテーション性能と一般化、ネットワークのトレーニング効率、全体的理解を高める。
まず,街路シーンの文脈におけるセマンティックセグメンテーションと,各種データセットの組み合わせによるセマンティックセグメンテーションネットワークについて検討する。
第2章では、単一の畳み込みバックボーン上に階層型分類器のフレームワークを設計し、ピクセルラベル付きデータセットの組み合わせでエンドツーエンドにトレーニングする。
第3章では,画素単位の監督に代えて,ボックスレベルとイメージレベルを境界としたトレーニングを行うための弱教師付きアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-16T19:18:11Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。