論文の概要: Coupling Global Context and Local Contents for Weakly-Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2304.09059v1
- Date: Tue, 18 Apr 2023 15:29:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 14:13:11.108414
- Title: Coupling Global Context and Local Contents for Weakly-Supervised
Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのためのグローバルコンテキストとローカルコンテンツの結合
- Authors: Chunyan Wang, Dong Zhang, Liyan Zhang, Jinhui Tang
- Abstract要約: 本稿では,画像レベルのラベル管理のみを備えた単一ステージのWakly-Supervised Semantic(WSSS)モデルを提案する。
textbfWS-FCNは、自己管理型のエンドツーエンドのトレーニング方式である。
textbfWS-FCNはPASCAL VOC 2012とMS COCO 2014で6.5.02%$と6.4.22%$mIoUを達成できる。
- 参考スコア(独自算出の注目度): 54.419401869108846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thanks to the advantages of the friendly annotations and the satisfactory
performance, Weakly-Supervised Semantic Segmentation (WSSS) approaches have
been extensively studied. Recently, the single-stage WSSS was awakened to
alleviate problems of the expensive computational costs and the complicated
training procedures in multi-stage WSSS. However, results of such an immature
model suffer from problems of \emph{background incompleteness} and \emph{object
incompleteness}. We empirically find that they are caused by the insufficiency
of the global object context and the lack of the local regional contents,
respectively. Under these observations, we propose a single-stage WSSS model
with only the image-level class label supervisions, termed as
\textbf{W}eakly-\textbf{S}upervised \textbf{F}eature \textbf{C}oupling
\textbf{N}etwork (\textbf{WS-FCN}), which can capture the multi-scale context
formed from the adjacent feature grids, and encode the fine-grained spatial
information from the low-level features into the high-level ones. Specifically,
a flexible context aggregation module is proposed to capture the global object
context in different granular spaces. Besides, a semantically consistent
feature fusion module is proposed in a bottom-up parameter-learnable fashion to
aggregate the fine-grained local contents. Based on these two modules,
\textbf{WS-FCN} lies in a self-supervised end-to-end training fashion.
Extensive experimental results on the challenging PASCAL VOC 2012 and MS COCO
2014 demonstrate the effectiveness and efficiency of \textbf{WS-FCN}, which can
achieve state-of-the-art results by $65.02\%$ and $64.22\%$ mIoU on PASCAL VOC
2012 \emph{val} set and \emph{test} set, $34.12\%$ mIoU on MS COCO 2014
\emph{val} set, respectively. The code and weight have been released
at:~\href{https://github.com/ChunyanWang1/ws-fcn}{WS-FCN}.
- Abstract(参考訳): フレンドリーなアノテーションの利点と満足なパフォーマンスのおかげで、Wakly-Supervised Semantic Segmentation (WSSS)アプローチは広く研究されている。
近年,高コストな計算コストと多段WSSSの複雑な訓練手順の問題を緩和するために,単段WSSSが導入された。
しかし、そのような未熟なモデルの結果は、 \emph{background incompleteness} と \emph{object incompleteness} の問題に苦しむ。
その結果,グローバルなオブジェクトコンテキストが不十分であること,ローカルなコンテンツ不足が原因であることが実証的に判明した。
これらの観察に基づいて、画像レベルのクラスラベルの監督のみを含むシングルステージwsssモデルを提案する。これは \textbf{w}eakly-\textbf{s}upervised \textbf{f}eature \textbf{c}oupling \textbf{n}etwork (\textbf{ws-fcn}) と呼ばれる。
具体的には、グローバルなオブジェクトコンテキストを異なる粒度空間でキャプチャするために、フレキシブルなコンテキストアグリゲーションモジュールを提案する。
さらに,ボトムアップパラメータ学習可能な方法で意味的に一貫性のある機能融合モジュールを提案し,細粒度局所コンテンツを集約する。
これら2つのモジュールに基づいて、 \textbf{WS-FCN} は自己教師付きエンドツーエンドのトレーニング方式である。
挑戦的なpascal voc 2012 と ms coco 2014 の実験結果は、pascal voc 2012 \emph{val} set と \emph{test} set それぞれ 65.02\%$ と 6,4.22\%$ miou で最先端の結果が得られる \textbf{ws-fcn} の有効性と効率を実証している。
コードとウェイトは:~\href{https://github.com/ChunyanWang1/ws-fcn}{WS-FCN}でリリースされた。
関連論文リスト
- Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。
本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - FLea: Addressing Data Scarcity and Label Skew in Federated Learning via Privacy-preserving Feature Augmentation [15.298650496155508]
フェデレートラーニング(FL)は、ローカルデータを中央サーバに転送することなく、多数のエッジデバイスに分散したデータを活用することによって、モデル開発を可能にする。
既存のFLメソッドは、デバイス間の不足やラベルスキュードデータを扱う際に問題に直面し、結果としてローカルモデルが過度に適合し、ドリフトする。
我々は、以下のキーコンポーネントを組み込んだ textitFLea という先駆的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-04T20:24:09Z) - Submodel Partitioning in Hierarchical Federated Learning: Algorithm
Design and Convergence Analysis [15.311309249848739]
階層学習(FL)は、従来の「星のトポロジー」アーキテクチャに基づく連合学習(FL)よりも有望なスケーラビリティを実証している。
本稿では,IoT(Internet of Things)の独立したサブトレーニングを提案する。
HISTの背景にある主要なアイデアは、モデル計算のグローバルバージョンであり、グローバルモデルを各ラウンドの非結合サブモデルに分割し、異なるセルに分散する。
論文 参考訳(メタデータ) (2023-10-27T04:42:59Z) - Global Relation Modeling and Refinement for Bottom-Up Human Pose
Estimation [4.24515544235173]
ボトムアップヒトポーズ推定のための畳み込みニューラルネットワークを提案する。
我々のモデルは、地域によって異なる粒度に焦点を合わせることができる。
COCO と CrowdPose のデータセットで得られた結果は,多人数ポーズ推定の効率的なフレームワークであることを実証している。
論文 参考訳(メタデータ) (2023-03-27T02:54:08Z) - Disentangled Federated Learning for Tackling Attributes Skew via
Invariant Aggregation and Diversity Transferring [104.19414150171472]
属性は、クライアント間の一貫した最適化方向から、現在の連邦学習(FL)フレームワークを歪めます。
本稿では,ドメイン固有属性とクロス不変属性を2つの補足枝に分離するために,非絡み付きフェデレーション学習(DFL)を提案する。
実験により、DFLはSOTA FL法と比較して高い性能、より良い解釈可能性、より高速な収束率でFLを促進することが確認された。
論文 参考訳(メタデータ) (2022-06-14T13:12:12Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。