論文の概要: Region Rebalance for Long-Tailed Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2204.01969v1
- Date: Tue, 5 Apr 2022 03:47:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 13:34:17.717959
- Title: Region Rebalance for Long-Tailed Semantic Segmentation
- Title(参考訳): 長尾意味セグメンテーションにおける領域再バランス
- Authors: Jiequan Cui, Yuhui Yuan, Zhisheng Zhong, Zhuotao Tian, Han Hu, Stephen
Lin, Jiaya Jia
- Abstract要約: まず、ピクセル再バランスによってこの問題に対処する主な課題を調査し、特定する。
そして,本分析に基づいて,単純かつ効果的な領域再バランス方式を導出する。
提案された領域再均衡スキームでは、最先端のBEiTはADE20K val集合上のmIoUで+0.7%上昇する。
- 参考スコア(独自算出の注目度): 89.84860341946283
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we study the problem of class imbalance in semantic
segmentation. We first investigate and identify the main challenges of
addressing this issue through pixel rebalance. Then a simple and yet effective
region rebalance scheme is derived based on our analysis. In our solution,
pixel features belonging to the same class are grouped into region features,
and a rebalanced region classifier is applied via an auxiliary region rebalance
branch during training. To verify the flexibility and effectiveness of our
method, we apply the region rebalance module into various semantic segmentation
methods, such as Deeplabv3+, OCRNet, and Swin. Our strategy achieves consistent
improvement on the challenging ADE20K and COCO-Stuff benchmark. In particular,
with the proposed region rebalance scheme, state-of-the-art BEiT receives +0.7%
gain in terms of mIoU on the ADE20K val set.
- Abstract(参考訳): 本稿では,セマンティックセグメンテーションにおけるクラス不均衡の問題について検討する。
まず,この問題に対処する主な課題をピクセルリバランスによって調査し,特定する。
そして,本解析に基づいて,単純かつ効果的な領域再バランス方式を導出する。
提案手法では,同一クラスに属する画素特徴を領域特徴に分類し,訓練中に補助領域再バランスブランチを介して再バランス領域分類器を適用する。
本手法の柔軟性と有効性を検証するため,Deeplabv3+, OCRNet, Swin などのセマンティックセグメンテーション手法に領域再バランスモジュールを適用した。
我々の戦略はADE20KとCOCO-Stuffベンチマークで一貫した改善を実現している。
特に、提案された領域再均衡スキームでは、最先端のBEiTはADE20K val集合上のmIoUで+0.7%上昇する。
関連論文リスト
- Less is More: Fewer Interpretable Region via Submodular Subset Selection [58.01691615408149]
本稿では,上述の画像帰属問題を部分モジュラ部分選択問題として再モデル化する。
我々は、より正確な小さな解釈領域を発見するために、新しい部分モジュラー関数を構築する。
正しく予測されたサンプルに対しては,HSIC-Attributionに対する平均4.9%と2.5%の利得で,Deletion and Insertionスコアを改善した。
論文 参考訳(メタデータ) (2024-02-14T13:30:02Z) - Coupling Global Context and Local Contents for Weakly-Supervised
Semantic Segmentation [54.419401869108846]
Weakly Supervised Semantic (WSSS)モデルを提案する。
グローバルなオブジェクトコンテキストを異なる粒度空間でキャプチャするために,フレキシブルなコンテキストアグリゲーションモジュールを提案する。
局所的な細粒度を集約するために、ボトムアップパラメータ学習可能な方法で意味的に一貫した特徴融合モジュールを提案する。
論文 参考訳(メタデータ) (2023-04-18T15:29:23Z) - Bidirectional Domain Mixup for Domain Adaptive Semantic Segmentation [73.3083304858763]
本稿では,ドメイン適応型セマンティックセグメンテーションタスクにおけるミックスアップの影響を系統的に研究する。
具体的には、ドメインミックスアップをカットとペーストという2ステップで実現します。
フレームワークの主なコンポーネントを実証的に検証するために、広範囲にわたるアブレーション実験を行います。
論文 参考訳(メタデータ) (2023-03-17T05:22:44Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Unsupervised Cross-Modality Domain Adaptation for Vestibular Schwannoma
Segmentation and Koos Grade Prediction based on Semi-Supervised Contrastive
Learning [1.5953825926551457]
クロスモダリティ前庭神経新生(VS)とコチェリーセグメンテーションとKoosグレード予測のための教師なしドメイン適応フレームワーク。
nnU-NetモデルはVSとcochleaセグメンテーションに利用され、半教師付きコントラクティブ学習事前訓練アプローチがモデル性能を改善するために使用される。
平均Diceスコアが0.8394のタスク1では4位,平均平均値が0.3941のタスク2では2位であった。
論文 参考訳(メタデータ) (2022-10-09T13:12:20Z) - Region-level Contrastive and Consistency Learning for Semi-Supervised
Semantic Segmentation [30.1884540364192]
半教師付きセマンティックセグメンテーションのための領域レベルのコントラスト・一貫性学習フレームワーク(RC2L)を提案する。
具体的には、まず、地域マスクコントラスト(RMC)損失と地域特徴コントラスト(RFC)損失を、地域レベルのコントラスト特性を達成するために提案する。
提案する領域レベルのコントラストと一貫性の規則化に基づいて,半教師付きセマンティックセグメンテーションのための領域レベルのコントラストと一貫性の学習フレームワーク(RC2L)を開発する。
論文 参考訳(メタデータ) (2022-04-28T07:22:47Z) - Posterior Re-calibration for Imbalanced Datasets [33.379680556475314]
トレーニングラベルの分布が極めて不均衡な場合、ニューラルネットワークは性能が良くない。
我々は、KL分割に基づく最適化によって解決できる訓練後の事前バランス手法を導出する。
6つの異なるデータセットと5つの異なるアーキテクチャで得られた結果は、芸術的正確性を示している。
論文 参考訳(メタデータ) (2020-10-22T15:57:14Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z) - Reinforced active learning for image segmentation [34.096237671643145]
深部強化学習(RL)に基づく意味的セグメンテーションのための新しいアクティブラーニング戦略を提案する。
エージェントは、ラベルなしデータのプールからラベル付けされる小さな情報領域(画像全体とは対照的に)のサブセットを選択するポリシーを学ぶ。
本手法では, 意味的セグメンテーション問題の大規模性質に適応して, 能動的学習のための深部Q-network (DQN) の定式化を新たに提案する。
論文 参考訳(メタデータ) (2020-02-16T14:03:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。