論文の概要: Intra-Batch Supervision for Panoptic Segmentation on High-Resolution
Images
- arxiv url: http://arxiv.org/abs/2304.08222v1
- Date: Mon, 17 Apr 2023 12:48:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 15:27:52.839987
- Title: Intra-Batch Supervision for Panoptic Segmentation on High-Resolution
Images
- Title(参考訳): 高分解能画像におけるパンオプティカルセグメンテーションのバッチ内監視
- Authors: Daan de Geus, Gijs Dubbelman
- Abstract要約: 統一パノプティカルセグメンテーション法は、いくつかのデータセットで最先端の結果を達成している。
高分解能データセット上でこれらの結果を達成するために、これらの手法は作物ベースの訓練を適用している。
作物をベースとした訓練は一般的に有利だが、有害な副作用もある。
Intra-Batch Supervision (IBS) を提案する。
- 参考スコア(独自算出の注目度): 4.314956204483074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unified panoptic segmentation methods are achieving state-of-the-art results
on several datasets. To achieve these results on high-resolution datasets,
these methods apply crop-based training. In this work, we find that, although
crop-based training is advantageous in general, it also has a harmful
side-effect. Specifically, it limits the ability of unified networks to
discriminate between large object instances, causing them to make predictions
that are confused between multiple instances. To solve this, we propose
Intra-Batch Supervision (IBS), which improves a network's ability to
discriminate between instances by introducing additional supervision using
multiple images from the same batch. We show that, with our IBS, we
successfully address the confusion problem and consistently improve the
performance of unified networks. For the high-resolution Cityscapes and
Mapillary Vistas datasets, we achieve improvements of up to +2.5 on the
Panoptic Quality for thing classes, and even more considerable gains of up to
+5.8 on both the pixel accuracy and pixel precision, which we identify as
better metrics to capture the confusion problem.
- Abstract(参考訳): 統一パノプティックセグメンテーション法は、いくつかのデータセットで最先端の結果を達成する。
高分解能データセットでこれらの結果を達成するために、これらの方法は作物ベースのトレーニングを適用する。
この研究では、作物ベースの訓練は一般的に有利であるが、有害な副作用もあることがわかった。
具体的には、統一ネットワークが大きなオブジェクトインスタンスを区別する能力を制限するため、複数のインスタンス間で混乱する予測を行うことができる。
そこで本研究では,同一バッチから複数の画像を用いた追加の監視を導入することにより,ネットワークのインスタンス間判別能力を向上させるibs(intra-batch supervisor)を提案する。
ibsでは,混乱問題への対処に成功し,統一ネットワークの性能を一貫して向上させることができた。
高解像度のCityscapesとMapillary Vistasデータセットでは、モノのクラスにおけるPanoptic Qualityの最大2.5倍の改善を実現し、さらにピクセル精度とピクセル精度の両方で最大5.8倍の大幅な向上を実現し、混乱問題を捉えるためのより良い指標として特定します。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Scale-aware Super-resolution Network with Dual Affinity Learning for
Lesion Segmentation from Medical Images [50.76668288066681]
低解像度医用画像から様々な大きさの病変を適応的に分割する,スケールアウェアな超解像ネットワークを提案する。
提案するネットワークは,他の最先端手法と比較して一貫した改善を実現した。
論文 参考訳(メタデータ) (2023-05-30T14:25:55Z) - Improving Pixel-Level Contrastive Learning by Leveraging Exogenous Depth
Information [7.561849435043042]
近年,コントラスト学習(CL)に基づく自己指導型表現学習が注目されている。
本稿では,深度ネットワークを用いたり,利用可能なデータから測定したりすることで得られる深度情報に焦点を当てる。
比較損失におけるこの推定情報を用いることで、結果が改善され、学習された表現がオブジェクトの形状に従うのがよいことを示す。
論文 参考訳(メタデータ) (2022-11-18T11:45:39Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - Semantically Accurate Super-Resolution Generative Adversarial Networks [2.0454959820861727]
セマンティックセグメンテーションの性能を高めるために,新しいアーキテクチャとドメイン固有の特徴損失を提案する。
提案手法は,全ての予測クラスにおいて,知覚的画像品質と定量的セグメンテーションの精度を向上することを示す。
この研究は、画像ベースとタスク固有の損失を共同で検討することにより、両者のパフォーマンスを向上し、空中画像のセマンティック・アウェア・スーパーレゾリューションにおける最先端の進歩を実証する。
論文 参考訳(メタデータ) (2022-05-17T23:05:27Z) - Solar Potential Assessment using Multi-Class Buildings Segmentation from
Aerial Images [3.180674374101366]
出力に余分なクラスを追加することで、インスタンスセグメンテーションタスクに対して完全な畳み込みニューラルネットワークのパワーを利用する。
また,CutMix混合データ拡張とOne-Cycle学習率ポリシが,トレーニングデータに適合するより優れた正規化手法であることを示す。
論文 参考訳(メタデータ) (2021-11-22T18:16:07Z) - Railroad is not a Train: Saliency as Pseudo-pixel Supervision for Weakly
Supervised Semantic Segmentation [16.560870740946275]
EPS (Explicit Pseudo-Pixel Supervision) は2つの弱い監督と組み合わせることでピクセルレベルのフィードバックから学習する。
両情報間の補完関係を完全に活用するための共同学習戦略を考案する。
提案手法は, 正確なオブジェクト境界を求め, 共起画素を破棄することにより, 擬似マスクの品質を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-05-19T07:31:11Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。