論文の概要: Progressive Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2104.03778v1
- Date: Thu, 8 Apr 2021 13:59:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 18:59:54.944918
- Title: Progressive Semantic Segmentation
- Title(参考訳): 漸進的意味セグメンテーション
- Authors: Chuong Huynh, Anh Tran, Khoa Luu, Minh Hoai
- Abstract要約: この研究の目的は、GPUメモリの使用をオーバーロードしたり、出力セグメンテーションマップの細部をなくすことなく、高解像度画像を分割することである。
我々は、複数の倍率レベルで画像を見て局所的な曖昧さを解消するマルチスケールフレームワークMagNetを提案する。
都市ビュー、空中シーン、医療画像の高解像度データセットによる実験では、MagNetは最先端の手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 24.723919949029558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The objective of this work is to segment high-resolution images without
overloading GPU memory usage or losing the fine details in the output
segmentation map. The memory constraint means that we must either downsample
the big image or divide the image into local patches for separate processing.
However, the former approach would lose the fine details, while the latter can
be ambiguous due to the lack of a global picture. In this work, we present
MagNet, a multi-scale framework that resolves local ambiguity by looking at the
image at multiple magnification levels. MagNet has multiple processing stages,
where each stage corresponds to a magnification level, and the output of one
stage is fed into the next stage for coarse-to-fine information propagation.
Each stage analyzes the image at a higher resolution than the previous stage,
recovering the previously lost details due to the lossy downsampling step, and
the segmentation output is progressively refined through the processing stages.
Experiments on three high-resolution datasets of urban views, aerial scenes,
and medical images show that MagNet consistently outperforms the
state-of-the-art methods by a significant margin.
- Abstract(参考訳): この研究の目的は、GPUメモリの使用をオーバーロードしたり、出力セグメンテーションマップの細部をなくすことなく、高解像度画像を分割することである。
メモリ制約は、大きなイメージを縮小するか、イメージを別の処理のためにローカルパッチに分割する必要があることを意味する。
しかし、前者のアプローチでは細部が失われるが、後者はグローバルなイメージが欠如しているため曖昧である可能性がある。
本稿では,複数の倍率レベルで画像を見ることで局所的な曖昧さを解消するマルチスケールフレームワークMagNetを提案する。
マグネットは、各段が拡大レベルに対応する複数の処理段階を有し、1段の出力が次の段に供給され、粗い情報伝達が行われる。
各ステージは、前段よりも高分解能で画像を解析し、損失の少ないダウンサンプリングステップにより予め失われた詳細を回収し、処理段階を通じてセグメンテーション出力を段階的に洗練する。
都市ビュー、空中シーン、医療画像の高解像度データセットによる実験では、MagNetは最先端の手法を著しく上回っている。
関連論文リスト
- Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization [4.8454936010479335]
本稿では,画像フォージェリーローカライゼーションのための多視点Pixel-wise Contrastive Algorithm (MPC)を提案する。
具体的には、まず、教師付きコントラスト損失を伴うバックボーンネットワークを事前訓練する。
次に、クロスエントロピー損失を用いてローカライゼーションヘッドを微調整し、ピクセルローカライザを改良する。
論文 参考訳(メタデータ) (2024-06-19T13:51:52Z) - On the Effect of Image Resolution on Semantic Segmentation [27.115235051091663]
本研究では,高分解能セグメンテーションを直接生成できるモデルが,より複雑なシステムの性能と一致することを示す。
提案手法は,ボトムアップ情報伝搬手法を様々なスケールで活用する。
先進的なセマンティックセグメンテーションデータセットを用いて,本手法を厳格に検証した。
論文 参考訳(メタデータ) (2024-02-08T04:21:30Z) - Take a Prior from Other Tasks for Severe Blur Removal [52.380201909782684]
知識蒸留に基づくクロスレベル特徴学習戦略
多レベルアグリゲーションとセマンティックアテンション変換によるセマンティック事前埋め込み層を効果的に統合する。
GoProやRealBlurのデータセットのような、自然な画像劣化ベンチマークと実世界の画像の実験は、我々の方法の有効性と能力を実証している。
論文 参考訳(メタデータ) (2023-02-14T08:30:51Z) - Fitting Segmentation Networks on Varying Image Resolutions using
Splatting [1.3792537518004493]
入力データの解像度ミスマッチを自動的に処理するスプレート層を提案する。
splat演算子が再サンプリング演算子の随伴であるので、平均空間予測をネイティブラベル空間に引き戻すことができる。
このモデルは、前処理ステップとして再サンプリングするよりもセグメンテーション結果を改善する。
論文 参考訳(メタデータ) (2022-06-13T19:53:02Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Semantic Editing On Segmentation Map Via Multi-Expansion Loss [98.1131339357174]
本稿では,セグメンテーションマップのセグメンテーションの精度向上を目的とした。
本稿では,新しいMulti-Expansion(MEx)損失を利用したセグメンテーションマップのセグメンテーション編集のためのMExGANを提案する。
セグメンテーションマップのセグメンテーション編集と自然画像のインペインティングの実験は、4つのデータセットで競合する結果を示した。
論文 参考訳(メタデータ) (2020-10-16T03:12:26Z) - CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation
via Global and Local Refinement [0.0]
最先端のセマンティックセグメンテーション手法は、固定解像度範囲内の画像にのみ訓練された。
本稿では,高分解能トレーニングデータを用いることなく,高分解能セグメンテーション問題に対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T01:38:03Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。