論文の概要: On the Effect of Image Resolution on Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2402.05398v1
- Date: Thu, 8 Feb 2024 04:21:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 16:32:19.891182
- Title: On the Effect of Image Resolution on Semantic Segmentation
- Title(参考訳): 画像分解能がセマンティックセグメンテーションに及ぼす影響について
- Authors: Ritambhara Singh, Abhishek Jain, Pietro Perona, Shivani Agarwal,
Junfeng Yang
- Abstract要約: 本研究では,高分解能セグメンテーションを直接生成できるモデルが,より複雑なシステムの性能と一致することを示す。
提案手法は,ボトムアップ情報伝搬手法を様々なスケールで活用する。
先進的なセマンティックセグメンテーションデータセットを用いて,本手法を厳格に検証した。
- 参考スコア(独自算出の注目度): 27.115235051091663
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: High-resolution semantic segmentation requires substantial computational
resources. Traditional approaches in the field typically downscale the input
images before processing and then upscale the low-resolution outputs back to
their original dimensions. While this strategy effectively identifies broad
regions, it often misses finer details. In this study, we demonstrate that a
streamlined model capable of directly producing high-resolution segmentations
can match the performance of more complex systems that generate
lower-resolution results. By simplifying the network architecture, we enable
the processing of images at their native resolution. Our approach leverages a
bottom-up information propagation technique across various scales, which we
have empirically shown to enhance segmentation accuracy. We have rigorously
tested our method using leading-edge semantic segmentation datasets.
Specifically, for the Cityscapes dataset, we further boost accuracy by applying
the Noisy Student Training technique.
- Abstract(参考訳): 高分解能セマンティクスセグメンテーションは、かなりの計算資源を必要とする。
この分野における伝統的なアプローチは、通常、処理する前に入力画像をスケールダウンし、低解像度出力を元の次元に戻します。
この戦略は広い地域を効果的に特定するが、しばしば細部を見逃す。
本研究では,高分解能セグメンテーションを直接生成できる流線型モデルが,低分解能結果を生成するより複雑なシステムの性能に適合できることを実証する。
ネットワークアーキテクチャをシンプルにすることで、画像のネイティブ解像度での処理を可能にする。
本手法は,様々なスケールでボトムアップ情報伝達手法を活用し,セグメンテーション精度の向上を実証的に示した。
先行エッジセマンティクスセグメンテーションデータセットを用いて,本手法を厳密にテストした。
特に,Cityscapesデータセットでは,ノイズのある学生訓練手法を適用して精度をさらに向上する。
関連論文リスト
- High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
SDモデルに先立って、頑健な一般化機能とリッチで多目的な画像表現を活用することにより、高忠実で詳細な生成を保ちながら、推論時間を著しく短縮する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-10-14T02:49:23Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - A Robust Morphological Approach for Semantic Segmentation of Very High
Resolution Images [2.2230089845369085]
既存のセマンティックセグメンテーションアルゴリズムを高解像度画像にシームレスに拡張する堅牢なパイプラインを開発する。
提案手法では,高解像度画像の真理アノテーションは不要である。
提案手法により得られたセマンティックセグメンテーションの結果が,高解像度画像上の既存の最先端アルゴリズムに勝っていることを示す。
論文 参考訳(メタデータ) (2022-08-02T05:25:35Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Semantically Accurate Super-Resolution Generative Adversarial Networks [2.0454959820861727]
セマンティックセグメンテーションの性能を高めるために,新しいアーキテクチャとドメイン固有の特徴損失を提案する。
提案手法は,全ての予測クラスにおいて,知覚的画像品質と定量的セグメンテーションの精度を向上することを示す。
この研究は、画像ベースとタスク固有の損失を共同で検討することにより、両者のパフォーマンスを向上し、空中画像のセマンティック・アウェア・スーパーレゾリューションにおける最先端の進歩を実証する。
論文 参考訳(メタデータ) (2022-05-17T23:05:27Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。
提案手法は画像分割精細化において高速かつ効果的である。
論文 参考訳(メタデータ) (2021-11-29T11:53:06Z) - Learning to Downsample for Segmentation of Ultra-High Resolution Images [6.432524678252553]
空間的に変化するダウンサンプリング戦略とセグメンテーションを併用して学習することで,計算予算に制限のある大きな画像のセグメンテーションにメリットがあることが示される。
本手法は, サンプリング密度を異なる場所に適用することにより, より小さな重要な領域から, より少ない領域からより多くのサンプルを収集する。
2つの公開データセットと1つのローカル高解像度データセットについて、本手法は、より多くの情報を保存するためのサンプリング位置を一貫して学習し、ベースライン法よりもセグメンテーション精度を向上することを示す。
論文 参考訳(メタデータ) (2021-09-22T23:04:59Z) - A Novel Upsampling and Context Convolution for Image Semantic
Segmentation [0.966840768820136]
最近のセマンティックセグメンテーションの方法は、しばしば深い畳み込みニューラルネットワークを用いたエンコーダデコーダ構造を採用している。
ネットワーク内の画像の空間情報を効率的に保存するために,ガイドフィルタに基づく高密度アップサンプリング畳み込み法を提案する。
ADE20KとPascal-Contextのベンチマークデータセットでは,それぞれ82.86%,81.62%の画素精度を記録した。
論文 参考訳(メタデータ) (2021-03-20T06:16:42Z) - CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation
via Global and Local Refinement [0.0]
最先端のセマンティックセグメンテーション手法は、固定解像度範囲内の画像にのみ訓練された。
本稿では,高分解能トレーニングデータを用いることなく,高分解能セグメンテーション問題に対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T01:38:03Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。