論文の概要: A Robust Morphological Approach for Semantic Segmentation of Very High
Resolution Images
- arxiv url: http://arxiv.org/abs/2208.01254v1
- Date: Tue, 2 Aug 2022 05:25:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:13:25.150178
- Title: A Robust Morphological Approach for Semantic Segmentation of Very High
Resolution Images
- Title(参考訳): 超高解像度画像のセマンティックセグメンテーションに対するロバストな形態的アプローチ
- Authors: Siddharth Saravanan, Aditya Challa, Sravan Danda
- Abstract要約: 既存のセマンティックセグメンテーションアルゴリズムを高解像度画像にシームレスに拡張する堅牢なパイプラインを開発する。
提案手法では,高解像度画像の真理アノテーションは不要である。
提案手法により得られたセマンティックセグメンテーションの結果が,高解像度画像上の既存の最先端アルゴリズムに勝っていることを示す。
- 参考スコア(独自算出の注目度): 1.7434507809930744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: State-of-the-art methods for semantic segmentation of images involve
computationally intensive neural network architectures. Most of these methods
are not adaptable to high-resolution image segmentation due to memory and other
computational issues. Typical approaches in literature involve design of neural
network architectures that can fuse global information from low-resolution
images and local information from the high-resolution counterparts. However,
architectures designed for processing high resolution images are unnecessarily
complex and involve a lot of hyper parameters that can be difficult to tune.
Also, most of these architectures require ground truth annotations of the high
resolution images to train, which can be hard to obtain. In this article, we
develop a robust pipeline based on mathematical morphological (MM) operators
that can seamlessly extend any existing semantic segmentation algorithm to high
resolution images. Our method does not require the ground truth annotations of
the high resolution images. It is based on efficiently utilizing information
from the low-resolution counterparts, and gradient information on the
high-resolution images. We obtain high quality seeds from the inferred labels
on low-resolution images using traditional morphological operators and
propagate seed labels using a random walker to refine the semantic labels at
the boundaries. We show that the semantic segmentation results obtained by our
method beat the existing state-of-the-art algorithms on high-resolution images.
We empirically prove the robustness of our approach to the hyper parameters
used in our pipeline. Further, we characterize some necessary conditions under
which our pipeline is applicable and provide an in-depth analysis of the
proposed approach.
- Abstract(参考訳): 画像のセマンティックセグメンテーションのための最先端の手法には、計算集約型ニューラルネットワークアーキテクチャが含まれる。
これらの手法の多くは、メモリや他の計算問題による高解像度画像分割には適応できない。
文学における典型的なアプローチは、低解像度画像からグローバル情報と高解像度画像からのローカル情報とを融合できるニューラルネットワークアーキテクチャの設計である。
しかし、高解像度画像を処理するために設計されたアーキテクチャは、必要以上に複雑であり、調整が難しい多くのハイパーパラメータが伴う。
また、これらのアーキテクチャのほとんどは、高解像度画像の基底真理アノテーションを必要とするため、入手は困難である。
本稿では,既存のセマンティクスセグメンテーションアルゴリズムを高分解能画像にシームレスに拡張可能な,数学的形態的(mm)演算子に基づくロバストパイプラインを開発した。
提案手法では,高解像度画像の真理アノテーションは不要である。
低解像度画像からの情報を効率よく利用し、高解像度画像の勾配情報を利用する。
従来の形態的演算子を用いて低解像度画像上の推論ラベルから高品質な種子を取得し、ランダムウォーカーを用いて種子ラベルを伝播させ、境界線のセマンティックラベルを洗練させる。
本手法により得られた意味セグメンテーションの結果は,高分解能画像上で既存の最先端アルゴリズムを上回った。
パイプラインで使用されるハイパーパラメータに対するアプローチの堅牢性を実証的に証明します。
さらに,パイプラインが適用可能ないくつかの必要条件を特徴付けるとともに,提案手法の詳細な分析を行う。
関連論文リスト
- High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
SDモデルに先立って、頑健な一般化機能とリッチで多目的な画像表現を活用することにより、高忠実で詳細な生成を保ちながら、推論時間を著しく短縮する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-10-14T02:49:23Z) - On the Effect of Image Resolution on Semantic Segmentation [27.115235051091663]
本研究では,高分解能セグメンテーションを直接生成できるモデルが,より複雑なシステムの性能と一致することを示す。
提案手法は,ボトムアップ情報伝搬手法を様々なスケールで活用する。
先進的なセマンティックセグメンテーションデータセットを用いて,本手法を厳格に検証した。
論文 参考訳(メタデータ) (2024-02-08T04:21:30Z) - Memory-Constrained Semantic Segmentation for Ultra-High Resolution UAV
Imagery [35.96063342025938]
本稿では,超高解像度UAV画像の高効率・高効率セグメンテーションを実現するための複雑な課題について検討する。
本稿では、ローカルパッチ以外のコンテキストにアクセスすることなく、ローカル推論のためのGPUメモリ効率が高く効果的なフレームワークを提案する。
基礎となる高解像度情報の潜在的な意味バイアスを補正するために,効率的なメモリベースインタラクション方式を提案する。
論文 参考訳(メタデータ) (2023-10-07T07:44:59Z) - Super-Resolving Face Image by Facial Parsing Information [52.1267613768555]
顔超解像は、低解像度の顔画像を対応する高解像度の画像に変換する技術である。
我々は,低解像度の顔画像から先行する顔を抽出する,新しい解析マップ付き顔超解像ネットワークを構築した。
高解像度特徴はより正確な空間情報を含み、低解像度特徴は強い文脈情報を提供する。
論文 参考訳(メタデータ) (2023-04-06T08:19:03Z) - Semantic Encoder Guided Generative Adversarial Face Ultra-Resolution
Network [15.102899995465041]
本稿では,セマンティックガイド付き生成逆顔超解像ネットワーク(SEGA-FURN)を提案する。
提案するネットワークは, 組込みセマンティクスを捕捉し, 対数学習を誘導する新しいセマンティクスエンコーダと, Residual in Internal Block (RIDB) という階層型アーキテクチャを用いた新しいジェネレータから構成される。
大規模顔データを用いた実験により,提案手法は優れた超解像結果が得られ,定性比較と定量的比較の両面で他の最先端手法よりも優れることが示された。
論文 参考訳(メタデータ) (2022-11-18T23:16:57Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Boundary Corrected Multi-scale Fusion Network for Real-time Semantic
Segmentation [15.879949436633021]
既存のセマンティックセグメンテーション法は高い精度を達成するために高解像度の入力に依存しており、推論時間の要件を満たしていない。
設計した低分解能多スケール核融合モジュールを用いて意味情報を抽出する境界補正多スケール核融合ネットワークを提案する。
本手法は,リアルタイムセマンティックセグメンテーションの精度と速度の最先端バランスを実現する。
論文 参考訳(メタデータ) (2022-03-01T13:31:01Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation
via Global and Local Refinement [0.0]
最先端のセマンティックセグメンテーション手法は、固定解像度範囲内の画像にのみ訓練された。
本稿では,高分解能トレーニングデータを用いることなく,高分解能セグメンテーション問題に対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T01:38:03Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。