論文の概要: Learning to Downsample for Segmentation of Ultra-High Resolution Images
- arxiv url: http://arxiv.org/abs/2109.11071v1
- Date: Wed, 22 Sep 2021 23:04:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-25 01:20:11.721425
- Title: Learning to Downsample for Segmentation of Ultra-High Resolution Images
- Title(参考訳): 超高解像度画像のセグメンテーションのためのダウンサンプル学習
- Authors: Chen Jin, Ryutaro Tanno, Thomy Mertzanidou, Eleftheria Panagiotaki,
Daniel C. Alexander
- Abstract要約: 空間的に変化するダウンサンプリング戦略とセグメンテーションを併用して学習することで,計算予算に制限のある大きな画像のセグメンテーションにメリットがあることが示される。
本手法は, サンプリング密度を異なる場所に適用することにより, より小さな重要な領域から, より少ない領域からより多くのサンプルを収集する。
2つの公開データセットと1つのローカル高解像度データセットについて、本手法は、より多くの情報を保存するためのサンプリング位置を一貫して学習し、ベースライン法よりもセグメンテーション精度を向上することを示す。
- 参考スコア(独自算出の注目度): 6.432524678252553
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Segmentation of ultra-high resolution images with deep learning is
challenging because of their enormous size, often millions or even billions of
pixels. Typical solutions drastically downsample the image uniformly to meet
memory constraints, implicitly assuming all pixels equally important by
sampling at the same density at all spatial locations. However this assumption
is not true and compromises the performance of deep learning techniques that
have proved powerful on standard-sized images. For example with uniform
downsampling, see green boxed region in Fig.1, the rider and bike do not have
enough corresponding samples while the trees and buildings are oversampled, and
lead to a negative effect on the segmentation prediction from the
low-resolution downsampled image. In this work we show that learning the
spatially varying downsampling strategy jointly with segmentation offers
advantages in segmenting large images with limited computational budget. Fig.1
shows that our method adapts the sampling density over different locations so
that more samples are collected from the small important regions and less from
the others, which in turn leads to better segmentation accuracy. We show on two
public and one local high-resolution datasets that our method consistently
learns sampling locations preserving more information and boosting segmentation
accuracy over baseline methods.
- Abstract(参考訳): 超高解像度画像とディープラーニングのセグメンテーションは、その巨大なサイズ、しばしば数百万から数十億ピクセルのピクセルのために難しい。
典型的な解は、メモリの制約を満たすために画像を一様にサンプリングし、全てのピクセルが同じ密度で同じ密度でサンプリングすることで等しく重要なことを暗黙的に仮定する。
しかし、この仮定は正しくなく、標準サイズの画像で強力であることが証明されたディープラーニング技術のパフォーマンスを損なう。
例えば、一様ダウンサンプリングの場合、図1のグリーンボックス領域を参照すると、ライダーとバイクは、木や建物をオーバーサンプリングしている間に十分なサンプルを持っておらず、低解像度ダウンサンプリング画像からのセグメンテーション予測に悪影響を及ぼす。
本研究では,空間的に変化するダウンサンプリング戦略をセグメンテーションと共同で学習することで,計算予算の制限された大規模画像のセグメンテーションの利点を示す。
図1は, サンプリング密度を異なる地点に適応させることにより, 重要領域が小さく, その他の領域より少ない試料を収集し, セグメント化精度の向上を図示している。
提案手法は2つのパブリックデータセットと1つのローカル高解像度データセットにおいて,より多くの情報を保持するサンプリング位置を一貫して学習し,ベースライン法よりもセグメンテーション精度を高める。
関連論文リスト
- Towards Efficient and Accurate CT Segmentation via Edge-Preserving Probabilistic Downsampling [2.1465347972460367]
限られたリソースやネットワークトレーニングの迅速化を必要とするイメージやラベルのダウンサンプリングは、小さなオブジェクトと薄いバウンダリの損失につながる。
これにより、セグメンテーションネットワークのイメージを正確に解釈し、詳細なラベルを予測する能力が損なわれ、元の解像度での処理と比較して性能が低下する。
エッジ保存型確率ダウンサンプリング(EPD)という新しい手法を提案する。
ローカルウィンドウ内のクラス不確実性を利用してソフトラベルを生成し、ウィンドウサイズがダウンサンプリング係数を規定する。
論文 参考訳(メタデータ) (2024-04-05T10:01:31Z) - On the Effect of Image Resolution on Semantic Segmentation [27.115235051091663]
本研究では,高分解能セグメンテーションを直接生成できるモデルが,より複雑なシステムの性能と一致することを示す。
提案手法は,ボトムアップ情報伝搬手法を様々なスケールで活用する。
先進的なセマンティックセグメンテーションデータセットを用いて,本手法を厳格に検証した。
論文 参考訳(メタデータ) (2024-02-08T04:21:30Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - AutoFocusFormer: Image Segmentation off the Grid [11.257993284839621]
AutoFocusFormer (AFF) は、ローカルアテンション変換器の画像認識バックボーンである。
バランスの取れたクラスタリングモジュールによって促進される新しいポイントベースのローカルアテンションブロックを開発する。
実験の結果、AutoFocusFormer(AFF)は類似サイズのベースラインモデルよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2023-04-24T19:37:23Z) - Towards Effective Image Manipulation Detection with Proposal Contrastive
Learning [61.5469708038966]
本稿では,効果的な画像操作検出のためのコントラスト学習(PCL)を提案する。
我々のPCLは、RGBとノイズビューから2種類のグローバル特徴を抽出し、2ストリームアーキテクチャで構成されている。
我々のPCLは、実際にラベル付けされていないデータに容易に適用でき、手作業によるラベル付けコストを削減し、より一般化可能な機能を促進することができる。
論文 参考訳(メタデータ) (2022-10-16T13:30:13Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - Image-free single-pixel segmentation [3.3808025405314086]
本稿では,画像のない単一画素分割技術について報告する。
この技術は、構造的照明と単画素検出を組み合わせることで、シーンのセグメンテーション情報を効率的にサンプリングし、多重化する。
この画像自由分割技術は、UAVや無人車両など、様々なリソース制限されたプラットフォームに広く応用できると期待する。
論文 参考訳(メタデータ) (2021-08-24T10:06:53Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - Superpixel Segmentation Based on Spatially Constrained Subspace
Clustering [57.76302397774641]
独立意味情報を持つ各代表領域を部分空間とみなし,部分空間クラスタリング問題としてスーパーピクセルセグメンテーションを定式化する。
従来のサブスペースクラスタリングとスーパーピクセルセグメンテーションの簡単な統合は,画素の空間相関のために効果的に機能しないことを示す。
本稿では,空間隣接画素に類似の属性を付加してスーパーピクセルにクラスタリング可能な,凸局所性制約付きサブスペースクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2020-12-11T06:18:36Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。