論文の概要: Attention Toward Neighbors: A Context Aware Framework for High
Resolution Image Segmentation
- arxiv url: http://arxiv.org/abs/2106.12902v1
- Date: Thu, 24 Jun 2021 10:58:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-26 00:54:01.743831
- Title: Attention Toward Neighbors: A Context Aware Framework for High
Resolution Image Segmentation
- Title(参考訳): 隣人への注意:高解像度画像セグメンテーションのためのコンテキスト認識フレームワーク
- Authors: Fahim Faisal Niloy, M. Ashraful Amin, Amin Ahsan Ali, AKM Mahbubur
Rahman
- Abstract要約: 本稿では,隣接するパッチからコンテキスト情報を取り入れ,特定のパッチをセグメント化する新しいフレームワークを提案する。
これにより、セグメンテーションネットワークは、より大きな機能マップを必要とせずに、より広い視野でターゲットパッチを見ることができる。
- 参考スコア(独自算出の注目度): 2.9210447295585724
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-resolution image segmentation remains challenging and error-prone due to
the enormous size of intermediate feature maps. Conventional methods avoid this
problem by using patch based approaches where each patch is segmented
independently. However, independent patch segmentation induces errors,
particularly at the patch boundary due to the lack of contextual information in
very high-resolution images where the patch size is much smaller compared to
the full image. To overcome these limitations, in this paper, we propose a
novel framework to segment a particular patch by incorporating contextual
information from its neighboring patches. This allows the segmentation network
to see the target patch with a wider field of view without the need of larger
feature maps. Comparative analysis from a number of experiments shows that our
proposed framework is able to segment high resolution images with significantly
improved mean Intersection over Union and overall accuracy.
- Abstract(参考訳): 高分解能画像分割は、中間的特徴マップの大きさのため、依然として困難で誤りやすい。
従来の方法では、各パッチが独立にセグメンテーションされるパッチベースのアプローチを使用することで、この問題を回避する。
しかしながら、独立したパッチ分割は、特にパッチ境界において、パッチサイズがフルイメージよりもずっと小さい、非常に高解像度な画像におけるコンテキスト情報の欠如によるエラーを誘発する。
本稿では,これらの制約を克服するために,隣接するパッチからコンテキスト情報を組み込んで特定のパッチを分割する新しいフレームワークを提案する。
これにより、セグメンテーションネットワークは、より大きな機能マップを必要とせずに、より広い視野でターゲットパッチを見ることができる。
いくつかの実験から比較分析したところ,提案するフレームワークは高解像度画像の分割が可能であり,平均分割と全体的な精度が大幅に向上した。
関連論文リスト
- Separate and Conquer: Decoupling Co-occurrence via Decomposition and Representation for Weakly Supervised Semantic Segmentation [14.419786126791369]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、高密度アノテーションなしでセマンティクスタスクを実現することを目的としている。
共起問題は広く存在し、WSSSにおけるオブジェクトの誤活性化につながる。
画像空間と特徴空間の次元からこの問題に対処する'分離・コンカ'スキームSeCoを考案する。
論文 参考訳(メタデータ) (2024-02-28T16:43:27Z) - DBAT: Dynamic Backward Attention Transformer for Material Segmentation
with Cross-Resolution Patches [8.812837829361923]
クロスレゾリューション特徴を集約する動的後方アテンション変換器(DBAT)を提案する。
実験の結果,DBATの精度は86.85%であり,最先端のリアルタイムモデルの中では最高の性能であることがわかった。
さらに,提案モデルが他の手法よりも優れた材料関連特徴を抽出できることを示すため,セマンティックなラベルにアライメントし,ネットワーク分割を行う。
論文 参考訳(メタデータ) (2023-05-06T03:47:20Z) - High-Quality Entity Segmentation [110.55724145851725]
CropFormerは高解像度画像におけるインスタンスレベルのセグメンテーションの難易度に対処するために設計されている。
よりきめ細かい画像とフルイメージを提供する高解像度の画像作物を融合することで、マスク予測を改善する。
CropFormerでは、難易度の高いエンティティセグメンテーションタスクで1.9ドルという大きなAP利益を達成しています。
論文 参考訳(メタデータ) (2022-11-10T18:58:22Z) - Image-Specific Information Suppression and Implicit Local Alignment for
Text-based Person Search [61.24539128142504]
テキストベースの人物検索(TBPS)は,問合せテキストが与えられた画像ギャラリーから同一の身元で歩行者画像を検索することを目的とした課題である。
既存の手法の多くは、モダリティ間の微粒な対応をモデル化するために、明示的に生成された局所的な部分に依存している。
TBPSのためのマルチレベルアライメントネットワーク(MANet)を提案する。
論文 参考訳(メタデータ) (2022-08-30T16:14:18Z) - HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。
入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。
このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文 参考訳(メタデータ) (2022-03-19T05:09:34Z) - Context-aware Padding for Semantic Segmentation [82.37483350347559]
画像の拡張のためのコンテキスト認識(CA)パディング手法を提案する。
ResNetベースのセグメンテーションモデルでは、コンテキスト認識パディングを用いることで、従来のゼロパディングよりも高い平均断面積を達成できる。
論文 参考訳(メタデータ) (2021-09-16T10:33:21Z) - From Contexts to Locality: Ultra-high Resolution Image Segmentation via
Locality-aware Contextual Correlation [43.70432772819461]
広範に使われている高解像度画像分割パイプラインを革新する。
超高解像度画像を局所分割のための正規パッチに分割し、局所的な結果を高解像度セマンティックマスクにマージする。
論文 参考訳(メタデータ) (2021-09-06T16:26:05Z) - Look Closer to Segment Better: Boundary Patch Refinement for Instance
Segmentation [51.59290734837372]
境界品質を改善するために,概念的にシンプルで効果的な後処理改善フレームワークを提案する。
提案されたBPRフレームワークは、CityscapesベンチマークのMask R-CNNベースラインを大幅に改善する。
BPRフレームワークをPolyTransform + SegFixベースラインに適用することで、Cityscapesのリーダーボードで1位に到達しました。
論文 参考訳(メタデータ) (2021-04-12T07:10:48Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation
via Global and Local Refinement [0.0]
最先端のセマンティックセグメンテーション手法は、固定解像度範囲内の画像にのみ訓練された。
本稿では,高分解能トレーニングデータを用いることなく,高分解能セグメンテーション問題に対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T01:38:03Z) - Multi-Scale Superpatch Matching using Dual Superpixel Descriptors [0.6875312133832078]
スーパーピクセルへの過剰セグメンテーションは、高速な高密度画像処理を可能にする、非常に効果的な次元削減戦略である。
標準的な階層的多重解像度スキームと比較して、画像分解の固有の不規則性は問題である。
本稿では,新しいスーパーピクセル近傍ディスクリプタであるデュアルスーパーパッチを紹介する。
論文 参考訳(メタデータ) (2020-03-09T22:04:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。