論文の概要: Learning Statistical Texture for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2103.04133v1
- Date: Sat, 6 Mar 2021 15:05:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:41:38.169193
- Title: Learning Statistical Texture for Semantic Segmentation
- Title(参考訳): 意味セグメンテーションのための統計的テクスチャの学習
- Authors: Lanyun Zhu, Deyi Ji, Shiping Zhu, Weihao Gan, Wei Wu, Junjie Yan
- Abstract要約: セマンティックセグメンテーションのための新しい統計テクスチャ学習ネットワーク(STLNet)を提案する。
STLNetは、初めて低レベルの情報の分布を分析し、それらをタスクに効率的に活用する。
1)テクスチャ関連情報を捕捉し,テクスチャの詳細を強化するためのテクスチャエンハンスモジュール(TEM),(2)ピラミッドテクスチャ特徴抽出モジュール(PTFEM)の2つのモジュールを導入し,複数のスケールから統計的テクスチャ特徴を効果的に抽出する。
- 参考スコア(独自算出の注目度): 53.7443670431132
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing semantic segmentation works mainly focus on learning the contextual
information in high-level semantic features with CNNs. In order to maintain a
precise boundary, low-level texture features are directly skip-connected into
the deeper layers. Nevertheless, texture features are not only about local
structure, but also include global statistical knowledge of the input image. In
this paper, we fully take advantages of the low-level texture features and
propose a novel Statistical Texture Learning Network (STLNet) for semantic
segmentation. For the first time, STLNet analyzes the distribution of low level
information and efficiently utilizes them for the task. Specifically, a novel
Quantization and Counting Operator (QCO) is designed to describe the texture
information in a statistical manner. Based on QCO, two modules are introduced:
(1) Texture Enhance Module (TEM), to capture texture-related information and
enhance the texture details; (2) Pyramid Texture Feature Extraction Module
(PTFEM), to effectively extract the statistical texture features from multiple
scales. Through extensive experiments, we show that the proposed STLNet
achieves state-of-the-art performance on three semantic segmentation
benchmarks: Cityscapes, PASCAL Context and ADE20K.
- Abstract(参考訳): 既存のセマンティクスセグメンテーションは、主にcnnでハイレベルセマンティクス機能でコンテキスト情報を学ぶことに焦点を当てている。
正確な境界を維持するために、低レベルのテクスチャ機能は、深い層に直接スキップ接続される。
それにもかかわらず、テクスチャの特徴は、ローカル構造だけでなく、入力画像のグローバルな統計的知識も含んでいます。
本稿では,低レベルのテクスチャ機能を最大限に活用し,セマンティックセグメンテーションのための統計的テクスチャ学習ネットワーク(STLNet)を提案する。
STLNetは、初めて低レベルの情報の分布を分析し、それらをタスクに効率的に活用する。
具体的には、QCO(Quantization and Counting Operator)が統計的にテクスチャ情報を記述するように設計されている。
1)テクスチャ関連情報を捕捉し,テクスチャの詳細を強化するためのテクスチャエンハンスモジュール(TEM),(2)ピラミッドテクスチャ特徴抽出モジュール(PTFEM)の2つのモジュールを導入し,複数のスケールから統計的テクスチャ特徴を効果的に抽出する。
STLNetは3つのセマンティックセグメンテーションベンチマーク(Cityscapes, PASCAL Context, ADE20K)で最先端のパフォーマンスを実現する。
関連論文リスト
- Exploiting Contextual Target Attributes for Target Sentiment
Classification [53.30511968323911]
TSCの既存のPTLMベースモデルは、1)PTLMをコンテキストエンコーダとして採用した微調整ベースモデル、2)テキスト/単語生成タスクに分類タスクを転送するプロンプトベースモデル、の2つのグループに分類される。
我々は,PTLM を TSC に活用する新たな視点として,言語モデリングと文脈的ターゲット属性による明示的ターゲットコンテキスト相互作用の利点を同時に活用する。
論文 参考訳(メタデータ) (2023-12-21T11:45:28Z) - Texture-Semantic Collaboration Network for ORSI Salient Object Detection [13.724588317778753]
ORSI-SODのためのテクスチャ・キューとセマンティック・キューの協調を探索するために,簡潔で効果的なテクスチャ・セマンティック・コラボレーション・ネットワーク(TSCNet)を提案する。
TSCNetは汎用エンコーダ・デコーダ構造に基づいており、TSCM(Texture-Semantic Collaboration Module)を含んでいる。
当社のTSCNetは,14の最先端手法と比較して,競争性能が向上している。
論文 参考訳(メタデータ) (2023-12-06T15:26:38Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - CLIP-Count: Towards Text-Guided Zero-Shot Object Counting [32.07271723717184]
オープン語彙オブジェクトの密度マップをゼロショットで推定する,最初のエンドツーエンドパイプラインであるCLIP-Countを提案する。
テキスト埋め込みを濃密な視覚特徴と整合させるため、我々は、密集した予測のための情報的パッチレベルの視覚表現を学習するために、モデルを誘導するパッチテキストコントラスト損失を導入する。
本手法は,対象物に対する高品質な密度マップを効果的に生成する。
論文 参考訳(メタデータ) (2023-05-12T08:19:39Z) - Structural and Statistical Texture Knowledge Distillation for Semantic
Segmentation [72.67912031720358]
セグメンテーションのための構造的・統計的テクスチャ知識蒸留(SSTKD)フレームワークを提案する。
構造的テクスチャ知識のために,低レベルの特徴を分解するContourlet Decomposition Module (CDM)を導入する。
本稿では, 統計的テクスチャ知識を適応的に抽出し, 強化するDenoized Texture Intensity Equalization Module (DTIEM)を提案する。
論文 参考訳(メタデータ) (2023-05-06T06:01:11Z) - Texture image analysis based on joint of multi directions GLCM and local
ternary patterns [0.0]
テクスチャ機能は、通勤視覚や機械学習問題において、多くの異なるアプリケーションで使用することができる。
2つのテクスチャ記述子、共起行列と局所三元パターンを組み合わせた新しい手法を提案する。
実験の結果,提案手法はいくつかの最先端手法と比較して高い分類率を示すことがわかった。
論文 参考訳(メタデータ) (2022-09-05T09:53:00Z) - Video-Text Pre-training with Learned Regions [59.30893505895156]
Video-Textプレトレーニングは、大規模なビデオテキストペアから転送可能な表現を学ぶことを目的としている。
本研究では,大規模ビデオテキストペアの事前学習において,対象物の構造を考慮に入れたビデオテキスト学習用モジュール「RereaLearner」を提案する。
論文 参考訳(メタデータ) (2021-12-02T13:06:53Z) - CTNet: Context-based Tandem Network for Semantic Segmentation [77.4337867789772]
本研究では,空間コンテキスト情報とチャネルコンテキスト情報とを対話的に探索し,新しいコンテキストベースタンデムネットワーク(CTNet)を提案する。
セマンティックセグメンテーションのための学習表現の性能をさらに向上するため、2つのコンテキストモジュールの結果を適応的に統合する。
論文 参考訳(メタデータ) (2021-04-20T07:33:11Z) - Histogram Layers for Texture Analysis [3.107843027522116]
ニューラルネットワークのための局所的なヒストグラム層を提示する。
本手法と最先端テクスチャ符号化法を比較した。
その結果,提案したヒストグラム層を組み込むことで性能が向上した。
論文 参考訳(メタデータ) (2020-01-01T14:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。