論文の概要: High-Order Paired-ASPP Networks for Semantic Segmenation
- arxiv url: http://arxiv.org/abs/2002.07371v1
- Date: Tue, 18 Feb 2020 04:50:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-30 20:07:59.133629
- Title: High-Order Paired-ASPP Networks for Semantic Segmenation
- Title(参考訳): セマンティックセメンテーションのための高次ペアASPPネットワーク
- Authors: Yu Zhang, Xin Sun, Junyu Dong, Changrui Chen, Yue Shen
- Abstract要約: 現在のセマンティックセグメンテーションモデルは1次統計しか利用していないが、高次統計を探索することはめったにない。
各種特徴量から高次統計量を利用するための高次ペアードASPPネットワークを提案する。
本手法は3つのベンチマークでベルやホイッスルを使わずに競争性能を実現する。
- 参考スコア(独自算出の注目度): 28.16031963284206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current semantic segmentation models only exploit first-order statistics,
while rarely exploring high-order statistics. However, common first-order
statistics are insufficient to support a solid unanimous representation. In
this paper, we propose High-Order Paired-ASPP Network to exploit high-order
statistics from various feature levels. The network first introduces a
High-Order Representation module to extract the contextual high-order
information from all stages of the backbone. They can provide more semantic
clues and discriminative information than the first-order ones. Besides, a
Paired-ASPP module is proposed to embed high-order statistics of the early
stages into the last stage. It can further preserve the boundary-related and
spatial context in the low-level features for final prediction. Our experiments
show that the high-order statistics significantly boost the performance on
confusing objects. Our method achieves competitive performance without bells
and whistles on three benchmarks, i.e, Cityscapes, ADE20K and Pascal-Context
with the mIoU of 81.6%, 45.3% and 52.9%.
- Abstract(参考訳): 現在の意味セグメンテーションモデルは一階の統計のみを利用するが、高階の統計を探索することは滅多にない。
しかし、一般的な一階統計は、一様でない表現をサポートするには不十分である。
本稿では,様々な特徴量から高次統計量を利用する高次ペアードASPPネットワークを提案する。
ネットワークはまず、バックボーンのすべてのステージからコンテキストの高階情報を抽出する高階表現モジュールを導入する。
彼らは一階法よりも意味的な手がかりや識別的な情報を提供できる。
さらに、早期の高次統計を最終段階に組み込むために、Paired-ASPPモジュールが提案されている。
最終予測のために、低レベル特徴における境界関連および空間コンテキストをさらに保存することができる。
我々の実験は、高次統計が混乱するオブジェクトのパフォーマンスを著しく高めていることを示している。
提案手法は,mIoUが81.6%,45.3%,52.9%,Cityscapes,ADE20K,Pascal-Contextの3つのベンチマークにおいて,ベルやホイッスルを使わずに競争性能を実現する。
関連論文リスト
- Statistical signatures of abstraction in deep neural networks [0.0]
我々は、ベンチマークデータセットに基づいてトレーニングされたDeep Belief Network(DBN)において、抽象表現がどのように現れるかを研究する。
表現は最大関連性の原理によって決定される普遍モデルに近づくことを示す。
また、プラスチック度は脳のそれと同じような深さで増加することも示しています。
論文 参考訳(メタデータ) (2024-07-01T14:13:11Z) - HIORE: Leveraging High-order Interactions for Unified Entity Relation
Extraction [85.80317530027212]
本稿では,統合エンティティ関係抽出のための新しい手法であるHIOREを提案する。
重要な洞察は、単語ペア間の複雑な関連を活用することである。
実験の結果,HIOREは従来最高の統一モデルよりも1.11.8 F1ポイント向上した。
論文 参考訳(メタデータ) (2023-05-07T14:57:42Z) - DDP: Diffusion Model for Dense Visual Prediction [71.55770562024782]
本研究では,条件付き拡散パイプラインに基づく高密度視覚予測のための,シンプルで効率的かつ強力なフレームワークを提案する。
DDPと呼ばれるこの手法は、デノナイジング拡散過程を現代の知覚パイプラインに効率的に拡張する。
DDPは、従来の単段階識別法とは対照的に、動的推論や不確実性認識などの魅力的な特性を示す。
論文 参考訳(メタデータ) (2023-03-30T17:26:50Z) - High-level Feature Guided Decoding for Semantic Segmentation [54.424062794490254]
そこで本稿では,アップサンプラーが頑健な結果を得るためのガイダンス(HFG)として,強力な事前学習高レベル機能を提案する。
具体的には、バックボーンの高レベルな機能はクラストークンのトレーニングに使用され、クラストークンはクラス分類のためにアップサンプラーによって再利用される。
HFGの上限を押し上げるために、低解像度の高レベル特徴に対して効率よく効果的に操作できる文脈拡張エンコーダ(CAE)を導入する。
論文 参考訳(メタデータ) (2023-03-15T14:23:07Z) - Dynamic Focus-aware Positional Queries for Semantic Segmentation [94.6834904076914]
本稿では,動的焦点認識型位置情報クエリと呼ばれるセマンティックセグメンテーションのための,シンプルで効果的なクエリ設計を提案する。
我々のフレームワークはSOTAの性能を達成し、ResNet-50、Swin-T、Swin-Bのバックボーンによる1.1%、1.9%、および1.1%の単一スケールmIoUでMask2formerより優れています。
論文 参考訳(メタデータ) (2022-04-04T05:16:41Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Efficient First-Order Contextual Bandits: Prediction, Allocation, and
Triangular Discrimination [82.52105963476703]
統計的学習、オンライン学習、その他における繰り返しのテーマは、低騒音の問題に対してより速い収束率が可能であることである。
1次保証は統計的およびオンライン学習において比較的よく理解されている。
三角識別と呼ばれる対数損失と情報理論量が一階保証を得る上で基本的な役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-07-05T19:20:34Z) - Prior-Enhanced Few-Shot Segmentation with Meta-Prototypes [32.898636584823215]
Few-shot segmentation (FSS) のパフォーマンスは、エピソードトレーニングとクラスワイドプロトタイプの導入によって広範囲に向上している。
本稿では,これらの制約に対処するために,メタプロトタイプを用いた事前拡張ネットワークを提案する。
PASCAL-5i$とCOCO-20i$では平均IoUスコアが60.79%、41.16%となり,5ショット設定では3.49%,5.64%に向上した。
論文 参考訳(メタデータ) (2021-06-01T15:34:30Z) - Few-Shot Segmentation Without Meta-Learning: A Good Transductive
Inference Is All You Need? [34.95314059362982]
数ショットのセグメンテーションタスクにおける推論の実行方法が性能に重大な影響を及ぼすことを示す。
与えられたクエリー画像に対するトランスダクティブ推論を導入し、ラベルなし画素の統計情報を活用する。
提案手法は,5分と10秒のシナリオにおいて,最先端よりも約5%と6%の改善をもたらすことを示す。
論文 参考訳(メタデータ) (2020-12-11T07:11:19Z) - SOFA-Net: Second-Order and First-order Attention Network for Crowd
Counting [17.869365942837938]
本稿では, 高密度頭部におけるチャネルワイド空間情報の選択性を維持するために, 第二次及び第一次注意ネットワーク(SOFA-Net)を提案する。
提案手法を4つの公開データセット上で評価し,その多くが最先端に到達した。
論文 参考訳(メタデータ) (2020-08-09T13:13:04Z) - DHOG: Deep Hierarchical Object Grouping [0.0]
本研究では,相互情報量(勾配最適化など)を最大化するための欲求的あるいは局所的手法が,相互情報量規準の局所的最適性を発見することを示す。
本稿では,画像の多数の異なる表現を階層的順序で計算するディープ階層的オブジェクトグループ化(DHOG)を提案する。
これらの表現は、下層のオブジェクトクラスにグループ化する下流のタスクとよく一致している。
論文 参考訳(メタデータ) (2020-03-13T14:11:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。