論文の概要: Semi-Global Shape-aware Network
- arxiv url: http://arxiv.org/abs/2012.09372v1
- Date: Thu, 17 Dec 2020 02:52:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:28:47.421831
- Title: Semi-Global Shape-aware Network
- Title(参考訳): 半グローバル形状認識ネットワーク
- Authors: Pengju Zhang, Yihong Wu, Jiagang Zhu
- Abstract要約: 物体形状保存のための類似性と近接性を考慮した半グローバル形状認識ネットワーク(sgsnet)を提案する。
セマンティックセグメンテーションと画像検索の実験により、既存のネットワークにSGSNetを追加することにより、精度と効率の両面で確固たる改善が得られた。
- 参考スコア(独自算出の注目度): 7.118096593558024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Non-local operations are usually used to capture long-range dependencies via
aggregating global context to each position recently. However, most of the
methods cannot preserve object shapes since they only focus on feature
similarity but ignore proximity between central and other positions for
capturing long-range dependencies, while shape-awareness is beneficial to many
computer vision tasks. In this paper, we propose a Semi-Global Shape-aware
Network (SGSNet) considering both feature similarity and proximity for
preserving object shapes when modeling long-range dependencies. A hierarchical
way is taken to aggregate global context. In the first level, each position in
the whole feature map only aggregates contextual information in vertical and
horizontal directions according to both similarity and proximity. And then the
result is input into the second level to do the same operations. By this
hierarchical way, each central position gains supports from all other
positions, and the combination of similarity and proximity makes each position
gain supports mostly from the same semantic object. Moreover, we also propose a
linear time algorithm for the aggregation of contextual information, where each
of rows and columns in the feature map is treated as a binary tree to reduce
similarity computation cost. Experiments on semantic segmentation and image
retrieval show that adding SGSNet to existing networks gains solid improvements
on both accuracy and efficiency.
- Abstract(参考訳): ローカルでない操作は、最近各位置へのグローバルコンテキストの集約を通じて、長距離依存関係をキャプチャするために使用される。
しかし、ほとんどの手法は、特徴の類似性のみに焦点をあてるだけでオブジェクトの形状を保存できないが、長距離依存を捉えるために中央と他の位置との近接を無視する一方で、形状認識は多くのコンピュータビジョンタスクに有用である。
本稿では,長距離依存をモデル化する際のオブジェクト形状の類似性と近接性を考慮したセミ・グローバル形状認識ネットワーク(SGSNet)を提案する。
階層的な方法でグローバルなコンテキストを集約する。
第1段階では、特徴地図全体における各位置は、類似度と近接度の両方に応じて、縦方向と横方向の文脈情報のみを集約する。
そして、結果は第2のレベルに入力され、同じ操作を行います。
この階層的な方法では、各中央位置ゲインは、他の全ての位置から支持され、類似性と近接の組み合わせにより、各位置ゲインは、ほとんど同じ意味オブジェクトから支持される。
また,特徴マップ内の各行や列を二分木として扱い,類似性計算コストを低減させる,文脈情報集約のための線形時間アルゴリズムを提案する。
セマンティックセグメンテーションと画像検索の実験により、既存のネットワークにSGSNetを追加することにより、精度と効率の両面で確固たる改善が得られた。
関連論文リスト
- GSTran: Joint Geometric and Semantic Coherence for Point Cloud Segmentation [33.72549134362884]
本稿では,セグメント化作業に適した新しい変圧器ネットワークであるGSTranを提案する。
提案するネットワークは主に,局所幾何学変換器と大域意味変換器の2つの主成分から構成される。
ShapeNetPartとS3DISベンチマークの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-21T12:12:37Z) - HSGNet: Object Re-identification with Hierarchical Similarity Graph
Network [0.7406388656098399]
オブジェクトの再識別方法は、バックボーンネットワーク、特徴集約、損失関数から構成される。
バックボーンと再識別ネットワークの競合を軽減するために,階層的類似性グラフモジュール(HSGM)を設計する。
我々は,HSGMをバックボーンネットワークに埋め込むことにより,新しい階層型類似性グラフネットワーク(HSGNet)を開発した。
論文 参考訳(メタデータ) (2022-11-10T11:02:40Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - APP-Net: Auxiliary-point-based Push and Pull Operations for Efficient
Point Cloud Classification [48.230170172837084]
ポイントクラウドベースの3D分類タスクでは、隣のポイントから機能を集約する。
これらの問題に対処するため,我々はAPPと呼ばれる線形複雑性の局所アグリゲータを提案する。
オンラインの正規推定モジュールを使用して、説明可能な幾何学情報を提供し、APPモデリング機能を強化します。
論文 参考訳(メタデータ) (2022-05-02T12:21:11Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - T2VLAD: Global-Local Sequence Alignment for Text-Video Retrieval [59.990432265734384]
テキストビデオ検索は,自然言語記述に基づく関連映像の検索を目的とした課題である。
既存のほとんどのメソッドは、グローバルなクロスモーダル類似性のみを考慮し、ローカルの詳細を見下ろす。
本稿では,効率的なグローバルアライメント手法を設計する。
3つの標準テキスト-ビデオ検索ベンチマークで一貫した改善を達成し、明確なマージンで最先端を上回ります。
論文 参考訳(メタデータ) (2021-04-20T15:26:24Z) - Global Context Networks [52.597260561253655]
非ローカルネットワーク(NLNet)は、画像内の長距離依存関係をキャプチャするための先駆的なアプローチです。
非ローカルネットワークでモデル化されたグローバルコンテキストは,異なるクエリ位置でほぼ同じであることを示す。
この知見を生かして,クエリに依存しない定式化に基づく簡易ネットワークを構築する。
論文 参考訳(メタデータ) (2020-12-24T18:02:57Z) - Improving Coreference Resolution by Leveraging Entity-Centric Features
with Graph Neural Networks and Second-order Inference [12.115691569576345]
Coreferentの言及は通常、テキスト全体においてはるかに分散しており、エンティティレベルの機能を組み込むのが困難である。
本稿では,エンティティ中心の情報をキャプチャ可能なグラフニューラルネットワークに基づくコア参照分解法を提案する。
グローバル推論アルゴリズムは、クラスタの参照を一貫したグループに最適化する。
論文 参考訳(メタデータ) (2020-09-10T02:22:21Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。