論文の概要: Towards Efficient Scene Understanding via Squeeze Reasoning
- arxiv url: http://arxiv.org/abs/2011.03308v3
- Date: Tue, 20 Jul 2021 06:29:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 05:09:35.122879
- Title: Towards Efficient Scene Understanding via Squeeze Reasoning
- Title(参考訳): Squeeze Reasoningによる効率的なシーン理解に向けて
- Authors: Xiangtai Li, Xia Li, Ansheng You, Li Zhang, Guangliang Cheng, Kuiyuan
Yang, Yunhai Tong, Zhouchen Lin
- Abstract要約: 我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
- 参考スコア(独自算出の注目度): 71.1139549949694
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph-based convolutional model such as non-local block has shown to be
effective for strengthening the context modeling ability in convolutional
neural networks (CNNs). However, its pixel-wise computational overhead is
prohibitive which renders it unsuitable for high resolution imagery. In this
paper, we explore the efficiency of context graph reasoning and propose a novel
framework called Squeeze Reasoning. Instead of propagating information on the
spatial map, we first learn to squeeze the input feature into a channel-wise
global vector and perform reasoning within the single vector where the
computation cost can be significantly reduced. Specifically, we build the node
graph in the vector where each node represents an abstract semantic concept.
The refined feature within the same semantic category results to be consistent,
which is thus beneficial for downstream tasks. We show that our approach can be
modularized as an end-to-end trained block and can be easily plugged into
existing networks. {Despite its simplicity and being lightweight, the proposed
strategy allows us to establish the considerable results on different semantic
segmentation datasets and shows significant improvements with respect to strong
baselines on various other scene understanding tasks including object
detection, instance segmentation and panoptic segmentation.} Code is available
at \url{https://github.com/lxtGH/SFSegNets}.
- Abstract(参考訳): 非局所ブロックなどのグラフに基づく畳み込みモデルは畳み込みニューラルネットワーク(cnns)における文脈モデリング能力の強化に有効であることが示されている。
しかし、ピクセル単位での計算オーバーヘッドは禁じられているため、高解像度画像には適さない。
本稿では,文脈グラフ推論の効率について検討し,Squeeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間マップの情報伝達の代わりに、まず入力特徴をチャネル毎の大域ベクトルに絞り込み、計算コストを大幅に削減できる単一のベクトル内で推論を行うことを学ぶ。
具体的には、各ノードが抽象的な意味概念を表すベクトルにノードグラフを構築する。
同じセマンティクスカテゴリ内の洗練された機能は一貫性があるため、ダウンストリームタスクに有用である。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
そのシンプルさと軽量さにもかかわらず、提案された戦略により、異なるセマンティックセグメンテーションデータセットでかなりの結果を確立することができ、オブジェクト検出、インスタンスセグメンテーション、panopticセグメンテーションなど、さまざまなシーン理解タスクの強力なベースラインに関して大きな改善が得られます。
コードは \url{https://github.com/lxtGH/SFSegNets} で入手できる。
関連論文リスト
- Self-Supervised Node Representation Learning via Node-to-Neighbourhood
Alignment [10.879056662671802]
自己教師付きノード表現学習は、教師付きノードと競合する未ラベルグラフからノード表現を学ぶことを目的としている。
本研究では,ノードとその周辺領域の隠蔽表現を整列させることにより,単純なyet効率の自己教師付きノード表現学習を提案する。
我々は,グラフ構造化データセットの集合に対して,ノード分類性能が期待できるノード表現を,小規模から大規模に学習する。
論文 参考訳(メタデータ) (2023-02-09T13:21:18Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - Local Permutation Equivariance For Graph Neural Networks [2.208242292882514]
そこで我々は,局所置換同変グラフニューラルネットワークという新しい手法を開発した。
ローカルノード近傍で動作するグラフニューラルネットワークを構築するためのフレームワークを提供する。
提案手法を,グラフベンチマークの分類タスクの範囲で実験的に検証する。
論文 参考訳(メタデータ) (2021-11-23T13:10:34Z) - RICE: Refining Instance Masks in Cluttered Environments with Graph
Neural Networks [53.15260967235835]
本稿では,インスタンスマスクのグラフベース表現を利用して,そのような手法の出力を改良する新しいフレームワークを提案する。
我々は、セグメンテーションにスマートな摂動をサンプリングできるディープネットワークと、オブジェクト間の関係をエンコード可能なグラフニューラルネットワークを訓練し、セグメンテーションを評価する。
本稿では,本手法によって生成された不確実性推定を用いてマニピュレータを誘導し,乱れたシーンを効率的に理解するアプリケーションについて紹介する。
論文 参考訳(メタデータ) (2021-06-29T20:29:29Z) - Inferring community characteristics in labelled networks [6.85316573653194]
我々は新しい生成モデルである特徴第一ブロックモデル(FFBM)を導入する。
FFBMパラメータの後方分布から効率的にサンプリングする方法を提案する。
提案手法の主な利点は、機能空間全体が自動的に使用され、影響に応じて暗黙的に機能をランク付けできる点である。
論文 参考訳(メタデータ) (2021-05-28T12:07:10Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Quiver Signal Processing (QSP) [145.6921439353007]
キーバー表現に関する信号処理フレームワークの基礎を述べる。
ネットワークにおける異種多次元情報を扱うための信号処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-22T08:40:15Z) - Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-03-23T12:28:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。