論文の概要: Unifying Nonlocal Blocks for Neural Networks
- arxiv url: http://arxiv.org/abs/2108.02451v1
- Date: Thu, 5 Aug 2021 08:34:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-06 14:55:25.329276
- Title: Unifying Nonlocal Blocks for Neural Networks
- Title(参考訳): ニューラルネットワークのための非局所ブロックの統合
- Authors: Lei Zhu, Qi She, Duo Li, Yanye Lu, Xuejing Kang, Jie Hu, Changhu Wang
- Abstract要約: 非局所ブロックは、コンピュータビジョンタスクにおける長距離空間的依存関係をキャプチャするために設計されている。
我々はそれらを解釈するための新しい視点を提供し、完全連結グラフ上で生成されたグラフフィルタの集合と見なす。
より堅牢でフレキシブルなスペクトル非局所ブロックを提案する。
- 参考スコア(独自算出の注目度): 43.107708207022526
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The nonlocal-based blocks are designed for capturing long-range
spatial-temporal dependencies in computer vision tasks. Although having shown
excellent performance, they still lack the mechanism to encode the rich,
structured information among elements in an image or video. In this paper, to
theoretically analyze the property of these nonlocal-based blocks, we provide a
new perspective to interpret them, where we view them as a set of graph filters
generated on a fully-connected graph. Specifically, when choosing the Chebyshev
graph filter, a unified formulation can be derived for explaining and analyzing
the existing nonlocal-based blocks (e.g., nonlocal block, nonlocal stage,
double attention block). Furthermore, by concerning the property of spectral,
we propose an efficient and robust spectral nonlocal block, which can be more
robust and flexible to catch long-range dependencies when inserted into deep
neural networks than the existing nonlocal blocks. Experimental results
demonstrate the clear-cut improvements and practical applicabilities of our
method on image classification, action recognition, semantic segmentation, and
person re-identification tasks.
- Abstract(参考訳): 非局所型ブロックは、コンピュータビジョンタスクにおける長距離空間-時間依存を捉えるために設計されている。
優れたパフォーマンスを示しているが、画像やビデオの要素間のリッチで構造化された情報をエンコードするメカニズムがまだ欠けている。
本稿では,これらの非局所ブロックの特性を理論的に解析するために,これらを完全連結グラフ上に生成したグラフフィルタの集合として解釈する新たな視点を提供する。
具体的には、chebyshevグラフフィルタを選択する際に、既存の非局所ブロック(非局所ブロック、非局所ステージ、ダブルアテンションブロックなど)を説明し分析するための統一的な定式化を導出することができる。
さらに,スペクトル特性を考慮し,既存の非局所ブロックよりも深層ニューラルネットワークに挿入した場合の長距離依存性をより強固かつ柔軟に捉えることができる効率的かつ堅牢なスペクトル非局所ブロックを提案する。
実験により,画像分類,行動認識,セマンティックセグメンテーション,人物再識別タスクにおいて,提案手法の明確化と実用性を示した。
関連論文リスト
- Multi-View Subgraph Neural Networks: Self-Supervised Learning with Scarce Labeled Data [24.628203785306233]
長距離依存関係を扱うためのマルチビューサブグラフニューラルネットワーク(Muse)と呼ばれる新しい学習フレームワークを提案する。
部分グラフの2つのビューを融合させることで、学習された表現はグラフの位相的性質を広く保存することができる。
実験の結果,Museは限定ラベル付きデータを用いたノード分類タスクにおいて,代替手法よりも優れていた。
論文 参考訳(メタデータ) (2024-04-19T01:36:50Z) - Closing the Loop: Graph Networks to Unify Semantic Objects and Visual
Features for Multi-object Scenes [2.236663830879273]
ループクロージャ検出(LCD)は、以前に訪れた場所を認識する際に、ドリフトを最小限に抑えるために必要である。
Visual Bag-of-Words (vBoW)は、多くの最先端SLAMシステムで選択されたLCDアルゴリズムである。
本稿では,セマンティックオブジェクトと視覚的特徴を共生的に統合する統合グラフ構造を構築するSymbioLCD2を提案する。
論文 参考訳(メタデータ) (2022-09-24T00:42:33Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - Structural block driven - enhanced convolutional neural representation
for relation extraction [11.617819771034927]
本稿では,構造ブロック駆動型畳み込みニューラルネットワークの軽量な関係抽出手法を提案する。
構造ブロックとして命名された依存性分析により、エンティティに関連する重要なシーケンシャルトークンを検出します。
我々はマルチスケールcnnを用いてブロックとブロック間の表現のみを符号化する。
論文 参考訳(メタデータ) (2021-03-21T10:23:44Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - LoCo: Local Contrastive Representation Learning [93.98029899866866]
重なり合うローカルブロックが重なり合うことで、デコーダの深さを効果的に増加させ、上位ブロックが暗黙的に下位ブロックにフィードバックを送ることができることを示す。
このシンプルな設計は、ローカル学習とエンドツーエンドのコントラスト学習アルゴリズムのパフォーマンスギャップを初めて埋める。
論文 参考訳(メタデータ) (2020-08-04T05:41:29Z) - Disentangled Non-Local Neural Networks [68.92293183542131]
局所的でないブロックを深く研究し、注意を2つの項に分けることができることを示した。
両項の学習を容易にするために両項を分離した非局所ブロックを提示する。
論文 参考訳(メタデータ) (2020-06-11T17:59:22Z) - Structural Temporal Graph Neural Networks for Anomaly Detection in
Dynamic Graphs [54.13919050090926]
本稿では,動的グラフの異常エッジを検出するために,エンドツーエンドの時間構造グラフニューラルネットワークモデルを提案する。
特に,まずターゲットエッジを中心にした$h$ホップ囲むサブグラフを抽出し,各ノードの役割を識別するノードラベル機能を提案する。
抽出した特徴に基づき,GRU(Gated Recurrent Unit)を用いて,異常検出のための時間的情報を取得する。
論文 参考訳(メタデータ) (2020-05-15T09:17:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。