論文の概要: Spatial Pyramid Based Graph Reasoning for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2003.10211v1
- Date: Mon, 23 Mar 2020 12:28:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 00:27:22.654118
- Title: Spatial Pyramid Based Graph Reasoning for Semantic Segmentation
- Title(参考訳): 意味セグメンテーションのための空間ピラミッドに基づくグラフ推論
- Authors: Xia Li, Yibo Yang, Qijie Zhao, Tiancheng Shen, Zhouchen Lin, Hong Liu
- Abstract要約: セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 67.47159595239798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The convolution operation suffers from a limited receptive filed, while
global modeling is fundamental to dense prediction tasks, such as semantic
segmentation. In this paper, we apply graph convolution into the semantic
segmentation task and propose an improved Laplacian. The graph reasoning is
directly performed in the original feature space organized as a spatial
pyramid. Different from existing methods, our Laplacian is data-dependent and
we introduce an attention diagonal matrix to learn a better distance metric. It
gets rid of projecting and re-projecting processes, which makes our proposed
method a light-weight module that can be easily plugged into current computer
vision architectures. More importantly, performing graph reasoning directly in
the feature space retains spatial relationships and makes spatial pyramid
possible to explore multiple long-range contextual patterns from different
scales. Experiments on Cityscapes, COCO Stuff, PASCAL Context and PASCAL VOC
demonstrate the effectiveness of our proposed methods on semantic segmentation.
We achieve comparable performance with advantages in computational and memory
overhead.
- Abstract(参考訳): 畳み込み操作は限定的な受容性に苦しむ一方、グローバルモデリングはセマンティックセグメンテーションのような密集した予測タスクの基本である。
本稿では,グラフの畳み込みをセマンティックセグメンテーションタスクに適用し,改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして組織された元の特徴空間で直接実行される。
既存の手法と異なり、我々のラプラシアンはデータに依存しており、より良い距離の計量を学ぶために注意対角行列を導入する。
プロジェクションと再プロジェクションのプロセスは不要となり、提案手法は現在のコンピュータビジョンアーキテクチャに簡単にプラグインできる軽量モジュールとなる。
さらに重要なことは、特徴空間で直接グラフ推論を行うことは空間的関係を保ち、異なるスケールから複数の長距離コンテキストパターンを探索できるようにする。
都市景観,COCOスタッフ,PASCALコンテキスト,PASCALVOCに関する実験により,提案手法が意味的セグメンテーションに与える影響を実証した。
計算とメモリのオーバーヘッドの利点と同等の性能を達成します。
関連論文リスト
- Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - AMES: A Differentiable Embedding Space Selection Framework for Latent
Graph Inference [6.115315198322837]
Intentional Multi-Embedding Selection (AMES) フレームワークを導入する。
我々のフレームワークは、遅延グラフ推論の従来の手法と比較して、常に同等または優れた結果が得られる。
論文 参考訳(メタデータ) (2023-11-20T16:24:23Z) - Edge-aware Plug-and-play Scheme for Semantic Segmentation [4.297988192695948]
提案手法は, 改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できる。
実験結果から,提案手法は改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できることが示唆された。
論文 参考訳(メタデータ) (2023-03-18T02:17:37Z) - BI-GCN: Boundary-Aware Input-Dependent Graph Convolution Network for
Biomedical Image Segmentation [21.912509900254364]
セグメント化タスクにグラフ畳み込みを適用し,改良されたtextitLaplacianを提案する。
本手法は,大腸内視鏡像におけるポリープの分画と光ディスク,光カップのカラーファンドス画像における画期的なアプローチよりも優れていた。
論文 参考訳(メタデータ) (2021-10-27T21:12:27Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - Graph Networks with Spectral Message Passing [1.0742675209112622]
本稿では,空間領域とスペクトル領域の両方にメッセージパッシングを適用するSpectral Graph Networkを紹介する。
その結果,spectrum gnは効率のよいトレーニングを促進し,より多くのパラメータを持つにもかかわらず,少ないトレーニングイテレーションで高いパフォーマンスを達成できることがわかった。
論文 参考訳(メタデータ) (2020-12-31T21:33:17Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。