論文の概要: FCN+: Global Receptive Convolution Makes FCN Great Again
- arxiv url: http://arxiv.org/abs/2303.04589v1
- Date: Wed, 8 Mar 2023 14:04:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-09 13:56:12.448554
- Title: FCN+: Global Receptive Convolution Makes FCN Great Again
- Title(参考訳): FCN+:世界的受容的コンボリューションでFCNが復活
- Authors: Zhongying Deng, Xiaoyu Ren, Jin Ye, Junjun He, Yu Qiao
- Abstract要約: 本稿では,文脈情報抽出のためのFCNの受容領域を増やすために,GRC(Global Receptive Convolution)を提案する。
GRCが組み込まれているため、FCN+はセマンティックセグメンテーションタスクの最先端メソッドと同等のパフォーマンスを達成できる。
- 参考スコア(独自算出の注目度): 37.083656879634646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fully convolutional network (FCN) is a seminal work for semantic
segmentation. However, due to its limited receptive field, FCN cannot
effectively capture global context information which is vital for semantic
segmentation. As a result, it is beaten by state-of-the-art methods which
leverage different filter sizes for larger receptive fields. However, such a
strategy usually introduces more parameters and increases the computational
cost. In this paper, we propose a novel global receptive convolution (GRC) to
effectively increase the receptive field of FCN for context information
extraction, which results in an improved FCN termed FCN+. The GRC provides
global receptive field for convolution without introducing any extra learnable
parameters. The motivation of GRC is that different channels of a convolutional
filter can have different grid sampling locations across the whole input
feature map. Specifically, the GRC first divides the channels of the filter
into two groups. The grid sampling locations of the first group are shifted to
different spatial coordinates across the whole feature map, according to their
channel indexes. This can help the convolutional filter capture the global
context information. The grid sampling location of the second group remains
unchanged to keep the original location information. Convolving using these two
groups, the GRC can integrate the global context into the original location
information of each pixel for better dense prediction results. With the GRC
built in, FCN+ can achieve comparable performance to state-of-the-art methods
for semantic segmentation tasks, as verified on PASCAL VOC 2012, Cityscapes,
and ADE20K.
- Abstract(参考訳): 完全畳み込みネットワーク(FCN)はセマンティックセグメンテーションのための基礎研究である。
しかし、その限定的な受容領域のため、fcnは意味セグメンテーションに不可欠なグローバルコンテキスト情報を効果的に捉えることができない。
その結果、より大きな受容場のために異なるフィルタサイズを利用する最先端の手法に打ち負かされる。
しかし、そのような戦略は通常より多くのパラメータを導入し、計算コストを増大させる。
本稿では、文脈情報抽出のためのFCNの受容場を効果的に向上させる新しいグローバル受容畳み込み(GRC)を提案する。
GRCは、余分な学習可能なパラメータを導入することなく、畳み込みのためのグローバルな受容場を提供する。
GRCの動機は、畳み込みフィルタの異なるチャネルが入力特徴マップ全体にわたって異なるグリッドサンプリング位置を持つことができることである。
具体的には、GRCはまずフィルタのチャネルを2つのグループに分割する。
最初のグループのグリッドサンプリングロケーションは、チャネルインデックスに従って、機能マップ全体にわたって異なる空間座標にシフトされる。
これは畳み込みフィルタがグローバルコンテキスト情報をキャプチャするのに役立つ。
第2群のグリッドサンプリング位置は、元の位置情報を保持するために変わっていない。
これら2つのグループを用いて、GRCはグローバルコンテキストを各ピクセルの元の位置情報に統合し、より高密度な予測結果を得る。
GRCが組み込まれているため、FCN+はPASCAL VOC 2012、Cityscapes、ADE20Kで検証されているように、セマンティックセグメンテーションタスクの最先端メソッドと同等のパフォーマンスを達成できる。
関連論文リスト
- Scalable Graph Compressed Convolutions [68.85227170390864]
ユークリッド畳み込みのための入力グラフのキャリブレーションに置換を適用する微分可能手法を提案する。
グラフキャリブレーションに基づいて,階層型グラフ表現学習のための圧縮畳み込みネットワーク(CoCN)を提案する。
論文 参考訳(メタデータ) (2024-07-26T03:14:13Z) - FedGT: Federated Node Classification with Scalable Graph Transformer [27.50698154862779]
本稿では,スケーラブルな textbfFederated textbfGraph textbfTransformer (textbfFedGT) を提案する。
FedGTは、最適なトランスポートで整列したグローバルノードに基づいて、クライアントの類似性を計算する。
論文 参考訳(メタデータ) (2024-01-26T21:02:36Z) - Graph Neural Networks with Diverse Spectral Filtering [32.69196871253339]
スペクトルグラフニューラルネットワーク(GNN)は、グラフ機械学習において大きな成功を収めている。
本稿では,ノード固有のフィルタ重みを自動的に学習する新しいスペクトルフィルタリング(DSF)フレームワークを提案する。
我々のフレームワークは、ノード分類タスクにおいて、モデル性能を最大4.92%向上させることができる。
論文 参考訳(メタデータ) (2023-12-14T15:38:12Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Message Passing in Graph Convolution Networks via Adaptive Filter Banks [81.12823274576274]
我々は BankGCN と呼ばれる新しいグラフ畳み込み演算子を提案する。
グラフ上のマルチチャネル信号をサブスペースに分解し、各サブスペース内の特定の情報を適応フィルタで処理する。
ベンチマークグラフデータセットの集合におけるグラフ分類における優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-06-18T04:23:34Z) - LGD-GCN: Local and Global Disentangled Graph Convolutional Networks [35.71362724342354]
Disentangled Graph Convolutional Network (DisenGCN)は、現実世界のグラフで発生する潜伏要因を解消するための奨励的なフレームワークである。
本稿では,Global Disentangled Graph Convolutional Network (LGD-GCN) を導入する。
論文 参考訳(メタデータ) (2021-04-24T06:40:35Z) - Global Context Networks [52.597260561253655]
非ローカルネットワーク(NLNet)は、画像内の長距離依存関係をキャプチャするための先駆的なアプローチです。
非ローカルネットワークでモデル化されたグローバルコンテキストは,異なるクエリ位置でほぼ同じであることを示す。
この知見を生かして,クエリに依存しない定式化に基づく簡易ネットワークを構築する。
論文 参考訳(メタデータ) (2020-12-24T18:02:57Z) - Self-grouping Convolutional Neural Networks [30.732298624941738]
本稿では,SG-CNNと呼ばれる自己グループ型畳み込みニューラルネットワークの設計手法を提案する。
各フィルタについて、まず入力チャネルの重要度を評価し、重要度ベクトルを同定する。
得られたデータに依存したセントロイドを用いて、重要でない接続を創り出し、プルーニングの精度損失を暗黙的に最小化する。
論文 参考訳(メタデータ) (2020-09-29T06:24:32Z) - Learning to Predict Context-adaptive Convolution for Semantic
Segmentation [66.27139797427147]
長距離コンテキスト情報は、高性能なセマンティックセグメンテーションを実現するために不可欠である。
空間的に変化する特徴重み付けベクトルを予測するためのコンテキスト適応畳み込みネットワーク(CaC-Net)を提案する。
当社のCaC-Netは,3つの公開データセット上でのセグメンテーション性能に優れています。
論文 参考訳(メタデータ) (2020-04-17T13:09:17Z) - Permutohedral-GCN: Graph Convolutional Networks with Global Attention [7.873191259466302]
グラフ畳み込みネットワーク(GCN)は、グラフ内の隣人から機能を集約することで、ノードの特徴ベクトルを更新する。
我々は,ノードがグラフ内の他のノードから選択的に参加し,特徴を集約するグローバルアテンション機構を導入する。
得られた注意に基づくグローバルアグリゲーションスキームは高次元ガウスフィルタと類似していることを示す。
論文 参考訳(メタデータ) (2020-03-02T02:44:52Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。