論文の概要: Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition
- arxiv url: http://arxiv.org/abs/2012.02994v1
- Date: Sat, 5 Dec 2020 10:10:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-22 12:06:33.329451
- Title: Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition
- Title(参考訳): マルチラベル画像認識のための注意駆動動的グラフ畳み込みネットワーク
- Authors: Jin Ye, Junjun He, Xiaojiang Peng, Wenhao Wu, and Yu Qiao
- Abstract要約: 本稿では,各画像の特定のグラフを動的に生成するアテンション駆動型動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
パブリックなマルチラベルベンチマーク実験により,本手法の有効性が示された。
- 参考スコア(独自算出の注目度): 53.17837649440601
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent studies often exploit Graph Convolutional Network (GCN) to model label
dependencies to improve recognition accuracy for multi-label image recognition.
However, constructing a graph by counting the label co-occurrence possibilities
of the training data may degrade model generalizability, especially when there
exist occasional co-occurrence objects in test images. Our goal is to eliminate
such bias and enhance the robustness of the learnt features. To this end, we
propose an Attention-Driven Dynamic Graph Convolutional Network (ADD-GCN) to
dynamically generate a specific graph for each image. ADD-GCN adopts a Dynamic
Graph Convolutional Network (D-GCN) to model the relation of content-aware
category representations that are generated by a Semantic Attention Module
(SAM). Extensive experiments on public multi-label benchmarks demonstrate the
effectiveness of our method, which achieves mAPs of 85.2%, 96.0%, and 95.5% on
MS-COCO, VOC2007, and VOC2012, respectively, and outperforms current
state-of-the-art methods with a clear margin. All codes can be found at
https://github.com/Yejin0111/ADD-GCN.
- Abstract(参考訳): 近年の研究では、グラフ畳み込みネットワーク(GCN)を用いてラベル依存をモデル化し、マルチラベル画像認識の認識精度を向上させる。
しかし、トレーニングデータのラベル共起可能性をカウントしてグラフを構築することは、特にテスト画像に時折共起オブジェクトが存在する場合、モデルの一般化性を低下させる可能性がある。
私たちの目標は、このようなバイアスを排除し、学習機能の堅牢性を高めることです。
この目的のために,各画像の特定のグラフを動的に生成するアテンション駆動動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
ADD-GCNは動的グラフ畳み込みネットワーク(D-GCN)を採用し、セマンティック・アテンション・モジュール(SAM)によって生成されるコンテンツ対応のカテゴリ表現の関係をモデル化する。
また,MS-COCO,VOC2007,VOC2012において,mAPの85.2%,96.0%,95.5%を達成し,最先端の手法よりも高い性能を示した。
すべてのコードはhttps://github.com/Yejin0111/ADD-GCNで見ることができる。
関連論文リスト
- Self-Attention Empowered Graph Convolutional Network for Structure
Learning and Node Embedding [5.164875580197953]
グラフ構造化データの表現学習では、多くの人気のあるグラフニューラルネットワーク(GNN)が長距離依存をキャプチャできない。
本稿では,自己注意型グラフ畳み込みネットワーク(GCN-SA)と呼ばれる新しいグラフ学習フレームワークを提案する。
提案手法はノードレベルの表現学習において例外的な一般化能力を示す。
論文 参考訳(メタデータ) (2024-03-06T05:00:31Z) - GKGNet: Group K-Nearest Neighbor based Graph Convolutional Network for Multi-Label Image Recognition [37.02054260449195]
マルチラベル画像認識(Multi-Label Image Recognition, MLIR)は、1つの画像で複数のオブジェクトラベルを予測することを目的とした課題である。
我々は、最初の完全グラフ畳み込みモデル、グループK-アネレスト近傍グラフ畳み込みネットワーク(GKGNet)を提示する。
実験により,GKGNetは計算コストを大幅に削減し,最先端の性能を実現することを示した。
論文 参考訳(メタデータ) (2023-08-28T07:50:04Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - GCN-SE: Attention as Explainability for Node Classification in Dynamic
Graphs [20.330666300034338]
グラフ畳み込みネットワーク(GCN)はグラフ表現学習の一般的な手法である。
本稿では,異なる時刻におけるグラフスナップショットに学習可能な注目重みを付加するGCN-SEを提案する。
本稿では,GCN-SEが以前提案したグラフデータセットのノード分類手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-11T20:30:35Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。