論文の概要: Instance-Aware Graph Convolutional Network for Multi-Label
Classification
- arxiv url: http://arxiv.org/abs/2008.08407v1
- Date: Wed, 19 Aug 2020 12:49:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 11:58:38.783014
- Title: Instance-Aware Graph Convolutional Network for Multi-Label
Classification
- Title(参考訳): マルチラベル分類のためのインスタンスアウェアグラフ畳み込みネットワーク
- Authors: Yun Wang, Tong Zhang, Zhen Cui, Chunyan Xu, Jian Yang
- Abstract要約: グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 55.131166957803345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph convolutional neural network (GCN) has effectively boosted the
multi-label image recognition task by introducing label dependencies based on
statistical label co-occurrence of data. However, in previous methods, label
correlation is computed based on statistical information of data and therefore
the same for all samples, and this makes graph inference on labels insufficient
to handle huge variations among numerous image instances. In this paper, we
propose an instance-aware graph convolutional neural network (IA-GCN) framework
for multi-label classification. As a whole, two fused branches of sub-networks
are involved in the framework: a global branch modeling the whole image and a
region-based branch exploring dependencies among regions of interests (ROIs).
For label diffusion of instance-awareness in graph convolution, rather than
using the statistical label correlation alone, an image-dependent label
correlation matrix (LCM), fusing both the statistical LCM and an individual one
of each image instance, is constructed for graph inference on labels to inject
adaptive information of label-awareness into the learned features of the model.
Specifically, the individual LCM of each image is obtained by mining the label
dependencies based on the scores of labels about detected ROIs. In this
process, considering the contribution differences of ROIs to multi-label
classification, variational inference is introduced to learn adaptive scaling
factors for those ROIs by considering their complex distribution. Finally,
extensive experiments on MS-COCO and VOC datasets show that our proposed
approach outperforms existing state-of-the-art methods.
- Abstract(参考訳): グラフ畳み込みニューラルネットワーク(GCN)は、統計ラベル共起データに基づくラベル依存を導入することにより、マルチラベル画像認識タスクを効果的に強化した。
しかし、従来の方法では、ラベル相関はデータの統計情報に基づいて計算されるため、全てのサンプルで同じであり、多くの画像インスタンスの膨大な変動を扱うにはラベル上のグラフ推論が不十分である。
本稿では,マルチラベル分類のためのインスタンス対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
全体として、サブネットワークの2つの融合ブランチは、全体像をモデル化するグローバルブランチと、関心領域(ROI)間の依存関係を探索するリージョンベースのブランチである。
統計的ラベル相関のみを用いるのではなく、グラフ畳み込みにおけるインスタンス認識性のラベル拡散のために、画像依存ラベル相関行列(lcm)を構築し、各画像インスタンスの統計的lcmと個々の画像インスタンスの両方を融合して、ラベル上のグラフ推論を行い、モデルの学習した特徴にラベル認識の適応情報を注入する。
具体的には、検出されたroisに関するラベルのスコアに基づいてラベル依存性をマイニングして各画像の個々のlcmを得る。
本稿では,roisのマルチラベル分類への寄与の違いを考慮し,これらのroisの適応的スケーリング因子を複素分布から学習するために,変分推論を導入する。
最後に、MS-COCOおよびVOCデータセットに関する広範な実験により、提案手法が既存の最先端手法よりも優れていることを示す。
関連論文リスト
- Semantic-Aware Graph Matching Mechanism for Multi-Label Image
Recognition [21.36538164675385]
マルチラベル画像認識は、画像に存在するラベルの集合を予測することを目的としている。
本稿では、各画像をインスタンスの袋として扱い、複数ラベル画像認識のタスクをインスタンス-ラベルマッチング選択問題として定式化する。
マルチラベル画像認識(ML-SGM)のための革新的なセマンティック対応グラフマッチングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-21T23:48:01Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Graph Attention Transformer Network for Multi-Label Image Classification [50.0297353509294]
複雑なラベル間関係を効果的にマイニングできる多ラベル画像分類のための一般的なフレームワークを提案する。
提案手法は3つのデータセット上で最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2022-03-08T12:39:05Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - Multi-layered Semantic Representation Network for Multi-label Image
Classification [8.17894017454724]
マルチラベル画像分類(MLIC)は,複数の可能なラベルを画像に割り当てることを目的とした,基本的で実践的な課題である。
近年,多くのディープ畳み込みニューラルネットワーク(CNN)に基づく手法が提案され,ラベル相関がモデル化されている。
本稿では,ラベル相関のモデル化と意味表現の学習を改善することにより,この研究の方向性を推し進める。
論文 参考訳(メタデータ) (2021-06-22T08:04:22Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。