論文の概要: GM-MLIC: Graph Matching based Multi-Label Image Classification
- arxiv url: http://arxiv.org/abs/2104.14762v1
- Date: Fri, 30 Apr 2021 05:36:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 00:45:41.288905
- Title: GM-MLIC: Graph Matching based Multi-Label Image Classification
- Title(参考訳): GM-MLIC:グラフマッチングに基づくマルチラベル画像分類
- Authors: Yanan Wu, He Liu, Songhe Feng, Yi Jin, Gengyu Lyu, Zizhang Wu
- Abstract要約: マルチラベル画像分類(MLIC)は、画像に存在するラベルの集合を予測することを目的としている。
本稿では、各イメージをインスタンスの袋として扱い、MLICのタスクをインスタンスラベルマッチング選択問題として再構成する。
Graph Matching Based Multi-Label Image Classification (GM-MLIC) という新しいディープラーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 20.118173194957052
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-Label Image Classification (MLIC) aims to predict a set of labels that
present in an image. The key to deal with such problem is to mine the
associations between image contents and labels, and further obtain the correct
assignments between images and their labels. In this paper, we treat each image
as a bag of instances, and reformulate the task of MLIC as an instance-label
matching selection problem. To model such problem, we propose a novel deep
learning framework named Graph Matching based Multi-Label Image Classification
(GM-MLIC), where Graph Matching (GM) scheme is introduced owing to its
excellent capability of excavating the instance and label relationship.
Specifically, we first construct an instance spatial graph and a label semantic
graph respectively, and then incorporate them into a constructed assignment
graph by connecting each instance to all labels. Subsequently, the graph
network block is adopted to aggregate and update all nodes and edges state on
the assignment graph to form structured representations for each instance and
label. Our network finally derives a prediction score for each instance-label
correspondence and optimizes such correspondence with a weighted cross-entropy
loss. Extensive experiments conducted on various image datasets demonstrate the
superiority of our proposed method.
- Abstract(参考訳): マルチラベル画像分類(MLIC)は、画像に存在するラベルの集合を予測することを目的としている。
このような問題に対処する鍵は、画像の内容とラベルの関連を掘り起こし、さらに画像とラベルの間の正しい割り当てを得ることである。
本稿では,各画像をインスタンスの袋として扱い,mlicのタスクをインスタンスラベルマッチング選択問題として再構成する。
このような問題をモデル化するために,グラフマッチングに基づくマルチラベル画像分類(GM-MLIC)と呼ばれる新しいディープラーニングフレームワークを提案する。
具体的には,まずインスタンス空間グラフとラベル意味グラフをそれぞれ構築し,各インスタンスをすべてのラベルに接続して構築した割当グラフに組み込む。
その後、グラフネットワークブロックを使用して、割り当てグラフ上のすべてのノードとエッジ状態を集約および更新し、各インスタンスとラベルの構造化表現を形成する。
最後に,各インスタンスラベル対応の予測スコアを導出し,重み付きクロスエントロピー損失との対応を最適化する。
様々な画像データセットを用いて大規模な実験を行い,提案手法の優位性を実証した。
関連論文リスト
- GKGNet: Group K-Nearest Neighbor based Graph Convolutional Network for Multi-Label Image Recognition [37.02054260449195]
マルチラベル画像認識(Multi-Label Image Recognition, MLIR)は、1つの画像で複数のオブジェクトラベルを予測することを目的とした課題である。
我々は、最初の完全グラフ畳み込みモデル、グループK-アネレスト近傍グラフ畳み込みネットワーク(GKGNet)を提示する。
実験により,GKGNetは計算コストを大幅に削減し,最先端の性能を実現することを示した。
論文 参考訳(メタデータ) (2023-08-28T07:50:04Z) - Semantic-Aware Graph Matching Mechanism for Multi-Label Image
Recognition [21.36538164675385]
マルチラベル画像認識は、画像に存在するラベルの集合を予測することを目的としている。
本稿では、各画像をインスタンスの袋として扱い、複数ラベル画像認識のタスクをインスタンス-ラベルマッチング選択問題として定式化する。
マルチラベル画像認識(ML-SGM)のための革新的なセマンティック対応グラフマッチングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-21T23:48:01Z) - Semi-Supervised Hierarchical Graph Classification [54.25165160435073]
ノードがグラフのインスタンスである階層グラフにおけるノード分類問題について検討する。
本稿では階層グラフ相互情報(HGMI)を提案し,理論的保証をもってHGMIを計算する方法を提案する。
本稿では,この階層グラフモデリングとSEAL-CI法がテキストおよびソーシャルネットワークデータに与える影響を実証する。
論文 参考訳(メタデータ) (2022-06-11T04:05:29Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Graph Attention Transformer Network for Multi-Label Image Classification [50.0297353509294]
複雑なラベル間関係を効果的にマイニングできる多ラベル画像分類のための一般的なフレームワークを提案する。
提案手法は3つのデータセット上で最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2022-03-08T12:39:05Z) - Weakly-Supervised Image Semantic Segmentation Using Graph Convolutional
Networks [9.066817971329899]
画像レベルクラスラベルに基づく弱教師付き画像意味セグメンテーション
このタスクの一般的なアプローチは、ランダムウォーク機構を用いてクラス活性化マップ(CAM)のアクティベーションスコアを伝搬することである。
グラフ畳み込みネットワーク(GCN)に基づく特徴伝達フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-31T02:05:01Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。