論文の概要: Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition
- arxiv url: http://arxiv.org/abs/2009.09450v1
- Date: Sun, 20 Sep 2020 15:05:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 13:00:54.311505
- Title: Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition
- Title(参考訳): 一般画像認識のための知識誘導型マルチラベル・マイノショット学習
- Authors: Tianshui Chen, Liang Lin, Riquan Chen, Xiaolu Hui, and Hefeng Wu
- Abstract要約: KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
- 参考スコア(独自算出の注目度): 75.44233392355711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognizing multiple labels of an image is a practical yet challenging task,
and remarkable progress has been achieved by searching for semantic regions and
exploiting label dependencies. However, current works utilize RNN/LSTM to
implicitly capture sequential region/label dependencies, which cannot fully
explore mutual interactions among the semantic regions/labels and do not
explicitly integrate label co-occurrences. In addition, these works require
large amounts of training samples for each category, and they are unable to
generalize to novel categories with limited samples. To address these issues,
we propose a knowledge-guided graph routing (KGGR) framework, which unifies
prior knowledge of statistical label correlations with deep neural networks.
The framework exploits prior knowledge to guide adaptive information
propagation among different categories to facilitate multi-label analysis and
reduce the dependency of training samples. Specifically, it first builds a
structured knowledge graph to correlate different labels based on statistical
label co-occurrence. Then, it introduces the label semantics to guide learning
semantic-specific features to initialize the graph, and it exploits a graph
propagation network to explore graph node interactions, enabling learning
contextualized image feature representations. Moreover, we initialize each
graph node with the classifier weights for the corresponding label and apply
another propagation network to transfer node messages through the graph. In
this way, it can facilitate exploiting the information of correlated labels to
help train better classifiers. We conduct extensive experiments on the
traditional multi-label image recognition (MLR) and multi-label few-shot
learning (ML-FSL) tasks and show that our KGGR framework outperforms the
current state-of-the-art methods by sizable margins on the public benchmarks.
- Abstract(参考訳): 画像の複数のラベルを認識することは実用的だが難しい課題であり、セマンティックな領域を探し、ラベルの依存関係を活用することで顕著な進歩を遂げた。
しかし、現在の研究では、RNN/LSTMを使用してシーケンシャルな領域/ラベルの依存関係を暗黙的にキャプチャする。
さらに、これらの研究は各カテゴリのトレーニングサンプルを大量に必要としており、限られたサンプルを持つ新しいカテゴリに一般化することはできない。
これらの問題に対処するために、深層ニューラルネットワークと統計ラベル相関の事前知識を統一する知識誘導グラフルーティング(KGGR)フレームワークを提案する。
このフレームワークは、事前知識を利用して、異なるカテゴリ間の適応的な情報伝達をガイドし、マルチラベル分析を容易にし、トレーニングサンプルの依存性を減らす。
具体的には、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを最初に構築する。
次にラベルセマンティクスを導入し、グラフを初期化するためにセマンティクス固有の特徴を学習し、グラフ伝搬ネットワークを利用してグラフノードの相互作用を探索し、文脈化された画像の特徴表現を学習できるようにする。
さらに、各グラフノードを対応するラベルの分類子重みで初期化し、別の伝播ネットワークを適用してグラフを通してノードメッセージを転送する。
このようにして、相関ラベルの情報を活用することで、より良い分類器の訓練を支援することができる。
従来のマルチラベル画像認識(MLR)とマルチラベル・マルチショット・ラーニング(ML-FSL)のタスクについて広範な実験を行い、我々のKGGRフレームワークは、公開ベンチマークにおける大きなマージンによる現在の最先端手法よりも優れていることを示す。
関連論文リスト
- KMF: Knowledge-Aware Multi-Faceted Representation Learning for Zero-Shot
Node Classification [75.95647590619929]
Zero-Shot Node Classification (ZNC)は、グラフデータ分析において、新しく重要なタスクである。
ラベルセマンティクスの豊かさを向上する知識認識型多面的フレームワーク(KMF)を提案する。
ノード情報集約によるプロトタイプドリフトの問題を軽減するために,新しい幾何学的制約を開発した。
論文 参考訳(メタデータ) (2023-08-15T02:38:08Z) - Multi-Label Continual Learning using Augmented Graph Convolutional
Network [7.115602040521868]
Multi-Label Continual Learningは、シーケンシャルなマルチラベル画像認識データストリームにクラスインクリメンタルフレームワークを構築する。
この研究は、MLCLにおけるクロスタスクラベル関係を構築することができるAGCN++(Augmented Graph Convolutional Network)を提案する。
提案手法は2つのマルチラベル画像ベンチマークを用いて評価する。
論文 参考訳(メタデータ) (2022-11-27T08:40:19Z) - AGCN: Augmented Graph Convolutional Network for Lifelong Multi-label
Image Recognition [8.06616666179388]
Lifelong Multi-Label (LML)画像認識は、シーケンシャルなマルチラベル画像認識データストリームにオンラインのクラスインクリメンタル分類器を構築する。
LML画像認識の鍵となる課題は、学習データの部分ラベルと古いクラスにおける破滅的蓄積に関するラベル関係の構築である。
逐次認識タスク間でラベル関係を構築することができる拡張グラフ畳み込みネットワーク(AGCN)モデルを提案する。
論文 参考訳(メタデータ) (2022-03-10T18:37:56Z) - Graph Attention Transformer Network for Multi-Label Image Classification [50.0297353509294]
複雑なラベル間関係を効果的にマイニングできる多ラベル画像分類のための一般的なフレームワークを提案する。
提案手法は3つのデータセット上で最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2022-03-08T12:39:05Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition [53.17837649440601]
本稿では,各画像の特定のグラフを動的に生成するアテンション駆動型動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
パブリックなマルチラベルベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-05T10:10:12Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z) - Multi-label Zero-shot Classification by Learning to Transfer from
External Knowledge [36.04579549557464]
マルチラベルゼロショット分類は、入力画像に対する複数の未知のクラスラベルを予測することを目的としている。
本稿では,外部知識の伝達を学習することで,新たなゼロショット分類フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-30T17:26:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。