論文の概要: Adversarial Learning for Personalized Tag Recommendation
- arxiv url: http://arxiv.org/abs/2004.00698v1
- Date: Wed, 1 Apr 2020 20:41:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 18:47:33.189045
- Title: Adversarial Learning for Personalized Tag Recommendation
- Title(参考訳): パーソナライズされたタグレコメンデーションのための逆学習
- Authors: Erik Quintanilla, Yogesh Rawat, Andrey Sakryukin, Mubarak Shah, Mohan
Kankanhalli
- Abstract要約: 大規模データセットでトレーニング可能なエンドツーエンドのディープネットワークを提案する。
ユーザの嗜好と視覚的エンコーディングの合同トレーニングにより、ネットワークは視覚的嗜好をタグ付け行動と効率的に統合することができる。
本稿では,提案モデルの有効性を2つの大規模および公開データセットで示す。
- 参考スコア(独自算出の注目度): 61.76193196463919
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We have recently seen great progress in image classification due to the
success of deep convolutional neural networks and the availability of
large-scale datasets. Most of the existing work focuses on single-label image
classification. However, there are usually multiple tags associated with an
image. The existing works on multi-label classification are mainly based on lab
curated labels. Humans assign tags to their images differently, which is mainly
based on their interests and personal tagging behavior. In this paper, we
address the problem of personalized tag recommendation and propose an
end-to-end deep network which can be trained on large-scale datasets. The
user-preference is learned within the network in an unsupervised way where the
network performs joint optimization for user-preference and visual encoding. A
joint training of user-preference and visual encoding allows the network to
efficiently integrate the visual preference with tagging behavior for a better
user recommendation. In addition, we propose the use of adversarial learning,
which enforces the network to predict tags resembling user-generated tags. We
demonstrate the effectiveness of the proposed model on two different
large-scale and publicly available datasets, YFCC100M and NUS-WIDE. The
proposed method achieves significantly better performance on both the datasets
when compared to the baselines and other state-of-the-art methods. The code is
publicly available at https://github.com/vyzuer/ALTReco.
- Abstract(参考訳): 近年,深層畳み込みニューラルネットワークの成功と大規模データセットの利用により,画像分類が大きな進歩を遂げている。
既存の作品のほとんどがシングルラベル画像の分類に焦点を当てている。
しかし、通常は画像に関連付けられた複数のタグがある。
既存のマルチラベル分類の研究は主に実験室のラベルに基づいている。
人間は、主に自分の興味や個人的なタグ付け行動に基づいて、イメージに異なるタグを割り当てる。
本稿では,パーソナライズされたタグレコメンデーションの問題に対処し,大規模データセット上でトレーニング可能なエンドツーエンドのディープネットワークを提案する。
ユーザ参照は、ネットワーク内でユーザ参照と視覚的エンコーディングの協調最適化を行う教師なしの方法で学習される。
ユーザ参照とビジュアルエンコーディングの合同トレーニングにより、より優れたユーザレコメンデーションのために、視覚的な好みとタグ付け動作を効率的に統合することができる。
さらに,ユーザ生成タグに類似したタグの予測をネットワークに強制する逆学習の利用を提案する。
提案モデルの有効性を,YFCC100M と NUS-WIDE の2つの大規模および公開データセットで示す。
提案手法は, ベースラインおよび他の最先端手法と比較して, 両方のデータセットの性能を著しく向上させる。
コードはhttps://github.com/vyzuer/ALTReco.comで公開されている。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Improving Model Training via Self-learned Label Representations [5.969349640156469]
より洗練されたラベル表現は、通常のワンホット符号化よりも分類に適していることが示される。
分類タスクの学習中にラベル表現を同時に学習する適応ラベル付き学習(LwAL)アルゴリズムを提案する。
我々のアルゴリズムは無視可能な追加パラメータを導入し、計算オーバーヘッドを最小限に抑える。
論文 参考訳(メタデータ) (2022-09-09T21:10:43Z) - Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。
これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。
異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文 参考訳(メタデータ) (2021-06-08T06:13:11Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Learning to Focus: Cascaded Feature Matching Network for Few-shot Image
Recognition [38.49419948988415]
ディープネットワークは、多数の画像でトレーニングすることで、カテゴリのオブジェクトを正確に認識することを学ぶことができる。
低ショット画像認識タスク(low-shot image recognition task)として知られるメタラーニングの課題は、1つのカテゴリの認識モデルを学ぶためにアノテーション付き画像しか利用できない場合に発生する。
この問題を解決するため,Cascaded Feature Matching Network (CFMN) と呼ばれる手法を提案する。
EmphminiImageNet と Omniglot の2つの標準データセットを用いた数ショット学習実験により,本手法の有効性が確認された。
論文 参考訳(メタデータ) (2021-01-13T11:37:28Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Multi-label Zero-shot Classification by Learning to Transfer from
External Knowledge [36.04579549557464]
マルチラベルゼロショット分類は、入力画像に対する複数の未知のクラスラベルを予測することを目的としている。
本稿では,外部知識の伝達を学習することで,新たなゼロショット分類フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-30T17:26:46Z) - RGB-based Semantic Segmentation Using Self-Supervised Depth Pre-Training [77.62171090230986]
本稿では,任意の意味的RGBセグメンテーション手法の事前学習に使用できる,スケーラブルで自己管理の容易な手法を提案する。
特に、我々の事前学習アプローチでは、深度センサーを用いて得られるラベルを自動生成する。
提案したHNラベルによる自己教師付き事前学習が,ImageNetの事前学習にどのように応用できるかを示す。
論文 参考訳(メタデータ) (2020-02-06T11:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。