論文の概要: Pre-training Graph Transformer with Multimodal Side Information for
Recommendation
- arxiv url: http://arxiv.org/abs/2010.12284v2
- Date: Thu, 7 Jan 2021 10:39:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 00:03:53.254637
- Title: Pre-training Graph Transformer with Multimodal Side Information for
Recommendation
- Title(参考訳): 勧告のためのマルチモーダル側情報付き事前学習グラフ変換器
- Authors: Yong Liu, Susen Yang, Chenyi Lei, Guoxin Wang, Haihong Tang, Juyong
Zhang, Aixin Sun, Chunyan Miao
- Abstract要約: 本稿では,項目側情報とその関連性を考慮した事前学習戦略を提案する。
我々はMCNSamplingという新しいサンプリングアルゴリズムを開発し、各項目のコンテキスト近傍を選択する。
The proposed Pre-trained Multimodal Graph Transformer (PMGT) learns item representations with two objectives: 1) graph structure reconstruction, 2) masked node feature reconstruction。
- 参考スコア(独自算出の注目度): 82.4194024706817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Side information of items, e.g., images and text description, has shown to be
effective in contributing to accurate recommendations. Inspired by the recent
success of pre-training models on natural language and images, we propose a
pre-training strategy to learn item representations by considering both item
side information and their relationships. We relate items by common user
activities, e.g., co-purchase, and construct a homogeneous item graph. This
graph provides a unified view of item relations and their associated side
information in multimodality. We develop a novel sampling algorithm named
MCNSampling to select contextual neighbors for each item. The proposed
Pre-trained Multimodal Graph Transformer (PMGT) learns item representations
with two objectives: 1) graph structure reconstruction, and 2) masked node
feature reconstruction. Experimental results on real datasets demonstrate that
the proposed PMGT model effectively exploits the multimodality side information
to achieve better accuracies in downstream tasks including item recommendation,
item classification, and click-through ratio prediction. We also report a case
study of testing the proposed PMGT model in an online setting with 600 thousand
users.
- Abstract(参考訳): 画像やテキスト記述などの項目の側面情報は、正確な推奨に寄与することが示されている。
近年の自然言語と画像の事前学習モデルの成功に触発されて,項目情報とその関連を考慮し,項目表現を学習する事前学習戦略を提案する。
共通のユーザアクティビティ(例えば、共同購入)によってアイテムを関連付け、均質なアイテムグラフを構築する。
このグラフは、アイテム関係とその関連側情報を多モードで統一したビューを提供する。
我々はMCNSamplingという新しいサンプリングアルゴリズムを開発し、各項目のコンテキスト近傍を選択する。
PMGT (Pre-trained Multimodal Graph Transformer) は2つの目的を持つ項目表現を学習する。
1)グラフ構造再構築,及び
2)マスキングノード機能再構成。
実データを用いた実験結果から,提案したPMGTモデルは,項目推薦や項目分類,クリックスルー比の予測など,下流タスクの精度向上に有効であることが示された。
また,提案したPMGTモデルを6万人のユーザを対象としたオンライン環境でテストするケーススタディを報告する。
関連論文リスト
- HeGraphAdapter: Tuning Multi-Modal Vision-Language Models with Heterogeneous Graph Adapter [19.557300178619382]
本稿では,下流タスクに対するVLMのチューニングを実現するために,新しいヘテロジニアスグラフアダプタを提案する。
我々は、下流タスクの多モード構造知識を探索するために、特定の不均一グラフニューラルネットワークを用いる。
11のベンチマークデータセットの実験結果は、提案したHeGraphAdapterの有効性とメリットを示している。
論文 参考訳(メタデータ) (2024-10-10T12:20:58Z) - Information Screening whilst Exploiting! Multimodal Relation Extraction
with Feature Denoising and Multimodal Topic Modeling [96.75821232222201]
既存のマルチモーダル関係抽出(MRE)研究は、内部情報過剰利用と外部情報過多という2つの共存課題に直面している。
内部情報スクリーニングと外部情報活用を同時に実現する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-19T14:56:57Z) - Cross-view Graph Contrastive Representation Learning on Partially
Aligned Multi-view Data [52.491074276133325]
マルチビュー表現学習は、過去数十年間で急速に発展し、多くの分野に応用されてきた。
本稿では,多視点情報を統合してデータアライメントを行い,潜在表現を学習する,新しいクロスビューグラフコントラスト学習フレームワークを提案する。
複数の実データを用いて実験を行い,クラスタリングおよび分類作業における提案手法の有効性を示した。
論文 参考訳(メタデータ) (2022-11-08T09:19:32Z) - MMGA: Multimodal Learning with Graph Alignment [8.349066399479938]
本稿では,グラフ(ソーシャルネットワーク)や画像,テキストなどの情報をソーシャルメディアに組み込むための,新しいマルチモーダル事前学習フレームワークMMGAを提案する。
MMGAでは,画像とテキストエンコーダを最適化するために,多段階のグラフアライメント機構が提案されている。
われわれのデータセットは、グラフ付き初のソーシャルメディアマルチモーダルデータセットであり、将来の研究を促進するために200万の投稿に基づいて特定のトピックをラベル付けした6万人のユーザーからなる。
論文 参考訳(メタデータ) (2022-10-18T15:50:31Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Mining Latent Structures for Multimedia Recommendation [46.70109406399858]
本稿では,マルチモーダル再圧縮のためのLATent sTructureマイニング手法を提案する。
各モダリティの項目構造を学び、複数のモダリティを集約して潜在アイテムグラフを得る。
学習した潜在グラフに基づいてグラフ畳み込みを行い、アイテム表現に高次項目親和性を明示的に注入する。
論文 参考訳(メタデータ) (2021-04-19T03:50:24Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Joint Item Recommendation and Attribute Inference: An Adaptive Graph
Convolutional Network Approach [61.2786065744784]
レコメンデーションシステムでは、ユーザとアイテムは属性に関連付けられ、ユーザはアイテムの好みを表示する。
ユーザ(item)属性をアノテートすることは労働集約的なタスクであるため、属性値が欠落している多くの属性値と不完全であることが多い。
本稿では,共同項目推薦と属性推論のための適応グラフ畳み込みネットワーク(AGCN)アプローチを提案する。
論文 参考訳(メタデータ) (2020-05-25T10:50:01Z) - Rich-Item Recommendations for Rich-Users: Exploiting Dynamic and Static
Side Information [20.176329366180934]
ユーザや推奨項目が複数のエンティティタイプを持つリッチなデータ構造であるレコメンデーションシステムの問題について検討する。
我々は、現代の現実世界のレコメンデーションの複雑さを捉えた問題に対する一般的な定式化を提供する。
本稿では,我々の定式化とMEDRESアーキテクチャの2つの実世界のケーススタディを示す。
論文 参考訳(メタデータ) (2020-01-28T17:53:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。