論文の概要: Pareto Invariant Representation Learning for Multimedia Recommendation
- arxiv url: http://arxiv.org/abs/2308.04706v2
- Date: Wed, 23 Aug 2023 18:47:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 17:21:05.168240
- Title: Pareto Invariant Representation Learning for Multimedia Recommendation
- Title(参考訳): マルチメディアレコメンデーションのためのパレート不変表現学習
- Authors: Shanshan Huang, Haoxuan Li, Qingsong Li, Chunyuan Zheng, Li Liu
- Abstract要約: IID-OOD多目的最適化の観点から,相互相関の影響を緩和するPaInvRLというフレームワークを提案する。
提案したPaInvRLと3つの公開マルチメディアレコメンデーションデータセットの最先端レコメンデーションモデルを比較した。
- 参考スコア(独自算出の注目度): 13.731077361644438
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimedia recommendation involves personalized ranking tasks, where
multimedia content is usually represented using a generic encoder. However,
these generic representations introduce spurious correlations that fail to
reveal users' true preferences. Existing works attempt to alleviate this
problem by learning invariant representations, but overlook the balance between
independent and identically distributed (IID) and out-of-distribution (OOD)
generalization. In this paper, we propose a framework called Pareto Invariant
Representation Learning (PaInvRL) to mitigate the impact of spurious
correlations from an IID-OOD multi-objective optimization perspective, by
learning invariant representations (intrinsic factors that attract user
attention) and variant representations (other factors) simultaneously.
Specifically, PaInvRL includes three iteratively executed modules: (i)
heterogeneous identification module, which identifies the heterogeneous
environments to reflect distributional shifts for user-item interactions; (ii)
invariant mask generation module, which learns invariant masks based on the
Pareto-optimal solutions that minimize the adaptive weighted Invariant Risk
Minimization (IRM) and Empirical Risk (ERM) losses; (iii) convert module, which
generates both variant representations and item-invariant representations for
training a multi-modal recommendation model that mitigates spurious
correlations and balances the generalization performance within and cross the
environmental distributions. We compare the proposed PaInvRL with
state-of-the-art recommendation models on three public multimedia
recommendation datasets (Movielens, Tiktok, and Kwai), and the experimental
results validate the effectiveness of PaInvRL for both within- and
cross-environmental learning.
- Abstract(参考訳): マルチメディアレコメンデーションには、パーソナライズされたランキングタスクが含まれており、通常、マルチメディアコンテンツはジェネリックエンコーダを使って表現される。
しかし、これらの汎用表現は、ユーザの真の嗜好を明らかにするのに失敗する急激な相関をもたらす。
既存の研究は不変表現を学習することでこの問題を緩和しようとするが、独立分布(iid)と同一分布(ood)の均衡を見落としている。
本稿では,IID-OOD多目的最適化の観点から,不変表現(ユーザの注意を惹きつける固有の要因)と変動表現(他の要因)を同時に学習することにより,刺激的相関の影響を緩和するPareto Invariant Representation Learning(PaInvRL)というフレームワークを提案する。
具体的には、PaInvRLには3つの反復実行モジュールが含まれている。
(i)異種識別モジュールは、ユーザ・テーマ間相互作用の分布シフトを反映する異種環境を識別する。
(II)適応重み付き不変リスク最小化(IRM)と経験的リスク損失(ERM)を最小限に抑えたパレート最適解に基づいて不変マスクを学習する不変マスク生成モジュール
(iii)変種表現とアイテム不変表現の両方を生成して、スプリアス相関を緩和し、環境分布内の一般化性能のバランスをとるマルチモーダルレコメンデーションモデルを訓練する変換モジュール。
提案したPaInvRLと3つの公開マルチメディアレコメンデーションデータセット(Movielens,Tiktok,Kwai)の最先端のレコメンデーションモデルを比較し,PaInvRLの内外の学習への適用性を検証する。
関連論文リスト
- Sample Complexity Characterization for Linear Contextual MDPs [67.79455646673762]
文脈決定プロセス(CMDP)は、遷移カーネルと報酬関数がコンテキスト変数によってインデックス付けされた異なるMDPで時間とともに変化できる強化学習のクラスを記述する。
CMDPは、時間とともに変化する環境で多くの現実世界のアプリケーションをモデル化するための重要なフレームワークとして機能する。
CMDPを2つの線形関数近似モデルで検討する: 文脈変化表現とすべての文脈に対する共通線形重み付きモデルIと、すべての文脈に対する共通表現と文脈変化線形重み付きモデルIIである。
論文 参考訳(メタデータ) (2024-02-05T03:25:04Z) - Distribution-Dependent Rates for Multi-Distribution Learning [26.38831409926518]
最近のマルチディストリビューション学習フレームワークは、環境との動的相互作用において、この目的に対処する。
我々は, MDL体制における分布依存性の保証を行い, 最適値以下の差でスケールし, その結果, 試料サイズへの依存度が向上することを示した。
適応型楽観的アルゴリズム LCB-DR を考案し,マルチアームバンディット文学における均一性と楽観的アロケーションのコントラストを反映した。
論文 参考訳(メタデータ) (2023-12-20T15:50:16Z) - PiRL: Participant-Invariant Representation Learning for Healthcare [14.986449254864572]
参加者不変表現を学習する表現学習フレームワークPiRLを提案する。
予備的な結果として,提案手法はベースラインに比べて5%ほど精度が向上していることがわかった。
論文 参考訳(メタデータ) (2022-11-21T18:16:49Z) - Meta-Causal Feature Learning for Out-of-Distribution Generalization [71.38239243414091]
本稿では,協調タスク生成モジュール (BTG) とメタ因果特徴学習モジュール (MCFL) を含む,バランス付きメタ因果学習器 (BMCL) を提案する。
BMCLは、分類のためのクラス不変の視覚領域を効果的に識別し、最先端の手法の性能を向上させるための一般的なフレームワークとして機能する。
論文 参考訳(メタデータ) (2022-08-22T09:07:02Z) - Variational Distillation for Multi-View Learning [104.17551354374821]
我々は,多視点表現学習における2つの重要な特徴を利用するために,様々な情報ボトルネックを設計する。
厳密な理論的保証の下で,本手法は,観察とセマンティックラベルの内在的相関の把握を可能にする。
論文 参考訳(メタデータ) (2022-06-20T03:09:46Z) - Abstractive Sentence Summarization with Guidance of Selective Multimodal
Reference [3.505062507621494]
モーダル間の相互関係を考慮したマルチモーダル階層選択変換器(mhsf)モデルを提案する。
提案したmhsfモデルの汎用性を,事前学習+微調整および新鮮トレーニング戦略を用いて評価した。
論文 参考訳(メタデータ) (2021-08-11T09:59:34Z) - Permutation Invariant Policy Optimization for Mean-Field Multi-Agent
Reinforcement Learning: A Principled Approach [128.62787284435007]
本稿では,平均場近似ポリシ最適化(MF-PPO)アルゴリズムを提案する。
我々は,MF-PPOが収束のサブ線形速度で世界的最適政策を達成することを証明した。
特に、置換不変ニューラルアーキテクチャによって引き起こされる誘導バイアスは、MF-PPOが既存の競合より優れていることを示す。
論文 参考訳(メタデータ) (2021-05-18T04:35:41Z) - Invariant Causal Prediction for Block MDPs [106.63346115341862]
環境全体にわたる一般化は、実世界の課題への強化学習アルゴリズムの適用の成功に不可欠である。
本稿では,多環境環境における新しい観測を一般化するモデル不適合状態抽象化(MISA)を学習するための不変予測法を提案する。
論文 参考訳(メタデータ) (2020-03-12T21:03:01Z) - Variational Inference for Deep Probabilistic Canonical Correlation
Analysis [49.36636239154184]
線形多視点層と深層生成ネットワークを観測モデルとして構成した深部確率的多視点モデルを提案する。
潜在確率多視点層の後方分布を近似した効率的な変分推論法を開発した。
任意の数のビューを持つモデルへの一般化も提案されている。
論文 参考訳(メタデータ) (2020-03-09T17:51:15Z) - NestedVAE: Isolating Common Factors via Weak Supervision [45.366986365879505]
我々は、バイアス低減の課題と、ドメイン間で共通する分離要因の関係を同定する。
共通因子を分離するために、潜伏変数モデルの理論と情報ボトルネック理論を組み合わせる。
共有重みを持つ2つの外部VAEは入力を再構成し、潜伏空間を推論し、一方、ネストされたVAEはペア化された画像の潜伏表現から1つの画像の潜伏表現を再構成しようとする。
論文 参考訳(メタデータ) (2020-02-26T15:49:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。