論文の概要: Disentangling ID and Modality Effects for Session-based Recommendation
- arxiv url: http://arxiv.org/abs/2404.12969v1
- Date: Fri, 19 Apr 2024 15:54:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-22 14:26:33.391135
- Title: Disentangling ID and Modality Effects for Session-based Recommendation
- Title(参考訳): セッションベースレコメンデーションにおけるディスタングルIDとモダリティ効果
- Authors: Xiaokun Zhang, Bo Xu, Zhaochun Ren, Xiaochen Wang, Hongfei Lin, Fenglong Ma,
- Abstract要約: タスクにおけるIDとモダリティの影響を解消する新しいフレームワークDIMOを提案する。
DIMOは因果推論を通じてレコメンデーションを提供し、さらに説明を生成するための2つのテンプレートを作成する。
- 参考スコア(独自算出の注目度): 46.09367252640389
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Session-based recommendation aims to predict intents of anonymous users based on their limited behaviors. Modeling user behaviors involves two distinct rationales: co-occurrence patterns reflected by item IDs, and fine-grained preferences represented by item modalities (e.g., text and images). However, existing methods typically entangle these causes, leading to their failure in achieving accurate and explainable recommendations. To this end, we propose a novel framework DIMO to disentangle the effects of ID and modality in the task. At the item level, we introduce a co-occurrence representation schema to explicitly incorporate cooccurrence patterns into ID representations. Simultaneously, DIMO aligns different modalities into a unified semantic space to represent them uniformly. At the session level, we present a multi-view self-supervised disentanglement, including proxy mechanism and counterfactual inference, to disentangle ID and modality effects without supervised signals. Leveraging these disentangled causes, DIMO provides recommendations via causal inference and further creates two templates for generating explanations. Extensive experiments on multiple real-world datasets demonstrate the consistent superiority of DIMO over existing methods. Further analysis also confirms DIMO's effectiveness in generating explanations.
- Abstract(参考訳): セッションベースのリコメンデーションは、限られた振る舞いに基づいて匿名ユーザの意図を予測することを目的としている。
ユーザ行動のモデル化には、アイテムIDによって反映される共起パターンと、アイテムのモダリティ(テキストや画像など)によって表現されるきめ細かい好みという、2つの異なる論理的理由がある。
しかし、既存の手法は一般的にこれらの原因を絡め、正確で説明可能なレコメンデーションを達成できなかった。
そこで本研究では,課題におけるIDとモダリティの影響を解消する新しいフレームワークであるDIMOを提案する。
項目レベルでは、共起パターンをID表現に明示的に組み込む共起表現スキーマを導入する。
同時に、DIMOは異なるモダリティを統一意味空間に整列させ、それらを一様に表現する。
セッションレベルでは、教師付き信号なしでIDとモダリティの効果を乱すために、プロキシ機構や逆ファクト推論を含む多視点の自己教師付き不整合を提示する。
これらの絡み合った原因を活用して、DIMOは因果推論を通じてレコメンデーションを提供し、さらに説明を生成するための2つのテンプレートを作成する。
複数の実世界のデータセットに対する大規模な実験は、既存の手法よりもDIMOが一貫した優位性を示している。
さらなる分析により、DIMOが説明の生成に有効であることを確認できる。
関連論文リスト
- A Model-Agnostic Framework for Recommendation via Interest-aware Item
Embeddings [4.989653738257287]
Interest-Aware Capsule Network (IaCN)は、関心指向のアイテム表現を直接学習するモデルに依存しないフレームワークである。
IaCNは補助的なタスクとして機能し、アイテムベースと興味ベースの両方の表現の合同学習を可能にする。
提案手法をベンチマークデータセットで評価し、異なるディープニューラルネットワークを含むさまざまなシナリオを探索する。
論文 参考訳(メタデータ) (2023-08-17T22:40:59Z) - Diffusion Action Segmentation [63.061058214427085]
本稿では,このような反復的洗練の本質的な精神を共用した拡散モデルによる新しい枠組みを提案する。
このフレームワークでは、入力された映像の特徴を条件としてランダムノイズから行動予測を反復的に生成する。
論文 参考訳(メタデータ) (2023-03-31T10:53:24Z) - Understanding and Constructing Latent Modality Structures in Multi-modal
Representation Learning [53.68371566336254]
優れたパフォーマンスの鍵は、完全なモダリティアライメントではなく、有意義な潜在モダリティ構造にある、と我々は主張する。
具体的には,1)モダリティ内正規化のための深い特徴分離損失,2)モダリティ間正規化のためのブラウン橋損失,3)モダリティ内正規化およびモダリティ間正規化のための幾何学的整合損失を設計する。
論文 参考訳(メタデータ) (2023-03-10T14:38:49Z) - UBARv2: Towards Mitigating Exposure Bias in Task-Oriented Dialogs [28.051423938045843]
トレーニング中にダイアログコンテキストのサンプル生成内容にモデルを明示的に公開するセッションレベルサンプリングを提案する。
我々は,マスク戦略R-Maskを用いたドロップアウト型整合性正規化を用いて,モデルの堅牢性と性能をさらに向上する。
UBARv2は、標準化された評価ベンチマークMultiWOZ上で最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-09-15T12:14:46Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - CARE: Coherent Actionable Recourse based on Sound Counterfactual
Explanations [0.0]
本稿では,モデルおよびユーザレベルのデシダータに対処するモジュール型説明フレームワークであるCAREを紹介する。
モデルに依存しないアプローチとして、CAREはブラックボックスモデルに対して複数の多様な説明を生成する。
論文 参考訳(メタデータ) (2021-08-18T15:26:59Z) - Unsupervised Person Re-identification via Simultaneous Clustering and
Consistency Learning [22.008371113710137]
静止画からの視覚的一貫性とトレーニングプロセス中の時間的一貫性を学習することにより、教師なし再IDのプリテキストタスクを設計します。
2つのエンコードされたビューを同じクラスタにグループ化し、ビュー間の視覚的一貫性を高めることで、モデルを最適化する。
論文 参考訳(メタデータ) (2021-04-01T02:10:42Z) - Learning Domain Invariant Representations for Generalizable Person
Re-Identification [71.35292121563491]
ReID(Generalizable person Re-Identification)は、最近のコンピュータビジョンコミュニティで注目を集めている。
DIR-ReID(Domain Invariant Representations for Generalizable Person Re-Identification)という新しい一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-29T18:59:48Z) - Multi-object Tracking with a Hierarchical Single-branch Network [31.680667324595557]
階層的な単一ブランチネットワークに基づくオンライン多目的追跡フレームワークを提案する。
新たなiHOIM損失関数は,2つのサブタスクの目的を統一し,より優れた検出性能を実現する。
MOT16とMOT20データセットの実験結果から,最先端のトラッキング性能が達成できた。
論文 参考訳(メタデータ) (2021-01-06T12:14:58Z) - Sequential Recommendation with Self-Attentive Multi-Adversarial Network [101.25533520688654]
逐次レコメンデーションにおける文脈情報の影響を明示的にモデル化するためのMFGAN(Multi-Factor Generative Adversarial Network)を提案する。
当社のフレームワークは,複数種類の因子情報を組み込むことが柔軟であり,各因子が推奨決定にどのように貢献するかを時間とともに追跡することができる。
論文 参考訳(メタデータ) (2020-05-21T12:28:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。