Fugu-MT 論文翻訳(概要): Disentangling ID and Modality Effects for Session-based Recommendation

論文の概要: Disentangling ID and Modality Effects for Session-based Recommendation

arxiv url: http://arxiv.org/abs/2404.12969v1
Date: Fri, 19 Apr 2024 15:54:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-22 14:26:33.391135
Title: Disentangling ID and Modality Effects for Session-based Recommendation
Title（参考訳）: セッションベースレコメンデーションにおけるディスタングルIDとモダリティ効果
Authors: Xiaokun Zhang, Bo Xu, Zhaochun Ren, Xiaochen Wang, Hongfei Lin, Fenglong Ma,
Abstract要約: タスクにおけるIDとモダリティの影響を解消する新しいフレームワークDIMOを提案する。 DIMOは因果推論を通じてレコメンデーションを提供し、さらに説明を生成するための2つのテンプレートを作成する。
参考スコア（独自算出の注目度）: 46.09367252640389
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Session-based recommendation aims to predict intents of anonymous users based on their limited behaviors. Modeling user behaviors involves two distinct rationales: co-occurrence patterns reflected by item IDs, and fine-grained preferences represented by item modalities (e.g., text and images). However, existing methods typically entangle these causes, leading to their failure in achieving accurate and explainable recommendations. To this end, we propose a novel framework DIMO to disentangle the effects of ID and modality in the task. At the item level, we introduce a co-occurrence representation schema to explicitly incorporate cooccurrence patterns into ID representations. Simultaneously, DIMO aligns different modalities into a unified semantic space to represent them uniformly. At the session level, we present a multi-view self-supervised disentanglement, including proxy mechanism and counterfactual inference, to disentangle ID and modality effects without supervised signals. Leveraging these disentangled causes, DIMO provides recommendations via causal inference and further creates two templates for generating explanations. Extensive experiments on multiple real-world datasets demonstrate the consistent superiority of DIMO over existing methods. Further analysis also confirms DIMO's effectiveness in generating explanations.
Abstract（参考訳）: セッションベースのリコメンデーションは、限られた振る舞いに基づいて匿名ユーザの意図を予測することを目的としている。ユーザ行動のモデル化には、アイテムIDによって反映される共起パターンと、アイテムのモダリティ(テキストや画像など)によって表現されるきめ細かい好みという、2つの異なる論理的理由がある。しかし、既存の手法は一般的にこれらの原因を絡め、正確で説明可能なレコメンデーションを達成できなかった。そこで本研究では,課題におけるIDとモダリティの影響を解消する新しいフレームワークであるDIMOを提案する。項目レベルでは、共起パターンをID表現に明示的に組み込む共起表現スキーマを導入する。同時に、DIMOは異なるモダリティを統一意味空間に整列させ、それらを一様に表現する。セッションレベルでは、教師付き信号なしでIDとモダリティの効果を乱すために、プロキシ機構や逆ファクト推論を含む多視点の自己教師付き不整合を提示する。これらの絡み合った原因を活用して、DIMOは因果推論を通じてレコメンデーションを提供し、さらに説明を生成するための2つのテンプレートを作成する。複数の実世界のデータセットに対する大規模な実験は、既存の手法よりもDIMOが一貫した優位性を示している。さらなる分析により、DIMOが説明の生成に有効であることを確認できる。

関連論文リスト

R2LED: Equipping Retrieval and Refinement in Lifelong User Modeling with Semantic IDs for CTR Prediction [23.668401664583758]
セマンティックIDを用いた生涯ユーザモデリング(R2LED)における検索と改善のための新しいパラダイムを提案する。まず,検索段階における複数経路混合検索手法を提案する。一方,協調的視点と意味的視点の両方から効率よく候補を検索する混合検索機構を提案する。改良のために,経路レベル核融合のための目標認識型クロスアテンションとSIDレベル核融合のためのゲート機構を含むBiレベル核融合リファインメントを設計する。
論文参考訳（メタデータ） (2026-02-06T11:27:20Z)
Adversarial Yet Cooperative: Multi-Perspective Reasoning in Retrieved-Augmented Language Models [72.4149653187766]
本稿ではAdrialversa Reasoning RAG(ARR)というReasoner-Verifierフレームワークを提案する。 ReasonerとVerifierは、回収された証拠を推論し、プロセス認識の利点によってガイドされながら、互いの論理を批判する。複数のベンチマーク実験により,本手法の有効性が示された。
論文参考訳（メタデータ） (2026-01-08T06:57:03Z)
The Best of the Two Worlds: Harmonizing Semantic and Hash IDs for Sequential Recommendation [51.62815306481903]
我々は,SIDとHIDを調和させる新しいフレームワークであるtextbfnameを提案する。具体的には,HIDのユニークなコラボレーティブアイデンティティを保ちながら,SID内のマルチグラニュラーセマンティクスの両方をキャプチャ可能な,デュアルブランチモデリングアーキテクチャを考案する。実世界の3つのデータセットの実験では、名前は、既存のベースラインを越えながら、頭と尾の両方の推奨品質のバランスをとる。
論文参考訳（メタデータ） (2025-12-11T07:50:53Z)
LLaDA-Rec: Discrete Diffusion for Parallel Semantic ID Generation in Generative Recommendation [32.284624021041004]
並列なセマンティックID生成としてレコメンデーションを再構成する離散拡散フレームワークであるLLaDA-Recを提案する。 3つの実世界のデータセットの実験では、LLaDA-RecはIDベースと最先端のジェネレーティブレコメンデータの両方を一貫して上回っている。
論文参考訳（メタデータ） (2025-11-09T07:12:15Z)
Merge and Guide: Unifying Model Merging and Guided Decoding for Controllable Multi-Objective Generation [49.98025799046136]
Merge-And-GuidEは、ガイド付きデコーディングにモデルマージを利用する2段階のフレームワークである。ステージ1では、MAGEはガイダンスとベースモデルの互換性の問題を解決する。ステージ2では、明示的で暗黙的な値モデルを統一的なガイダンスプロキシにマージします。
論文参考訳（メタデータ） (2025-10-04T11:10:07Z)
Reflective Agreement: Combining Self-Mixture of Agents with a Sequence Tagger for Robust Event Extraction [9.746352647419345]
イベント抽出は、構造化されていないテキストからイベントに関する構造化情報を自動的に識別し、抽出する。本稿では,エージェントの自己混合と識別配列タグを併用したハイブリッド手法を提案する。実験では、3つのベンチマークデータセットで既存の最先端イベント抽出手法より優れていることを示す。
論文参考訳（メタデータ） (2025-08-26T18:36:23Z)
Attribute Guidance With Inherent Pseudo-label For Occluded Person Re-identification [16.586742421279137]
Attribute-Guide ReID(AG-ReID)は、追加のデータやアノテーションなしで詳細なセマンティック属性を抽出する新しいフレームワークである。まず、微妙な視覚的特徴を捉えた属性の擬似ラベルを生成し、次に二重誘導機構を導入する。大規模な実験により、AG-ReIDは複数の広く使用されているRe-IDデータセットで最先端の結果が得られることが示された。
論文参考訳（メタデータ） (2025-08-07T03:13:24Z)
Demystifying Sequential Recommendations: Counterfactual Explanations via Genetic Algorithms [7.24542420871739]
SRS(Sequential Recommender Systems)は、ユーザの進化する好みをキャプチャする際、顕著な効果を示した。ブラックボックス"モデルとしてのそれらの固有の複雑さは、説明可能性に重大な課題をもたらす。本研究は,SRSに特化して開発された最初の対実的説明手法を示す。
論文参考訳（メタデータ） (2025-08-05T16:22:45Z)
DiscRec: Disentangled Semantic-Collaborative Modeling for Generative Recommendation [33.152693125551785]
生成的レコメンデーションは、アイテム予測を直接生成する強力なパラダイムとして現れています。現在の手法ではトークン・イテムのミスアライメントとセマンティック・コラボレーティブな信号の絡み合いという2つの重要な課題に直面している。 Disentangled Semantic-Collaborative Signal Modelingを可能にする新しいフレームワークであるDisdisRecを提案する。
論文参考訳（メタデータ） (2025-06-18T15:53:47Z)
BBQRec: Behavior-Bind Quantization for Multi-Modal Sequential Recommendation [15.818669767036592]
本稿では,2列列の量子化とセマンティックス・アウェア・シーケンス・モデリングを備えたBBQRec(Behavior-Bind Multi-modal Quantization for Sequential Recommendation)を提案する。 BBQRecは、コントラストのあるコードブック学習を通じて、ノイズの多いモダリティ特有の特徴からモダリティに依存しない行動パターンを分離する。我々は、量子化された意味関係を用いて自己注意スコアを動的に調整する離散化類似度再重み付け機構を設計する。
論文参考訳（メタデータ） (2025-04-09T07:19:48Z)
Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model [66.91323540178739]
シークエンシャルレコメンデーション(SR)は、ユーザーが過去の行動に基づいて興味を持つかもしれない項目を予測することを目的としている。我々はSRを新しい情報理論の観点から再検討し、逐次モデリング手法がユーザの行動のランダム性と予測不可能性を適切に把握できないことを発見した。ファジィ情報処理理論に触発された本論文では,制限を克服し,ユーザの関心事の進化をよりよく捉えるために,ファジィなインタラクションシーケンスの組を導入する。
論文参考訳（メタデータ） (2024-10-31T14:52:01Z)
Dual Conditional Diffusion Models for Sequential Recommendation [63.82152785755723]
シーケンスレコメンデーションのための二重条件拡散モデル(DCRec)を提案する。 DCRecは2つの条件を前と逆の拡散プロセスに埋め込むことで暗黙的および明示的な情報を統合する。これによってモデルは、明示的なユーザ-イテムインタラクションを活用してレコメンデーションプロセスをガイドしながら、価値あるシーケンシャルおよびコンテキスト情報を保持することができる。
論文参考訳（メタデータ） (2024-10-29T11:51:06Z)
CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文参考訳（メタデータ） (2024-06-25T12:47:04Z)
Diffusion-based Contrastive Learning for Sequential Recommendation [6.3482831836623355]
本稿では,CaDiRecという,文脈対応拡散に基づく逐次推薦のためのコントラスト学習を提案する。 CaDiRecは、コンテキスト対応拡散モデルを使用して、シーケンス内の所定の位置に対する代替アイテムを生成する。フレームワーク全体をエンドツーエンドでトレーニングし、拡散モデルとレコメンデーションモデルの間でアイテムの埋め込みを共有します。
論文参考訳（メタデータ） (2024-05-15T14:20:37Z)
Adaptive In-Context Learning with Large Language Models for Bundle Generation [31.667010709144773]
本稿では、異なるユーザセッションに基づいて、パーソナライズされたバンドル生成と、その基盤となる意図推論という2つの相互関連タスクについて検討する。大規模言語モデル(LLM)の推論能力に着想を得て,適応型インコンテキスト学習パラダイムを提案する。提案手法の有効性を実世界の3つのデータセットで実証した。
論文参考訳（メタデータ） (2023-12-26T08:24:24Z)
Diffusion Action Segmentation [63.061058214427085]
本稿では,このような反復的洗練の本質的な精神を共用した拡散モデルによる新しい枠組みを提案する。このフレームワークでは、入力された映像の特徴を条件としてランダムノイズから行動予測を反復的に生成する。
論文参考訳（メタデータ） (2023-03-31T10:53:24Z)
Understanding and Constructing Latent Modality Structures in Multi-modal Representation Learning [53.68371566336254]
優れたパフォーマンスの鍵は、完全なモダリティアライメントではなく、有意義な潜在モダリティ構造にある、と我々は主張する。具体的には,1)モダリティ内正規化のための深い特徴分離損失,2)モダリティ間正規化のためのブラウン橋損失,3)モダリティ内正規化およびモダリティ間正規化のための幾何学的整合損失を設計する。
論文参考訳（メタデータ） (2023-03-10T14:38:49Z)
UBARv2: Towards Mitigating Exposure Bias in Task-Oriented Dialogs [28.051423938045843]
トレーニング中にダイアログコンテキストのサンプル生成内容にモデルを明示的に公開するセッションレベルサンプリングを提案する。我々は,マスク戦略R-Maskを用いたドロップアウト型整合性正規化を用いて,モデルの堅牢性と性能をさらに向上する。 UBARv2は、標準化された評価ベンチマークMultiWOZ上で最先端の性能を実現する。
論文参考訳（メタデータ） (2022-09-15T12:14:46Z)
CARE: Coherent Actionable Recourse based on Sound Counterfactual Explanations [0.0]
本稿では,モデルおよびユーザレベルのデシダータに対処するモジュール型説明フレームワークであるCAREを紹介する。モデルに依存しないアプローチとして、CAREはブラックボックスモデルに対して複数の多様な説明を生成する。
論文参考訳（メタデータ） (2021-08-18T15:26:59Z)
Unsupervised Person Re-identification via Simultaneous Clustering and Consistency Learning [22.008371113710137]
静止画からの視覚的一貫性とトレーニングプロセス中の時間的一貫性を学習することにより、教師なし再IDのプリテキストタスクを設計します。 2つのエンコードされたビューを同じクラスタにグループ化し、ビュー間の視覚的一貫性を高めることで、モデルを最適化する。
論文参考訳（メタデータ） (2021-04-01T02:10:42Z)
Learning Domain Invariant Representations for Generalizable Person Re-Identification [71.35292121563491]
ReID(Generalizable person Re-Identification)は、最近のコンピュータビジョンコミュニティで注目を集めている。 DIR-ReID(Domain Invariant Representations for Generalizable Person Re-Identification)という新しい一般化フレームワークを提案する。
論文参考訳（メタデータ） (2021-03-29T18:59:48Z)
Sequential Recommendation with Self-Attentive Multi-Adversarial Network [101.25533520688654]
逐次レコメンデーションにおける文脈情報の影響を明示的にモデル化するためのMFGAN(Multi-Factor Generative Adversarial Network)を提案する。当社のフレームワークは,複数種類の因子情報を組み込むことが柔軟であり,各因子が推奨決定にどのように貢献するかを時間とともに追跡することができる。
論文参考訳（メタデータ） (2020-05-21T12:28:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。