論文の概要: MARCO: A Cooperative Knowledge Transfer Framework for Personalized Cross-domain Recommendations
- arxiv url: http://arxiv.org/abs/2510.04508v1
- Date: Mon, 06 Oct 2025 05:49:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.697832
- Title: MARCO: A Cooperative Knowledge Transfer Framework for Personalized Cross-domain Recommendations
- Title(参考訳): MARCO: 個人化されたクロスドメインレコメンデーションのための協調的知識伝達フレームワーク
- Authors: Lili Xie, Yi Zhang, Ruihong Qiu, Jiajun Liu, Sen Wang,
- Abstract要約: MARCOはマルチエージェント強化学習ベースのクロスドメインレコメンデーションフレームワークである。
協調的なマルチエージェント強化学習を活用し、各エージェントは個々のソースドメインからのコントリビューションを推定する。
4つのベンチマークデータセットに対する実験は、最先端の手法よりもMARCOの方が優れた性能を示している。
- 参考スコア(独自算出の注目度): 23.945049006150555
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommender systems frequently encounter data sparsity issues, particularly when addressing cold-start scenarios involving new users or items. Multi-source cross-domain recommendation (CDR) addresses these challenges by transferring valuable knowledge from multiple source domains to enhance recommendations in a target domain. However, existing reinforcement learning (RL)-based CDR methods typically rely on a single-agent framework, leading to negative transfer issues caused by inconsistent domain contributions and inherent distributional discrepancies among source domains. To overcome these limitations, MARCO, a Multi-Agent Reinforcement Learning-based Cross-Domain recommendation framework, is proposed. It leverages cooperative multi-agent reinforcement learning, where each agent is dedicated to estimating the contribution from an individual source domain, effectively managing credit assignment and mitigating negative transfer. In addition, an entropy-based action diversity penalty is introduced to enhance policy expressiveness and stabilize training by encouraging diverse agents' joint actions. Extensive experiments across four benchmark datasets demonstrate MARCO's superior performance over state-of-the-art methods, highlighting its robustness and strong generalization capabilities. The code is at https://github.com/xiewilliams/MARCO.
- Abstract(参考訳): リコメンダシステムは、特に新しいユーザやアイテムを含むコールドスタートシナリオに対処する場合、しばしばデータ空間の問題に遭遇する。
マルチソースクロスドメインレコメンデーション(CDR)は、複数のソースドメインから貴重な知識を転送して、ターゲットドメインでのレコメンデーションを強化することで、これらの課題に対処する。
しかし、既存の強化学習(RL)ベースのCDR法は、典型的には単一エージェントフレームワークに依存しており、一貫性のないドメインの寄与とソースドメイン間の固有の分布の相違に起因する負の転送問題を引き起こす。
これらの制限を克服するため、マルチエージェント強化学習ベースのクロスドメインレコメンデーションフレームワークであるMARCOが提案されている。
協調型マルチエージェント強化学習を活用し、各エージェントは個々のソースドメインからのコントリビューションを推定し、クレジットの割り当てを効果的に管理し、負の転送を緩和する。
さらに,多様なエージェントの協調行動を促進することにより,政策表現力の向上と訓練の安定化を図るために,エントロピーに基づく行動多様性ペナルティを導入する。
4つのベンチマークデータセットにわたる大規模な実験は、MARCOの最先端メソッドよりも優れたパフォーマンスを示し、その堅牢性と強力な一般化能力を強調している。
コードはhttps://github.com/xiewilliams/MARCOにある。
関連論文リスト
- Enhancing Transferability and Consistency in Cross-Domain Recommendations via Supervised Disentanglement [13.553355329509243]
クロスドメインレコメンデーションは、ドメイン間で知識を伝達することで、データの疎さを軽減することを目的としている。
分散表現学習は、複雑なユーザの好みをモデル化するための効果的なソリューションを提供する。
本稿では,GNN を拡張したエンコーダデコーダフレームワーク DGCDR を提案する。
論文 参考訳(メタデータ) (2025-07-23T01:29:45Z) - Generative Multi-Target Cross-Domain Recommendation [48.54929268144516]
本稿では、多目的クロスドメインレコメンデーションのためのジェネレーティブパラダイムベースのアプローチであるGCCを紹介する。
GMCの中核となる考え方は、意味的に定量化された離散アイテム識別子を多分野知識を統合する媒体として活用することである。
5つの公開データセットに関する大規模な実験は、GCCの有効性を実証している。
論文 参考訳(メタデータ) (2025-07-17T07:44:05Z) - LLM-RecG: A Semantic Bias-Aware Framework for Zero-Shot Sequential Recommendation [5.512301280728178]
ゼロショットクロスドメインシーケンシャルレコメンデーション(ZCDSR)は、追加のトレーニングや微調整なしで、目に見えないドメインでの予測を可能にする。
大規模言語モデル(LLM)の最近の進歩は、ドメイン間の知識伝達を容易にすることで、ZCDSRを大幅に強化している。
本稿では,アイテムレベルとシーケンシャルレベルの両方において,ドメイン間のアライメントを改善するセマンティックバイアス対応フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-31T15:43:21Z) - Multisource Collaborative Domain Generalization for Cross-Scene Remote Sensing Image Classification [57.945437355714155]
クロスシーン画像分類は, 異なる分布領域のアノテート領域に, 地中物質の事前の知識を伝達することを目的としている。
既存のアプローチでは、未確認のターゲットドメインへの単一ソースドメインの一般化に重点を置いている。
マルチソースリモートセンシングデータの均一性と不均一性特性に基づく,新しいマルチソース協調型ドメイン一般化フレームワーク(MS-CDG)を提案する。
論文 参考訳(メタデータ) (2024-12-05T06:15:08Z) - Learning From Good Trajectories in Offline Multi-Agent Reinforcement
Learning [98.07495732562654]
オフラインマルチエージェント強化学習(MARL)は、事前コンパイルされたデータセットから効果的なマルチエージェントポリシーを学ぶことを目的としている。
オフラインのMARLが学んだエージェントは、しばしばこのランダムなポリシーを継承し、チーム全体のパフォーマンスを脅かす。
この問題に対処するために,共有個人軌道(SIT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-28T18:11:26Z) - RACA: Relation-Aware Credit Assignment for Ad-Hoc Cooperation in
Multi-Agent Deep Reinforcement Learning [55.55009081609396]
本稿では、アドホックな協調シナリオにおいてゼロショットの一般化を実現するRACA(Relation-Aware Credit Assignment)と呼ばれる新しい手法を提案する。
RACAは、エージェント間のトポロジ構造を符号化するために、グラフベースのエンコーダ関係を利用する。
提案手法は,StarCraftIIマイクロマネジメントベンチマークとアドホック協調シナリオのベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2022-06-02T03:39:27Z) - Diverse Preference Augmentation with Multiple Domains for Cold-start
Recommendations [92.47380209981348]
メタラーニングをベースとした多元的ドメインを用いた多元的推論拡張フレームワークを提案する。
我々は、疎結合の場合の過度な適合を扱うために、新しい関心領域において多様な評価を生成する。
これらの評価は、選好メタラーナーを学ぶためのメタトレーニング手順に導入され、優れた一般化能力が得られる。
論文 参考訳(メタデータ) (2022-04-01T10:10:50Z) - Learning Cooperative Multi-Agent Policies with Partial Reward Decoupling [13.915157044948364]
マルチエージェント強化学習をスケールする上で重要な障害の1つは、個々のエージェントの行動にクレジットを割り当てることである。
本稿では,このクレジット代入問題に対して,PRD(textitpartial reward decoupling)と呼ぶアプローチで対処する。
PRDは、大規模な協調的マルチエージェントRL問題を、エージェントのサブセットを含む分離されたサブプロブレムに分解し、クレジット割り当てを単純化する。
論文 参考訳(メタデータ) (2021-12-23T17:48:04Z) - META: Mimicking Embedding via oThers' Aggregation for Generalizable
Person Re-identification [68.39849081353704]
Domain Generalizable (DG) Person Re-identification (ReID)は、トレーニング時に対象のドメインデータにアクセスすることなく、見えないドメインをまたいでテストすることを目的としている。
本稿では,DG ReID のための OThers' Aggregation (META) を用いた Mimicking Embedding という新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T08:06:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。