論文の概要: LLM-CoT Enhanced Graph Neural Recommendation with Harmonized Group Policy Optimization
- arxiv url: http://arxiv.org/abs/2505.12396v1
- Date: Sun, 18 May 2025 12:50:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.209966
- Title: LLM-CoT Enhanced Graph Neural Recommendation with Harmonized Group Policy Optimization
- Title(参考訳): 調和型グループポリシー最適化を用いたLLM-CoT強化グラフニューラルレコメンデーション
- Authors: Hailong Luo, Bin Wu, Hongyong Jia, Qingqing Zhu, Lianlei Shan,
- Abstract要約: グラフニューラルネットワーク(GNN)は相互作用関係をモデル化することによって高度なレコメンデータシステムを備えている。
既存のグラフベースのレコメンダはスパースID機能に依存しており、テキスト情報を十分に活用していない。
我々はLGHRec (LLM-CoT強化グラフニューラルレコメンデーションと調和群ポリシー最適化)を紹介する。
- 参考スコア(独自算出の注目度): 6.534288158740448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph neural networks (GNNs) have advanced recommender systems by modeling interaction relationships. However, existing graph-based recommenders rely on sparse ID features and do not fully exploit textual information, resulting in low information density within representations. Furthermore, graph contrastive learning faces challenges. Random negative sampling can introduce false negative samples, while fixed temperature coefficients cannot adapt to the heterogeneity of different nodes. In addition, current efforts to enhance recommendations with large language models (LLMs) have not fully utilized their Chain-of-Thought (CoT) reasoning capabilities to guide representation learning. To address these limitations, we introduces LGHRec (LLM-CoT Enhanced Graph Neural Recommendation with Harmonized Group Policy Optimization). This framework leverages the CoT reasoning ability of LLMs to generate semantic IDs, enriching reasoning processes and improving information density and semantic quality of representations. Moreover, we design a reinforcement learning algorithm, Harmonized Group Policy Optimization (HGPO), to optimize negative sampling strategies and temperature coefficients in contrastive learning. This approach enhances long-tail recommendation performance and ensures optimization consistency across different groups. Experimental results on three datasets demonstrate that LGHRec improves representation quality through semantic IDs generated by LLM's CoT reasoning and effectively boosts contrastive learning with HGPO. Our method outperforms several baseline models. The code is available at: https://anonymous.4open.science/r/LLM-Rec.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)は相互作用関係をモデル化することによって高度なレコメンデータシステムを備えている。
しかし、既存のグラフベースのレコメンダはスパースID機能に依存しており、テキスト情報を十分に活用していないため、表現内の情報密度は低い。
さらに、グラフの対照的な学習は課題に直面します。
ランダム陰性サンプリングは偽陰性サンプルを導入できるが、固定温度係数は異なるノードの不均一性に適応できない。
さらに,大規模言語モデル (LLM) を用いたレコメンデーションの強化に向けた現在の取り組みでは,表現学習を指導するためのChain-of-Thought (CoT) 推論機能が十分に活用されていない。
これらの制約に対処するため、LGHRec (LLM-CoT Enhanced Graph Neural Recommendation with Harmonized Group Policy Optimization)を紹介した。
このフレームワークは、LLMのCoT推論能力を利用してセマンティックIDを生成し、推論プロセスを強化し、情報密度と表現のセマンティック品質を向上させる。
さらに,相関学習における負のサンプリング戦略と温度係数を最適化するために,強化学習アルゴリズムであるHGPO(Harmonized Group Policy Optimization)を設計する。
このアプローチはロングテールレコメンデーションのパフォーマンスを高め、異なるグループ間で最適化の整合性を確保する。
3つのデータセットによる実験結果から,LGHRecはLLMのCoT推論によって生成されるセマンティックIDによって表現品質を向上し,HGPOによるコントラスト学習を効果的に促進することが示された。
我々の手法はいくつかのベースラインモデルより優れている。
コードは https://anonymous.4open.science/r/LLM-Rec で公開されている。
関連論文リスト
- LLM-Augmented Graph Neural Recommenders: Integrating User Reviews [2.087411180679868]
本稿では,グラフニューラルネットワーク(GNN)ベースのモデルと大規模言語モデル(LLM)を用いて,レビューアウェアな表現を生成するフレームワークを提案する。
提案手法は,ユーザの行動信号と言語信号の両方が効果的に捕捉されるように,テキストから得られる特徴に対するユーザとテムの相互作用のバランスをとる。
論文 参考訳(メタデータ) (2025-04-03T00:40:09Z) - Training Large Recommendation Models via Graph-Language Token Alignment [53.3142545812349]
本稿では,グラフ言語トークンアライメントによる大規模推薦モデルのトレーニングを行う新しいフレームワークを提案する。
インタラクショングラフからアイテムとユーザノードを事前訓練されたLLMトークンにアライメントすることで、GLTAはLLMの推論能力を効果的に活用する。
さらに、エンドツーエンドのアイテム予測のためのトークンアライメントを最適化するために、GLLM(Graph-Language Logits Matching)を導入する。
論文 参考訳(メタデータ) (2025-02-26T02:19:10Z) - Improving Autoregressive Visual Generation with Cluster-Oriented Token Prediction [52.09472099976885]
IARは、LLMベースのビジュアル生成モデルのトレーニング効率と生成品質を向上させる改良された自動回帰ビジュアル生成方法である。
提案手法は,モデルのトレーニング効率と性能を100Mから1.4Bに継続的に向上させ,同じFIDを達成しながらトレーニング時間を半減させる。
論文 参考訳(メタデータ) (2025-01-01T15:58:51Z) - Multi-Task Curriculum Graph Contrastive Learning with Clustering Entropy Guidance [25.5510013711661]
本稿ではクラスタリング誘導型Curriculum Graph contrastive Learning(CCGL)フレームワークを提案する。
CCGLは以下のグラフ拡張とコントラスト学習のガイダンスとしてクラスタリングエントロピーを使用している。
実験の結果,CCGLは最先端の競合に比べて優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-22T02:18:47Z) - End-to-end Learnable Clustering for Intent Learning in Recommendation [54.157784572994316]
我々は、アンダーラインELCRecと呼ばれる新しい意図学習手法を提案する。
振る舞い表現学習をUnderlineEnd-to-end UnderlineLearnable UnderlineClusteringフレームワークに統合する。
1億3000万ページビューの産業レコメンデーションシステムに本手法をデプロイし,有望な結果を得る。
論文 参考訳(メタデータ) (2024-01-11T15:22:55Z) - LightGCL: Simple Yet Effective Graph Contrastive Learning for
Recommendation [9.181689366185038]
グラフニューラルクラスタリングネットワーク(GNN)は、グラフベースのレコメンデータシステムのための強力な学習手法である。
本稿では,単純なグラフコントラスト学習パラダイムであるLightGCLを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:16:21Z) - Adversarial Learning Data Augmentation for Graph Contrastive Learning in
Recommendation [56.10351068286499]
グラフコントラスト学習のための学習可能なデータ拡張法(LDA-GCL)を提案する。
提案手法は,InfoMin と InfoMax の原則に従うデータ強化学習とグラフコントラスト学習を含む。
本手法は,データ拡張とユーザやアイテムの効果的な表現を学習するために,対向損失関数を最適化する。
論文 参考訳(メタデータ) (2023-02-05T06:55:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。