論文の概要: GFlowGR: Fine-tuning Generative Recommendation Frameworks with Generative Flow Networks
- arxiv url: http://arxiv.org/abs/2506.16114v1
- Date: Thu, 19 Jun 2025 08:04:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.987581
- Title: GFlowGR: Fine-tuning Generative Recommendation Frameworks with Generative Flow Networks
- Title(参考訳): GFlowGR: ジェネレーティブフローネットワークを備えた微調整ジェネレーティブレコメンデーションフレームワーク
- Authors: Yejing Wang, Shengyu Zhou, Jinyu Lu, Qidong Liu, Xinhang Li, Wenlin Zhang, Feng Li, Pengjie Wang, Jian Xu, Bo Zheng, Xiangyu Zhao,
- Abstract要約: 本稿では、生成勧告(GR)を多段階生成タスクとして扱い、GFlowNetsベースの微調整フレームワーク(GFlowGR)を構築する。
提案フレームワークは,従来のレコメンデータシステムからの協調的知識を統合し,適応的軌道サンプリングと包括的報酬モデルを作成する。
- 参考スコア(独自算出の注目度): 36.39484385717512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative recommendations (GR), which usually include item tokenizers and generative Large Language Models (LLMs), have demonstrated remarkable success across a wide range of scenarios. The majority of existing research efforts primarily concentrate on developing powerful item tokenizers or advancing LLM decoding strategies to attain superior performance. However, the critical fine-tuning step in GR frameworks, which is essential for adapting LLMs to recommendation data, remains largely unexplored. Current approaches predominantly rely on either the next-token prediction loss of supervised fine-tuning (SFT) or recommendationspecific direct preference optimization (DPO) strategies. Both methods ignore the exploration of possible positive unobserved samples, which is commonly referred to as the exposure bias problem. To mitigate this problem, this paper treats the GR as a multi-step generation task and constructs a GFlowNets-based fine-tuning framework (GFlowGR). The proposed framework integrates collaborative knowledge from traditional recommender systems to create an adaptive trajectory sampler and a comprehensive reward model. Leveraging the diverse generation property of GFlowNets, along with sampling and heuristic weighting techniques, GFlowGR emerges as a promising approach to mitigate the exposure bias problem. Extensive empirical results on two real-world datasets and with two different GR backbones highlight the effectiveness and robustness of GFlowGR.
- Abstract(参考訳): ジェネレーティブレコメンデーション(GR)は通常、アイテムトークンやジェネレーティブ大型言語モデル(LLM)を含むが、幅広いシナリオで顕著な成功を収めている。
既存の研究成果の大部分は、強力なアイテムトークンライザの開発や、優れたパフォーマンスを達成するためのLCM復号化戦略の推進に重点を置いている。
しかし、レコメンデーションデータにLLMを適用するのに不可欠であるGRフレームワークにおける重要な微調整ステップは、まだほとんど解明されていない。
現在のアプローチは、教師付き微調整(SFT)戦略や推奨特化直接選好最適化(DPO)戦略の次世代の予測損失に大きく依存している。
どちらの手法も、一般に露光バイアス問題と呼ばれる正の未観測サンプルの探索を無視する。
本稿では,GRを多段階生成タスクとして扱い,GFlowNetsベースのファインチューニングフレームワーク(GFlowGR)を構築する。
提案フレームワークは,従来のレコメンデータシステムからの協調的知識を統合し,適応的軌道サンプリングと包括的報酬モデルを作成する。
GFlowNetsの多様な生成特性とサンプリングおよびヒューリスティックな重み付け技術を活用し、GFlowGRは露光バイアス問題を緩和するための有望なアプローチとして出現する。
2つの実世界のデータセットと2つの異なるGRバックボーンによる大規模な実験結果は、GFlowGRの有効性と堅牢性を強調している。
関連論文リスト
- Action is All You Need: Dual-Flow Generative Ranking Network for Recommendation [25.30922374657862]
本稿では,推奨シナリオのためのDual-Flow Generative Ranking Network(DFGR)を紹介する。
DFGRは相互作用モデリングの最適化にデュアルフロー機構を採用している。
オープンソースおよび実際の産業データセットにおける実験は、DFGRがDLRMを上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-22T14:58:53Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - Ignite Forecasting with SPARK: An Efficient Generative Framework for Refining LLMs in Temporal Knowledge Graph Forecasting [13.402856325579236]
本稿では,TKG予測における大規模言語モデルの精錬のためのシーケンスレベルのプロキシフレームワークであるSPARKを紹介する。
推論時間アルゴリズムにインスパイアされたSPARKは、2つの重要なイノベーションを通じてコスト効率の良いプラグアンドプレイソリューションを提供する。
多様なデータセットにわたる実験は、SPARKの予測性能、堅牢な一般化能力、高効率を検証している。
論文 参考訳(メタデータ) (2025-03-27T03:02:02Z) - Looking Backward: Retrospective Backward Synthesis for Goal-Conditioned GFlowNets [27.33222647437964]
Generative Flow Networks (GFlowNets) は、多種多様なハイリワード候補を生成する顕著な能力を示した。
しかし、そのようなモデルの訓練は、極めて少ない報酬のために困難である。
この問題を解決するために,textbfRetrospective textbfBackward textbfSynthesis (textbfRBS) という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-03T09:44:10Z) - Ant Colony Sampling with GFlowNets for Combinatorial Optimization [68.84985459701007]
Generative Flow Ant Colony Sampler (GFACS)は、階層的に償却推論と並列探索を組み合わせた新しいメタヒューリスティック手法である。
提案手法はまず,生成フローネットワーク(GFlowNets)を利用して,解空間上のエンフルティモーダル事前分布を補正する。
この前者は、Ant Colony Optimization (ACO) の精神で並列探索によって更新され、後部分布がほぼ最適解を生成する。
論文 参考訳(メタデータ) (2024-03-11T16:26:06Z) - DAG Matters! GFlowNets Enhanced Explainer For Graph Neural Networks [30.19635147123557]
我々はGFlowNetsベースのGNN Explainer(GFlowExplainer)という生成構造を提案する。
我々のGFlowExplainerは、サブグラフの確率がその報酬に比例するサブグラフの分布を生成するポリシーを学習することを目的としています。
我々は合成データと実データの両方について広範な実験を行い、質的および定量的な結果はGFlowExplainerの優位性を示している。
論文 参考訳(メタデータ) (2023-03-04T16:15:25Z) - Stochastic Generative Flow Networks [89.34644133901647]
生成フローネットワーク(GFlowNets)は「制御としての推論」のレンズを通して複雑な構造をサンプリングすることを学ぶ
既存のGFlowNetsは決定論的環境にのみ適用でき、動的処理によるより一般的なタスクではフェールする。
本稿では,GFlowNetsを環境に拡張する新しいアルゴリズムであるGFlowNetsを紹介する。
論文 参考訳(メタデータ) (2023-02-19T03:19:40Z) - GFlowCausal: Generative Flow Networks for Causal Discovery [27.51595081346858]
本稿では,GFlowCausalと呼ばれる観測データからDAG(Directed Acyclic Graph)を学習するための新しい手法を提案する。
GFlowCausalは、事前定義された報酬に比例した確率を持つシーケンシャルアクションによって、ハイリワードDAGを生成するための最良のポリシーを学ぶことを目的としている。
合成データセットと実データセットの両方について広範な実験を行い、提案手法が優れていることを示すとともに、大規模環境での良好な性能を示す。
論文 参考訳(メタデータ) (2022-10-15T04:07:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。