論文の概要: Self-EvolveRec: Self-Evolving Recommender Systems with LLM-based Directional Feedback
- arxiv url: http://arxiv.org/abs/2602.12612v1
- Date: Fri, 13 Feb 2026 04:38:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.848376
- Title: Self-EvolveRec: Self-Evolving Recommender Systems with LLM-based Directional Feedback
- Title(参考訳): LLMを用いた自己進化型レコメンダシステム
- Authors: Sein Kim, Sangwu Park, Hongseok Kang, Wonjoong Kim, Jimin Seo, Yeonjun In, Kanghoon Yoon, Chanyoung Park,
- Abstract要約: Self-EvolveRecは、方向性フィードバックループを確立する新しいフレームワークである。
推奨性能とユーザ満足度の両方において、最先端のNASとLLM駆動のコード進化ベースラインを大幅に上回る。
- 参考スコア(独自算出の注目度): 21.326241484461587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional methods for automating recommender system design, such as Neural Architecture Search (NAS), are often constrained by a fixed search space defined by human priors, limiting innovation to pre-defined operators. While recent LLM-driven code evolution frameworks shift fixed search space target to open-ended program spaces, they primarily rely on scalar metrics (e.g., NDCG, Hit Ratio) that fail to provide qualitative insights into model failures or directional guidance for improvement. To address this, we propose Self-EvolveRec, a novel framework that establishes a directional feedback loop by integrating a User Simulator for qualitative critiques and a Model Diagnosis Tool for quantitative internal verification. Furthermore, we introduce a Diagnosis Tool - Model Co-Evolution strategy to ensure that evaluation criteria dynamically adapt as the recommendation architecture evolves. Extensive experiments demonstrate that Self-EvolveRec significantly outperforms state-of-the-art NAS and LLM-driven code evolution baselines in both recommendation performance and user satisfaction. Our code is available at https://github.com/Sein-Kim/self_evolverec.
- Abstract(参考訳): ニューラル・アーキテクチャ・サーチ(NAS)のようなリコメンダ・システム・デザインを自動化する従来の手法は、しばしば人間の事前定義によって定義された固定された検索空間によって制約され、イノベーションは事前に定義された演算子に制限される。
最近のLLM駆動のコード進化フレームワークは、固定された検索スペースターゲットをオープンなプログラムスペースに移行するが、主にスカラーメトリクス(例えば、NDCG、Hit Ratio)に依存しており、モデル障害に関する定性的な洞察や改善のための方向性のガイダンスを提供していない。
そこで本稿では,定性評価のためのユーザシミュレータと定量的内部検証のためのモデル診断ツールを統合し,指向性フィードバックループを確立する新しいフレームワークであるSelf-EvolveRecを提案する。
さらに、推奨アーキテクチャが進化するにつれて評価基準が動的に適応することを保証するための診断ツール-モデル共進化戦略を導入する。
大規模な実験により、Self-EvolveRecは、推奨パフォーマンスとユーザ満足度の両方において、最先端のNASとLLM駆動のコード進化ベースラインを著しく上回っていることが示されている。
私たちのコードはhttps://github.com/Sein-Kim/self_evolverec.comで公開されています。
関連論文リスト
- Embed Progressive Implicit Preference in Unified Space for Deep Collaborative Filtering [13.24227546548424]
GNOLR(Generalized Neural Ordinal Logistic Regression)は、ユーザエンゲージメントの構造的進行を捉えるために提案されている。
GNOLRは予測精度を高め、ユーザのエンゲージメントの進行を捉え、検索プロセスを単純化する。
10の実世界のデータセットでの実験では、GNOLRは効率と適応性において最先端の手法を大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-27T08:43:35Z) - SWE-Search: Enhancing Software Agents with Monte Carlo Tree Search and Iterative Refinement [18.84439000902905]
現在の大規模言語モデル(LLM)ベースのソフトウェアエージェントは、しばしば線形でシーケンシャルなプロセスに従う。
モンテカルロ木探索(MCTS)と自己改善機構を統合したマルチエージェントフレームワークであるSWE-Searchを提案する。
これは、複雑なソフトウェアエンジニアリング環境における自己評価駆動検索技術の可能性を強調している。
論文 参考訳(メタデータ) (2024-10-26T22:45:56Z) - Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文 参考訳(メタデータ) (2024-07-22T17:52:12Z) - Self-Exploring Language Models: Active Preference Elicitation for Online Alignment [88.56809269990625]
本研究では, 分布域外領域を積極的に探索するために, 潜在的に高次応答に対して楽観的に偏りを呈する2段階的客観性を提案する。
実験の結果,Zephyr-7B-SFTとLlama-3-8B-Instructモデルで微調整した場合,SELM(Self-Exploring Language Models)は命令追従ベンチマークの性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-29T17:59:07Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Value Driven Representation for Human-in-the-Loop Reinforcement Learning [33.79501890330252]
我々は,システム設計者が,強化学習エージェントが使用する観測空間を定義するために,センサセットや特徴セットを選択する方法のアルゴリズム的基礎に焦点をあてる。
本稿では、強化学習エージェントの観測空間を反復的かつ適応的に拡張するアルゴリズム、値駆動表現(VDR)を提案する。
シミュレーションされた人間を用いた標準RLベンチマークによる手法の性能評価を行い、従来のベースラインよりも大幅に改善したことを示す。
論文 参考訳(メタデータ) (2020-04-02T18:45:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。