論文の概要: VirtualMLE: A Virtual ML Engineer that Optimizes Sequential Recommenders
- arxiv url: http://arxiv.org/abs/2606.03221v1
- Date: Tue, 02 Jun 2026 06:31:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.808866
- Title: VirtualMLE: A Virtual ML Engineer that Optimizes Sequential Recommenders
- Title(参考訳): VirtualMLE: シーケンスレコメンダを最適化する仮想MLエンジニア
- Authors: Shiteng Cao, Jingwen Liu, Junda She, Zhiheng Li,
- Abstract要約: 我々は、実行、リフレクション、メモリ更新のクローズドループに最適化するレコメンダを整理するLLM-agentフレームワークである textbfVirtualMLE を提案する。
我々は、SASRecとHSTUという2つの代表的なバックボーンを持つ3つのAmazon SRベンチマークでVirtualMLEを評価した。
- 参考スコア(独自算出の注目度): 5.414980501076755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in Large Language Models (LLMs) have demonstrated remarkable capabilities in reasoning, reflection, and tool utilization, unlocking new paradigms for automating complex engineering workflows. However, in the domain of sequential recommendation (SR), tuning models on new datasets still relies heavily on the manual trial-and-error of experienced machine learning engineers. To bridge this gap, we propose \textbf{VirtualMLE}, an LLM-agent framework that leverages the cognitive capabilities of LLMs to organize recommender optimizing into a closed loop of execution, reflection, and memory update. After each trial, the agent explicitly analyzes the observed outcomes and stores concise heuristic feedback in a hierarchical memory system. We evaluate VirtualMLE on three Amazon SR benchmarks with two representative backbones, SASRec and HSTU. VirtualMLE reaches competitive recommendation quality with substantially fewer trials. Furthermore, we observe that cognition summaries distilled from previous datasets can significantly accelerate the search process on unseen datasets, demonstrating the potential of transferring tuning heuristics. Overall, our results provide compelling evidence that LLM agents equipped with reflection and memory can serve as practical virtual engineers to automate and amortize heuristic learning in SR optimization. Our codes are available.
- Abstract(参考訳): 最近のLLM(Large Language Models)の進歩は、推論、リフレクション、ツール利用において顕著な能力を示し、複雑なエンジニアリングワークフローを自動化するための新しいパラダイムをアンロックしている。
しかし、シーケンシャルレコメンデーション(SR)の領域では、新しいデータセットのチューニングモデルはまだ、経験豊富な機械学習エンジニアの手動トライアルとエラーに大きく依存している。
このギャップを埋めるために, LLMの認知能力を活用し, 実行, リフレクション, メモリ更新のクローズドループに最適化するレコメンデータを整理するフレームワークである \textbf{VirtualMLE} を提案する。
各試行の後、エージェントは観察結果を明示的に分析し、簡潔なヒューリスティックフィードバックを階層記憶システムに格納する。
我々は、SASRecとHSTUという2つの代表的なバックボーンを持つ3つのAmazon SRベンチマークでVirtualMLEを評価した。
VirtualMLEは競争力のあるレコメンデーション品質に達し、トライアルは大幅に少ない。
さらに,従来のデータセットから抽出した認識サマリーは,未知のデータセットの探索過程を著しく加速し,チューニングヒューリスティックスを転送する可能性を示す。
以上の結果から,リフレクションとメモリを備えたLLMエージェントが,SR最適化におけるヒューリスティック学習の自動化と改善に実用的な仮想技術として有効であることを示す。
私たちのコードは利用可能です。
関連論文リスト
- Task-Adaptive Embedding Refinement via Test-time LLM Guidance [3.6468227618496627]
組込みモデルのユーザビリティをゼロショット検索と分類タスクに拡張するためのLLM誘導クエリ改善パラダイムの有効性について検討する。
提案手法では, ユーザクエリの埋め込み表現を, 少数の文書に対して生成LLMからのフィードバックを用いて洗練する。
我々は,最先端のテキスト埋め込みモデルを用いて,多様な検索と分類のベンチマークを行う。
論文 参考訳(メタデータ) (2026-05-12T17:58:27Z) - Beyond Relational: Semantic-Aware Multi-Modal Analytics with LLM-Native Query Optimization [35.60979104539273]
Nirvanaは、プログラム可能なセマンティック演算子を組み込んだマルチモーダルデータ分析フレームワークである。
Nirvanaはエンドツーエンドのランタイムを10%から85%削減し、システム処理コストを平均で76%削減できる。
論文 参考訳(メタデータ) (2025-11-25T01:41:49Z) - Rethinking On-policy Optimization for Query Augmentation [49.87723664806526]
本稿では,様々なベンチマークにおいて,プロンプトベースとRLベースのクエリ拡張の最初の体系的比較を示す。
そこで我々は,検索性能を最大化する擬似文書の生成を学習する,新しいハイブリッド手法 On-policy Pseudo-document Query Expansion (OPQE) を提案する。
論文 参考訳(メタデータ) (2025-10-20T04:16:28Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - Utility-Focused LLM Annotation for Retrieval and Retrieval-Augmented Generation [96.18720164390699]
本稿では,大規模言語モデル (LLM) を用いた検索・検索・拡張生成システム (RAG) の訓練における文書ユーティリティのアノテートについて検討する。
以上の結果から,LLM生成アノテーションは,人間のアノテーションや下流QAメトリクスのみを訓練したモデルと比較して,ドメイン外検索性能の向上とRAG結果の改善を図っている。
論文 参考訳(メタデータ) (2025-04-07T16:05:52Z) - A Framework for Using LLMs for Repository Mining Studies in Empirical Software Engineering [12.504438766461027]
大規模言語モデル(LLM)は、ソフトウェアリポジトリを分析する革新的な方法を提供することで、ソフトウェア工学(SE)を変革した。
私たちの研究は、PRIMES(Prompt Refinement and Insights for Mining Empirical Software repository)というフレームワークをまとめています。
この結果,PRIMESの標準化により,LLMを用いた研究の信頼性と精度が向上することが示唆された。
論文 参考訳(メタデータ) (2024-11-15T06:08:57Z) - LLM-based Bi-level Multi-interest Learning Framework for Sequential Recommendation [54.396000434574454]
本稿では,暗黙的行動と明示的意味論的視点を組み合わせた新しい多目的SRフレームワークを提案する。
Implicit Behavioral Interest ModuleとExplicit Semantic Interest Moduleの2つのモジュールが含まれている。
4つの実世界のデータセットの実験は、フレームワークの有効性と実用性を検証する。
論文 参考訳(メタデータ) (2024-11-14T13:00:23Z) - In-Context Symbolic Regression: Leveraging Large Language Models for Function Discovery [5.2387832710686695]
本稿では,記号回帰のタスクにLarge Language Models(LLM)を利用する,最初の包括的フレームワークを紹介する。
In-Context Symbolic Regression (ICSR) は、外部LLMで関数形式を反復的に洗練し、その係数を外部LLMで決定するSR手法である。
以上の結果から,LLMは与えられたデータに適合するシンボリック方程式の発見に成功し,最高のSRベースラインの総合性能を4つのベンチマークで評価した。
論文 参考訳(メタデータ) (2024-04-29T20:19:25Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。