論文の概要: LLM Retrieval for Stable and Predictable Ad Recommendations
- arxiv url: http://arxiv.org/abs/2605.21969v1
- Date: Thu, 21 May 2026 03:58:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.084942
- Title: LLM Retrieval for Stable and Predictable Ad Recommendations
- Title(参考訳): 安定かつ予測可能な広告レコメンデーションのためのLCM検索
- Authors: Vinodh Kumar Sunkara, Satheeshkumar Karuppusamy, Hangjun Xu, Sai Deepika Regani, Kshitij Gupta, Gaby Nahum, Sneha Iyer, Jean-Baptiste Fiot, Yinglong Guo, Xiaowen Guo, Atul Jangra, Yucheng Liu, Jinghao Yan, Vijay Pappu, Benjamin Schulte, Deepak Chandra,
- Abstract要約: 本稿では,広告推薦システムの安定性と予測可能性の定量化のための新しい評価フレームワークを提案する。
細調整大言語モデル(LLM)を利用したオンライン意味候補生成フレームワークを提案する。
このフレームワークは、システムのセマンティック・アウェアネスを根本的に改善することで、これらの指標に沿って大幅に改善されている。
- 参考スコア(独自算出の注目度): 4.132360900725765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional ads recommendation systems have primarily focused on optimizing for prediction accuracy of click or conversion events using canonical metrics such as recall or normalized discounted cumulative gain (NDCG). With the hyper-growth of ads inventory and liquidity with generative AI technologies, the prediction stability and predictability is becoming increasingly critical. Intuitively, prediction stability and predictability can be defined to quantify system robustness with respect to minor/noisy input (ads, creatives) perturbations, the lack of which could lead to advertiser perceivable problems such as repeatability, cold start and under-exploration. In this paper, we introduce a new evaluation framework for quantifying stability and predictability of an ads recommender system, and present an online validated semantic candidate generation framework powered by fine-tuned Large Language Models (LLMs) that showed significant improvement along these metrics by fundamentally improving the semantic-awareness of the system. The approach extracts hierarchical semantic attributes from ad creatives to obtain LLM representations, which serve as the foundation for graph-based expansion, ensuring the retrieved candidates encapsulate semantic variants of an ad, guaranteeing that small creative variants from the advertiser yield consistent and explainable delivery results to the user. We tested this LLM ads retrieval framework in a large-scale industrial ads recommendation system, demonstrating significant improvements across offline and online A/B experiments, showcasing gains in both predictability and traditional performance metrics. Although evaluated in the ads stack, this is a general framework that can be applied broadly to any large-scale recommendation and retrieval systems facing similar scaling and predictability challenges.
- Abstract(参考訳): 従来の広告推薦システムは、リコールや正規化割引累積ゲイン(NDCG)などの標準指標を用いて、クリックやコンバージョンイベントの予測精度の最適化に重点を置いている。
広告インベントリの急激な成長と、生成AI技術による流動性により、予測安定性と予測可能性はますます重要になりつつある。
直感的には、予測安定性と予測可能性は、マイナー/ノイズの多い入力(ads, Creatives)の摂動に関してシステムの堅牢性を定量化するために定義できる。
本稿では,広告レコメンデータシステムの安定性と予測可能性の定量化のための新しい評価フレームワークを提案するとともに,システムの意味認識を根本的に改善し,これらの指標に沿って大幅な改善を図った,細調整された大規模言語モデル(LLM)を利用したオンライン意味候補生成フレームワークを提案する。
提案手法は,広告作成者から階層的セマンティック属性を抽出し,グラフベースの拡張の基盤となるLCM表現を得ることにより,検索した候補が広告の意味的変種をカプセル化し,広告主からの小さな創造的変種が一貫した説明可能な配信結果をユーザに提供する。
このLLM広告検索フレームワークを大規模産業広告推薦システムでテストし、オフラインおよびオンラインA/B実験における大幅な改善を実証した。
広告スタックで評価されているが、これは拡張性や予測可能性の問題に直面した大規模レコメンデーションと検索システムに広く適用できる一般的なフレームワークである。
関連論文リスト
- Specificity-aware reinforcement learning for fine-grained open-world classification [54.85385270439992]
オープンワールド設定下でのきめ細かい視覚概念の分類は、モデルが正確かつ具体的であることを要求します。
細粒度画像分類に基づく細粒度推論LMMのための特異性認識型強化学習フレームワークSpeciaRLを提案する。
論文 参考訳(メタデータ) (2026-03-03T17:52:39Z) - AWPO: Enhancing Tool-Use of Large Language Models through Explicit Integration of Reasoning Rewards [60.2998874976509]
我々は,ツール利用能力を高めるために,明示的な推論報酬を統合するために,有利なポリシー最適化(AWPO)を提案する。
AWPOは分散認識ゲーティングと困難認識重み付けを導入し、推論信号から利点を適応的に変調する。
実験により、AWPOは標準的なツール使用ベンチマークで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-12-22T08:07:00Z) - Breaking Determinism: Stochastic Modeling for Reliable Off-Policy Evaluation in Ad Auctions [16.315158617837646]
この研究は、決定論的オークション環境における信頼性の高いオフ・ポリティ・アセスメント(OPE)のための、初めて実用的で検証されたフレームワークに貢献する。
提案手法は,提案手法を用いて提案した提案手法を,提案手法を用いて提案する提案手法である。
AuctionNetシミュレーションベンチマークと大規模産業プラットフォームによる2週間のオンラインA/Bテストに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-12-03T01:37:42Z) - EGA-V2: An End-to-end Generative Framework for Industrial Advertising [19.927005856735445]
EGA-V2(End-to-End Generative Advertising)は、ユーザ興味、POI(point-of-interest)、クリエイティブジェネレーション、広告アロケーション、支払い最適化を体系的にモデル化する最初の統合フレームワークである。
当社の結果は、次世代産業広告システムへの道を開く、完全生成型広告ソリューションのパイオニアとしての可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-05-23T06:55:02Z) - A Novel Generative Model with Causality Constraint for Mitigating Biases in Recommender Systems [20.672668625179526]
遅延共起バイアスは、ユーザのフィードバックとアイテムの露出の間の真の因果関係を曖昧にする可能性がある。
本稿では,Recommender Systemsにおける表現学習のための遅延因果制約(Latent Causality Constraints)と呼ばれる新しい生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-22T14:09:39Z) - A Survey of Direct Preference Optimization [103.59317151002693]
LLM(Large Language Models)は、前例のない生成能力を示す。
人的価値との整合性は、有用で無害なデプロイメントを保証する上で、依然として重要です。
直接優先度最適化(DPO)は、最近、合理化された代替案として注目されている。
論文 参考訳(メタデータ) (2025-03-12T08:45:15Z) - Beyond Self-Consistency: Loss-Balanced Perturbation-Based Regularization Improves Industrial-Scale Ads Ranking [17.264202675913012]
摂動に基づく正規化技術は、産業規模の大規模モデルにおける多くの課題に対処する。
我々は、潜在的にどんなディープラーニングモデルでも使用できるLSPR(Los-Balanced Small Perturbation Regularization)を提案する。
SCR(Self-Consistency Regularization approach)とLSPR(LSPR)の両方がスケーラブルで、広告配信システムを改善することができることを示した。
論文 参考訳(メタデータ) (2025-02-05T23:24:52Z) - Benchmarking PtO and PnO Methods in the Predictive Combinatorial Optimization Regime [59.27851754647913]
予測最適化(英: Predictive optimization)は、エネルギーコストを意識したスケジューリングや広告予算配分など、多くの現実世界のアプリケーションの正確なモデリングである。
我々は,広告のための新しい産業データセットを含む8つの問題に対して,既存のPtO/PnOメソッド11をベンチマークするモジュラーフレームワークを開発した。
本研究は,8ベンチマーク中7ベンチマークにおいて,PnOアプローチがPtOよりも優れていることを示すが,PnOの設計選択に銀の弾丸は見つからない。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - COPR: Consistency-Oriented Pre-Ranking for Online Advertising [27.28920707332434]
オンライン広告のための一貫性指向のプレグレードフレームワークを提案する。
チャンクベースのサンプリングモジュールとプラグアンドプレイのランクアライメントモジュールを使用して、ECPMでランク付けされた結果の一貫性を明示的に最適化する。
Taobaoのディスプレイ広告システムに展開すると、最大で+12.3%のCTRと+5.6%のRPMを実現している。
論文 参考訳(メタデータ) (2023-06-06T09:08:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。