論文の概要: On the Role of Language Representations in Auto-Bidding: Findings and Implications
- arxiv url: http://arxiv.org/abs/2605.05833v1
- Date: Thu, 07 May 2026 08:08:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.618728
- Title: On the Role of Language Representations in Auto-Bidding: Findings and Implications
- Title(参考訳): 自動入札における言語表現の役割:発見と意味
- Authors: Guanyu Zhu, Jining Luan, Hanwen Du, Xinyu Fang, Sibo Xu, Ersheng Ni, Hongji Li, Jincheng Fang, Ronghao Chen, Huacan Wang, Xuanqi Lan, Yongxin Ni, Yiqi Sun, Youhua Li,
- Abstract要約: 我々は,新しい自動入札フレームワークである textitSemBid を提案する。
トークンレベルでのオフライン入札トラジェクトリにセマンティック入力を注入する。
SemBidはオフラインのRLと生成シーケンスモデリングから競合するベースラインを上回っている。
- 参考スコア(独自算出の注目度): 9.218251193584466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Auto-bidding is a crucial task in real-time advertising markets, where policies must optimize long-horizon value under delivery constraints (e.g., budget and CPA). Existing methods for auto-bidding rely on compact numerical state representations: while they can implicitly capture delivery dynamics, they offer limited support for explicitly representing and controlling high-level intent, evolving feedback, and operator-style strategic guidance in real campaigns. Meanwhile, Large Language Models (LLMs) offer a powerful method for encoding semantic information, it remains unclear when LLMs help and how to integrate them without sacrificing numerical precision. Through systematic preliminary studies, we find that (1) LLM embeddings contain bidding-relevant cues yet cannot replace numerical features, and (2) gains emerge only with careful semantic--numeric integration rather than naive concatenation. Motivated by these findings, we propose \textit{SemBid}, a novel auto-bidding framework that injects LLM-encoded semantics into offline bidding trajectories at the token level. SemBid introduces three semantic inputs: \textit{Task}, \textit{History}, and \textit{Strategy}. It injects these semantics as tokens alongside numerical trajectory tokens and uses self-attention to integrate them, improving controllability and generalization across objectives. Across diverse scenarios and budget regimes, SemBid outperforms competitive baselines from offline RL and generative sequence modeling, with more consistent gains in overall performance, constraint satisfaction, and robustness. Our code is available at: \href{https://github.com/AlanYu04/SemBid-KDD2026}{\textcolor{blue}{here}}.
- Abstract(参考訳): 自動入札はリアルタイム広告市場において重要な課題であり、政策は配送制限下での長期的価値(予算やCPAなど)を最適化する必要がある。
デリバリーのダイナミクスを暗黙的にキャプチャできる一方で、ハイレベルな意図を明示的に表現し、制御するための限定的なサポート、フィードバックの進化、実際のキャンペーンにおけるオペレータスタイルの戦略的ガイダンスを提供する。
一方、LLM(Large Language Models)は意味情報をエンコードする強力な手法を提供するが、LLMがいつ助けになるのか、また数値的な精度を犠牲にすることなくそれらをどのように統合するかは不明だ。
体系的な予備研究により, 1) LLM埋め込みは, 入札関連キューを含むが, 数値的特徴に置き換わることはできない。
これらの知見に触発されて、トークンレベルでのオフライン入札軌跡にLLM符号化セマンティクスを注入する新しい自動入札フレームワークである「textit{SemBid}」を提案する。
SemBidは3つの意味入力を導入している: \textit{Task}, \textit{History}, \textit{Strategy}。
数値的軌跡トークンと並行してこれらの意味論をトークンとして注入し、自己認識を用いてそれらを統合し、目的物間での制御性と一般化を改善する。
さまざまなシナリオと予算体制の中で、SemBidはオフラインのRLと生成シーケンスモデリングから競合するベースラインよりも優れており、全体的なパフォーマンス、制約満足度、ロバスト性はより一貫して向上している。
私たちのコードは、以下の通りである。 \href{https://github.com/AlanYu04/SemBid-KDD2026}{\textcolor{blue}{here}}。
関連論文リスト
- SARM: LLM-Augmented Semantic Anchor for End-to-End Live-Streaming Ranking [49.109782956280064]
大規模なライブストリーミングレコメンデーションでは、リアルタイムサービス制約下での非定常コンテンツセマンティクスの正確なモデリングが必要である。
自然言語のセマンティックアンカーをランキング最適化に直接統合するエンドツーエンドのランキングアーキテクチャである textbfSARM を提案する。
SARMは完全にデプロイされており、毎日4億人のユーザにサービスを提供している。
論文 参考訳(メタデータ) (2026-02-10T04:15:53Z) - Language Models as Semantic Augmenters for Sequential Recommenders [20.934150208996048]
大規模言語モデル(LLM)は、様々なモダリティをまたいだ潜在意味論と文脈的関係を捉えるのに優れています。
このようなシーケンスを自動的に強化するフレームワークであるLaMARを紹介する。
LaMARは、ユーザの意図とメタデータからの項目関係の潜在意味的側面を推測することにより、補助的なコンテキスト信号を生成する。
論文 参考訳(メタデータ) (2025-10-20T19:36:38Z) - CAAD: Context-Aware Adaptive Decoding for Truthful Text Generation [31.469511576774252]
大規模言語モデルに対する文脈対応適応型復号法を提案する。
当社のアプローチは、TrathfulQAで平均2.8%の改善を実現しています。
モデルに依存しない,スケーラブルで,効率的な手法では,1世代パスしか必要としない。
論文 参考訳(メタデータ) (2025-08-04T08:28:25Z) - Resource-Efficient Adaptation of Large Language Models for Text Embeddings via Prompt Engineering and Contrastive Fine-tuning [3.9914181590063884]
大規模言語モデル(LLM)は自然言語処理(NLP)の基盤となっている。
プリトレーニングされたデコーダのみのLLMの適応戦略について検討する。
論文 参考訳(メタデータ) (2025-07-30T14:49:30Z) - $\texttt{SEM-CTRL}$: Semantically Controlled Decoding [53.86639808659575]
$texttSEM-CTRL$は、LLMデコーダに直接、リッチなコンテキスト依存制約とタスクおよびインスタンス固有のセマンティクスを強制する統一的なアプローチである。
texttSEM-CTRL$は、小さな訓練済みのLLMがより大きな変種や最先端の推論モデルよりも効率的に性能を向上することを可能にする。
論文 参考訳(メタデータ) (2025-03-03T18:33:46Z) - Enhancing Item Tokenization for Generative Recommendation through Self-Improvement [67.94240423434944]
生成レコメンデーションシステムは大規模言語モデル(LLM)によって駆動される
現在のアイテムトークン化手法には、テキスト記述、数値文字列、離散トークンのシーケンスの使用が含まれる。
自己改善アイテムトークン化手法を提案し,LLMがトレーニングプロセス中に独自のアイテムトークン化を洗練できるようにする。
論文 参考訳(メタデータ) (2024-12-22T21:56:15Z) - Core Context Aware Transformers for Long Context Language Modeling [50.774702091154204]
高速な長文モデリングのためのCCAアテンションを提案する。
本手法は,学習過程における冗長性を低下させながら,コアコンテキストに自動的に焦点を合わせ,強化する。
提案手法は,既存の大規模言語モデルにおける自己注意モジュールを最小限の微調整コストで置き換えることができる。
論文 参考訳(メタデータ) (2024-12-17T01:54:08Z) - Enhancing LLM-Based Text Classification in Political Science: Automatic Prompt Optimization and Dynamic Exemplar Selection for Few-Shot Learning [1.6967824074619953]
大型言語モデル (LLMs) は、政治学におけるテキスト分類をかなり約束する。
本フレームワークは,自動プロンプト最適化,動的指数選択,コンセンサス機構を通じてLLM性能を向上させる。
オープンソースのPythonパッケージ(PoliPrompt)がGitHubで公開されている。
論文 参考訳(メタデータ) (2024-09-02T21:05:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。