論文の概要: Efficient LLM-based Advertising via Model Compression and Parallel Verification
- arxiv url: http://arxiv.org/abs/2605.11582v1
- Date: Tue, 12 May 2026 06:04:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.619054
- Title: Efficient LLM-based Advertising via Model Compression and Parallel Verification
- Title(参考訳): モデル圧縮と並列検証による効率的なLCMベース広告
- Authors: Wenxin Dong, Chang Gao, Guanghui Yu, Xuewu Jiao, Mingqing Hu, Qiang Fu, Peng Xu, Penghui Wei, Hui Xu, Yue Xing, Shuanglong Li, Lin Liu,
- Abstract要約: 大規模言語モデル(LLM)は、広告クリエイティブ生成やターゲット広告のような広告シナリオにおいて顕著な可能性を示している。
LLMをリアルタイム広告システムにデプロイすることは、高い推論遅延と計算コストのために大きな課題となる。
本稿では,適応型グループ量子化,階層型階層化,プレフィックスツリー並列検証を併用した効率的な生成ターゲットフレームワークを提案する。
- 参考スコア(独自算出の注目度): 20.50417225446855
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have shown remarkable potential in advertising scenarios such as ad creative generation and targeted advertising. However, deploying LLMs in real-time advertising systems poses significant challenges due to their high inference latency and computational cost. In this paper, we propose an Efficient Generative Targeting framework that integrates adaptive group quantization, layer-adaptive hierarchical sparsification, and prefix-tree parallel verification to accelerate LLM inference while preserving generation quality. Extensive experiments on two real-world advertising scenarios demonstrate that our framework achieves significant speedup with acceptable quality degradation, making it operationally viable for practical deployments.
- Abstract(参考訳): 大規模言語モデル(LLM)は、広告クリエイティブ生成やターゲット広告のような広告シナリオにおいて顕著な可能性を示している。
しかし、LLMをリアルタイム広告システムにデプロイすることは、高い推論遅延と計算コストのために大きな課題となる。
本稿では、適応型グループ量子化、層適応型階層化、プレフィックスツリー並列検証を統合し、LLM推論を高速化し、生成品質を保ちながら、効率的な生成ターゲットフレームワークを提案する。
2つの実世界の広告シナリオに関する大規模な実験は、我々のフレームワークが許容できる品質劣化を伴って大幅なスピードアップを実現し、実用的なデプロイメントで運用可能であることを実証している。
関連論文リスト
- CoLLM: A Unified Framework for Co-execution of LLMs Federated Fine-tuning and Inference [33.14453252489961]
CoLLMは、FL PEFTと共有エッジレプリカとモデルパラメータの推論を統一するシステムである。
常に最先端のLLMシステムより優れており、最大で3倍高い出力を実現している。
論文 参考訳(メタデータ) (2026-03-31T09:49:47Z) - RELATE: A Reinforcement Learning-Enhanced LLM Framework for Advertising Text Generation [17.34586562700226]
オンライン広告では、広告テキストはユーザーのエンゲージメントを惹きつけ、広告主の価値を高める上で重要な役割を担っている。
一つのモデル内で生成と客観的アライメントを統一する強化学習に基づくエンドツーエンドフレームワークであるRELATEを提案する。
クリックレベルの信号を超えた究極の広告主の値をより正確に把握するために、変換指向のメトリクスを目的に組み込んで、コンプライアンス制約を多次元報酬として共同でモデル化する。
論文 参考訳(メタデータ) (2026-02-12T10:00:55Z) - DARA: Few-shot Budget Allocation in Online Advertising via In-Context Decision Making with RL-Finetuned LLMs [21.30516760599435]
大規模言語モデルは、AIGBの有望な代替手段を提供する。
微粒な最適化に必要な数値精度は欠如している。
DARAは、意思決定プロセスを2段階に分解する新しい2段階のフレームワークである。
当社のアプローチは、予算制約下での累積広告価値において、既存のベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2026-01-21T06:58:44Z) - LLM-Auction: Generative Auction towards LLM-Native Advertising [10.695066036409274]
LLMネイティブ広告のためのオークションとLLM生成を統合した学習型生成オークション機構を提案する。
本稿では,報酬モデルとLLMを交互に最適化するIRPOアルゴリズムを提案する。
LLM-Auctionは、所望の機構特性を達成しつつ、割り当て効率において既存のベースラインを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2025-12-11T11:31:20Z) - Diffusion LLMs are Natural Adversaries for any LLM [50.88535293540971]
資源集約的(逆)な最適化問題を非効率な暗黙的推論タスクに変換する新しいフレームワークを提案する。
我々の中核となる洞察は、事前訓練された非自己回帰的生成LDMは、迅速な探索のための強力なサロゲートとして機能できるということである。
生成したプロンプトは、さまざまなブラックボックスターゲットモデルに対して強い転送可能性を示す、低複雑で多様なジェイルブレイクであることがわかった。
論文 参考訳(メタデータ) (2025-10-31T19:04:09Z) - A Unified Multi-Task Learning Framework for Generative Auto-Bidding with Validation-Aligned Optimization [51.27959658504722]
マルチタスク学習は、これらのタスクを共有表現を通じて共同でトレーニングするための、原則化されたフレームワークを提供する。
既存のマルチタスク最適化戦略は、主にトレーニングダイナミクスによって導かれ、不安定な入札環境ではよく一般化される。
本稿では,タスク毎のトレーニング勾配と保留有効度勾配のアライメントに基づいてタスク重みを適応的に割り当てる,バリデーション適応型マルチタスク最適化(VAMO)を提案する。
論文 参考訳(メタデータ) (2025-10-09T03:59:51Z) - Fun-ASR Technical Report [89.84148151617022]
本稿では,大規模データ,大規模モデル容量,LLM統合,強化学習を組み合わせた大規模ALSシステムFun-ASRを提案する。
Fun-ASRは特に実用的なデプロイメントに最適化されており、ストリーミング機能、ノイズの堅牢性、コードスイッチング、ホットワードのカスタマイズ、その他の現実世界のアプリケーション要件を満たすことができる。
運用指向の最適化により、Fun-ASRは実際のアプリケーションデータセット上での最先端のパフォーマンスを実現し、実用的設定におけるその有効性と堅牢性を示す。
論文 参考訳(メタデータ) (2025-09-15T23:19:36Z) - Agentic Reinforced Policy Optimization [66.96989268893932]
検証可能な報酬付き大規模強化学習(RLVR)は,大規模言語モデル(LLM)を単一ターン推論タスクに活用する効果を実証している。
現在のRLアルゴリズムは、モデル固有のロングホライゾン推論能力と、マルチターンツールインタラクションにおけるその習熟性のバランスが不十分である。
エージェント強化ポリシー最適化(ARPO: Agentic Reinforced Policy Optimization)は,マルチターンLDMエージェントを学習するためのエージェントRLアルゴリズムである。
論文 参考訳(メタデータ) (2025-07-26T07:53:11Z) - Prompt-Tuned LLM-Augmented DRL for Dynamic O-RAN Network Slicing [5.62872273155603]
大規模言語モデル(LLM)は、無秩序なネットワークフィードバックを意味のある潜在表現に構造化する。
O-RANスライシングでは、SNR、パワーレベル、スループットといった概念が意味的に関連している。
学習可能なプロンプトをLLM拡張DRLフレームワークに統合した文脈化に基づく適応手法を提案する。
論文 参考訳(メタデータ) (2025-05-31T14:12:56Z) - Robust Prompt Optimization for Large Language Models Against
Distribution Shifts [80.6757997074956]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて重要な能力を示している。
本稿では,LLMの分散シフトに対するロバストな最適化法を提案する。
この問題は、ラベル付けされたソースグループに最適化されたプロンプトを同時にラベル付けされていないターゲットグループに一般化する必要がある。
論文 参考訳(メタデータ) (2023-05-23T11:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。