論文の概要: RTBAgent: A LLM-based Agent System for Real-Time Bidding
- arxiv url: http://arxiv.org/abs/2502.00792v1
- Date: Sun, 02 Feb 2025 13:10:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:59:57.891153
- Title: RTBAgent: A LLM-based Agent System for Real-Time Bidding
- Title(参考訳): RTBAgent:リアルタイム自転車用LLMエージェントシステム
- Authors: Leng Cai, Junxuan He, Yikai Li, Junjie Liang, Yuanping Lin, Ziming Quan, Yawen Zeng, Jin Xu,
- Abstract要約: リアルタイム入札(Real-Time Bidding, RTB)は、広告主がインプレッション機会に即座に競争入札を行うことを可能にする。
これらの課題に対処するため、RTBAgentは大規模言語モデル(LLM)に基づく最初のRTBエージェントシステムとして提案されている。
本稿では,RTBAgentが過去の決定やトランザクション記録をレビューできる2段階の意思決定プロセスとマルチメモリ検索機構を提案する。
- 参考スコア(独自算出の注目度): 11.49782135521099
- License:
- Abstract: Real-Time Bidding (RTB) enables advertisers to place competitive bids on impression opportunities instantaneously, striving for cost-effectiveness in a highly competitive landscape. Although RTB has widely benefited from the utilization of technologies such as deep learning and reinforcement learning, the reliability of related methods often encounters challenges due to the discrepancies between online and offline environments and the rapid fluctuations of online bidding. To handle these challenges, RTBAgent is proposed as the first RTB agent system based on large language models (LLMs), which synchronizes real competitive advertising bidding environments and obtains bidding prices through an integrated decision-making process. Specifically, obtaining reasoning ability through LLMs, RTBAgent is further tailored to be more professional for RTB via involved auxiliary modules, i.e., click-through rate estimation model, expert strategy knowledge, and daily reflection. In addition, we propose a two-step decision-making process and multi-memory retrieval mechanism, which enables RTBAgent to review historical decisions and transaction records and subsequently make decisions more adaptive to market changes in real-time bidding. Empirical testing with real advertising datasets demonstrates that RTBAgent significantly enhances profitability. The RTBAgent code will be publicly accessible at: https://github.com/CaiLeng/RTBAgent.
- Abstract(参考訳): リアルタイム入札 (Real-Time Bidding, RTB) は広告主が競争力のある入札を即座にインプレッションの機会に配置し、競争力の高いランドスケープで費用対効果を追求することを可能にする。
RTBは、深層学習や強化学習といった技術の利用から広く恩恵を受けているが、オンラインとオフライン環境の相違やオンライン入札の急激な変動により、関連する手法の信頼性が課題に直面することが多い。
これらの課題に対処するため、RTBAgentは大規模言語モデル(LLM)に基づく最初のRTBエージェントシステムとして提案され、実際の競争的な広告入札環境を同期させ、統合された意思決定プロセスを通じて入札価格を取得する。
具体的には、RTBAgent は LLM を通して推論能力を得ることができ、RTBAgent は、関与する補助モジュール、すなわちクリックスルーレート推定モデル、専門家戦略知識、日々のリフレクションにより、RTB にとってよりプロフェッショナルになるように調整されている。
さらに,RTBAgentが過去の決定や取引記録をレビューし,その後,リアルタイム入札における市場の変化に適応させる2段階の意思決定プロセスとマルチメモリ検索機構を提案する。
実広告データセットによる実証テストは、RTBAgentが収益性を大幅に向上させることを示している。
RTBAgentコードは、https://github.com/CaiLeng/RTBAgent.comで公開される。
関連論文リスト
- Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding [4.741091524027138]
リアルタイム入札(RTB)はオンライン広告エコシステムにおいて重要な役割を担っている。
従来の手法では、動的な予算配分問題を効果的に管理することはできない。
マルチチャネル入札最適化のための階層型マルチエージェント強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-26T05:26:30Z) - Efficient and Deployable Knowledge Infusion for Open-World Recommendations via Large Language Models [53.547190001324665]
大規模言語モデル(LLM)からユーザとアイテムに関する2種類の外部知識を取得するためのREKIを提案する。
個別の知識抽出と個別の知識抽出を,異なるシナリオのスケールに合わせて開発し,オフラインのリソース消費を効果的に削減する。
実験によると、REKIは最先端のベースラインより優れており、多くの推奨アルゴリズムやタスクと互換性がある。
論文 参考訳(メタデータ) (2024-08-20T03:45:24Z) - When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.19252983108372]
LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文 参考訳(メタデータ) (2024-07-15T06:49:30Z) - A Blockchain-based Platform for Reliable Inference and Training of
Large-Scale Models [1.323497585762675]
我々は、大規模モデルの信頼性の高い推論とトレーニングを保証するために特別に設計された、新しいプラットフォームであるBRAINを紹介する。
BRAINはユニークな2フェーズトランザクション機構を利用し、パイプライニングによるリアルタイム処理を可能にする。
BRAINは、合理的なガス料金でかなり高い推論スループットを提供する。
論文 参考訳(メタデータ) (2023-05-06T14:21:41Z) - Adaptive Risk-Aware Bidding with Budget Constraint in Display
Advertising [47.14651340748015]
本稿では,強化学習による予算制約を考慮した適応型リスク対応入札アルゴリズムを提案する。
リスク・アット・バリュー(VaR)に基づく不確実性とリスク傾向の本質的関係を理論的に明らかにする。
論文 参考訳(メタデータ) (2022-12-06T18:50:09Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Data-Driven Online Interactive Bidding Strategy for Demand Response [0.30586855806896046]
需要応答(DR)は、ピークシェービングのサービスを提供し、短い応答期間と低コストで再生可能エネルギー利用の効率を高める。
自動DR、インセンティブDR、緊急DR、需要入札など、さまざまなカテゴリーのDRが確立されている。
本稿では,スマートメーターデータと関数を併用した入札・購買戦略について検討する。
その結果, 多様な状況に直面した場合, 提案モデルでは, 入札ルールをオフラインで学習し, 適切な入札を行うことにより, 最適利益を得ることができることがわかった。
論文 参考訳(メタデータ) (2022-02-09T02:44:20Z) - A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in
Online Advertising [53.636153252400945]
本稿では,自動入札のための総合的マルチエージェント強化学習フレームワーク,すなわちMAABを提案し,自動入札戦略を学習する。
当社のアプローチは、社会的福祉の観点から、いくつかの基準的手法を上回り、広告プラットフォームの収益を保証します。
論文 参考訳(メタデータ) (2021-06-11T08:07:14Z) - Techniques Toward Optimizing Viewability in RTB Ad Campaigns Using
Reinforcement Learning [0.0]
強化学習(Reinforcement Learning, RL)は、環境との相互作用を通じて意思決定エージェントを訓練する効果的な手法である。
デジタル広告において、リアルタイム入札(Real-time bidding、RTB)は、リアルタイムオークションを通じて広告インベントリを割り当てる一般的な方法である。
論文 参考訳(メタデータ) (2021-05-21T21:56:12Z) - Optimal Bidding Strategy without Exploration in Real-time Bidding [14.035270361462576]
予算制約によるユーティリティの最大化は、リアルタイム入札(RTB)システムにおける広告主の主要な目標である。
それまでの作品は、検閲された国家の困難を和らげるために競売に敗れたことを無視していた。
本稿では,リアルタイムトラフィックで観測される真の分布の挙動を模倣するために,最大エントロピー原理を用いた新しい実用的枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-31T20:43:28Z) - MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding [47.555870679348416]
そこで本研究では,MoTiACというマルチエクティブ・アクタ・クリティカルスアルゴリズムを提案する。
従来のRLモデルとは異なり、提案されたMoTiACは複雑な入札環境で同時に多目的タスクを達成できる。
論文 参考訳(メタデータ) (2020-02-18T07:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。