論文の概要: A General Traffic Shaping Protocol in E-Commerce
- arxiv url: http://arxiv.org/abs/2112.14941v1
- Date: Thu, 30 Dec 2021 06:45:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-03 15:48:22.530880
- Title: A General Traffic Shaping Protocol in E-Commerce
- Title(参考訳): eコマースにおける一般交通シェーピングプロトコル
- Authors: Chenlin Shen, Guangda Huzhang, Yuhang Zhou, Chen Liang, Qing Da
- Abstract要約: 本稿では,オンラインEコマースアプリケーションのための一般的なオンライントラフィック形成プロトコルを提案する。
我々のアルゴリズムは素空間における線形プログラミングを直接最適化することができる。
提案アルゴリズムは,従来の産業レベルのトラフィック形成アルゴリズムよりも着実に優れている。
- 参考スコア(独自算出の注目度): 16.54719972714298
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To approach different business objectives, online traffic shaping algorithms
aim at improving exposures of a target set of items, such as boosting the
growth of new commodities. Generally, these algorithms assume that the utility
of each user-item pair can be accessed via a well-trained conversion rate
prediction model. However, for real E-Commerce platforms, there are unavoidable
factors preventing us from learning such an accurate model. In order to break
the heavy dependence on accurate inputs of the utility, we propose a general
online traffic shaping protocol for online E-Commerce applications. In our
framework, we approximate the function mapping the bonus scores, which
generally are the only method to influence the ranking result in the traffic
shaping problem, to the numbers of exposures and purchases. Concretely, we
approximate the above function by a class of the piece-wise linear function
constructed on the convex hull of the explored data points. Moreover, we
reformulate the online traffic shaping problem as linear programming where
these piece-wise linear functions are embedded into both the objective and
constraints. Our algorithm can straightforwardly optimize the linear
programming in the prime space, and its solution can be simply applied by a
stochastic strategy to fulfill the optimized objective and the constraints in
expectation. Finally, the online A/B test shows our proposed algorithm steadily
outperforms the previous industrial level traffic shaping algorithm.
- Abstract(参考訳): 異なるビジネス目標にアプローチするために、オンライントラフィックシェーピングアルゴリズムは、新しい商品の成長を促進するなど、ターゲットのアイテムセットの露出を改善することを目的としている。
一般に、これらのアルゴリズムは、よく訓練された変換率予測モデルを介して、各ユーザ-イムペアのユーティリティにアクセスすることができると仮定する。
しかし、実際のEコマースプラットフォームには、そのような正確なモデルを学ぶのを妨げる必然的な要因があります。
このユーティリティの正確な入力に対する大きな依存を断ち切るために、オンラインEコマースアプリケーションのための一般的なオンライントラフィック形成プロトコルを提案する。
提案手法では,トラヒックシェーピング問題におけるランキング結果に影響を及ぼす唯一の手法であるボーナススコアを,露出数と購入数にマッピングする関数を近似する。
具体的には、探索データ点の凸包上に構築した分割線形関数のクラスにより、上記の関数を近似する。
さらに,オンライントラフィック形成問題を,これらの断片的線形関数を目的と制約の両方に組み込む線形プログラミングとして再構成する。
本アルゴリズムは素数空間における線形計画の最適化を簡便に行うことができ、その解は最適化された目的と期待の制約を満たす確率的戦略によって単純に適用できる。
最後に,オンラインa/bテストでは,提案手法が従来の産業レベルのトラヒックシェーピングアルゴリズムを着実に上回っていることを示す。
関連論文リスト
- SAIL: Self-Improving Efficient Online Alignment of Large Language Models [56.59644677997827]
人間のフィードバックからの強化学習は、大きな言語モデルを人間の好みに合わせるための重要な方法である。
近年の文献では、オンラインRLHF法の設計に焦点が当てられているが、統一された概念的定式化はいまだに欠けている。
提案手法は,計算オーバーヘッドを最小限に抑えたオープンソースデータセットのアライメント性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-06-21T18:05:35Z) - MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot
Learning [52.101643259906915]
本研究では,高次元観測による強化学習におけるオフライン事前学習とオンラインファインチューニングの問題について検討する。
既存のモデルベースオフラインRL法は高次元領域におけるオフラインからオンラインへの微調整には適していない。
本稿では,事前データをモデルベース値拡張とポリシー正則化によって効率的に再利用できるオンラインモデルベース手法を提案する。
論文 参考訳(メタデータ) (2024-01-06T21:04:31Z) - From Function to Distribution Modeling: A PAC-Generative Approach to
Offline Optimization [30.689032197123755]
本稿では、オフラインデータ例の集合を除いて目的関数が不明なオフライン最適化の問題について考察する。
未知の目的関数を学習して最適化するのではなく、より直感的で直接的な視点で、最適化は生成モデルからサンプリングするプロセスと考えることができる。
論文 参考訳(メタデータ) (2024-01-04T01:32:50Z) - Efficient Online Reinforcement Learning with Offline Data [78.92501185886569]
オンライン学習時にオフラインデータを活用するために、既存のオフライン手法を単純に適用できることを示します。
私たちはこれらの設計選択を広範囲に改善し、パフォーマンスに最も影響を与える重要な要因を示します。
これらのシンプルなレコメンデーションの正しい適用によって、既存のアプローチよりも$mathbf2.5times$の改善が得られます。
論文 参考訳(メタデータ) (2023-02-06T17:30:22Z) - Data-Driven Offline Decision-Making via Invariant Representation
Learning [97.49309949598505]
オフラインのデータ駆動意思決定は、アクティブなインタラクションなしで最適化された決定を合成する。
オフラインデータからトレーニングされたモデルへの入力に関して最適化する場合、誤って良いように見えるアウト・オブ・ディストリビューション(OOD)インプットを生成するのは簡単です。
本稿では、オフラインデータ駆動意思決定をドメイン適応として定式化し、最適化された決定値の正確な予測を行うことを目標とする。
論文 参考訳(メタデータ) (2022-11-21T11:01:37Z) - New Auction Algorithms for Path Planning, Network Transport, and
Reinforcement Learning [0.0]
最適および準最適解に対する新しいオークションベースのアルゴリズムを提案する。
アルゴリズムは、オブジェクトの人による競争入札に関連する数学的アイデアに基づいている。
新しいアルゴリズムは、既存の手法よりもいくつかの潜在的な利点がある。
論文 参考訳(メタデータ) (2022-07-19T23:31:36Z) - Cooperative Behavioral Planning for Automated Driving using Graph Neural
Networks [0.5801044612920815]
本研究は,複数の車両を共同で計画することで,都市交差点における交通流の最適化に機械学習アルゴリズムを活用することを提案する。
学習に基づく行動計画にはいくつかの課題が伴い、適切な入力と出力の表現と大量の基幹データを要求する。
自動運転における意思決定のためのオープンソースのシミュレーション環境において,提案手法を訓練し,評価する。
論文 参考訳(メタデータ) (2022-02-23T09:36:15Z) - Dynamic Origin-Destination Matrix Estimation in Urban Traffic Networks [0.05735035463793007]
この問題を二段階最適化問題としてモデル化する。
内部レベルでは、暫定的な旅行需要を前提として、動的な交通割当問題を解決し、利用者の出身地と目的地間のルーティングを決定する。
外層部では,交通ネットワーク内のセンサによって測定された車両数と内層部で発生したカウンタの差を最小限に抑えることを目的として,旅行数とその出発点および目的地の調整を行う。
論文 参考訳(メタデータ) (2022-01-31T21:33:46Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Optimal Robustness-Consistency Trade-offs for Learning-Augmented Online
Algorithms [85.97516436641533]
機械学習予測を取り入れたオンラインアルゴリズムの性能向上の課題について検討する。
目標は、一貫性と堅牢性の両方を備えたアルゴリズムを設計することだ。
機械学習予測を用いた競合解析のための非自明な下界の最初のセットを提供する。
論文 参考訳(メタデータ) (2020-10-22T04:51:01Z) - Nonlinear Traffic Prediction as a Matrix Completion Problem with
Ensemble Learning [1.8352113484137629]
本稿では,信号化トラフィック運用管理における短期的な交通予測の問題に対処する。
高分解能(秒間)におけるセンサ状態の予測に焦点をあてる
私たちのコントリビューションは,3つの洞察を提供するものとして要約することができます。
論文 参考訳(メタデータ) (2020-01-08T13:10:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。