論文の概要: Transfer Learning for Contextual Joint Assortment-Pricing under Cross-Market Heterogeneity
- arxiv url: http://arxiv.org/abs/2603.18114v1
- Date: Wed, 18 Mar 2026 14:48:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:05.776757
- Title: Transfer Learning for Contextual Joint Assortment-Pricing under Cross-Market Heterogeneity
- Title(参考訳): 市場間ヘテロジニティ下におけるコンテクスト的関節補間のための伝達学習
- Authors: Elynn Chen, Xi Chen, Yi Zhang,
- Abstract要約: 我々は,帯域フィードバックを持つ多項ロジット選択モデルの下で,コンテキスト型共同価格の伝達学習について検討した。
UCBスタイルの政策とアグリゲート・then-debias推定を組み合わせたバイアス認識フレームワークを開発した。
- 参考スコア(独自算出の注目度): 6.055048454425298
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study transfer learning for contextual joint assortment-pricing under a multinomial logit choice model with bandit feedback. A seller operates across multiple related markets and observes only posted prices and realized purchases. While data from source markets can accelerate learning in a target market, cross-market differences in customer preferences may introduce systematic bias if pooled indiscriminately. We model heterogeneity through a structured utility shift, where markets share a common contextual utility structure but differ along a sparse set of latent preference coordinates. Building on this, we develop Transfer Joint Assortment-Pricing (TJAP), a bias-aware framework that combines aggregate-then-debias estimation with a UCB-style policy. TJAP constructs two-radius confidence bounds that separately capture statistical uncertainty and transfer-induced bias, uniformly over continuous prices. We establish matching minimax regret bounds of order $\tilde{O}\!\left(d\sqrt{\frac{T}{1+H}} + s_0\sqrt{T}\right),$revealing a transparent variance-bias tradeoff: transfer accelerates learning along shared preference directions, while heterogeneous components impose an irreducible adaptation cost. Numerical experiments corroborate the theory, showing that TJAP outperforms both target-only learning and naive pooling while remaining robust to cross-market differences.
- Abstract(参考訳): 我々は,帯域フィードバックを用いた多項ロジット選択モデルの下で,コンテキスト共役価格の伝達学習について検討した。
売り手は複数の関連市場を渡り、上場価格のみを観察し、購入を実現している。
ソースマーケットからのデータは、ターゲット市場における学習を加速させるが、顧客の嗜好の市場横断的な差異は、プールが無差別に設定された場合、体系的なバイアスをもたらす可能性がある。
我々は、市場が共通の文脈的ユーティリティ構造を共有するが、遅延した選好座標のスパースセットに沿って異なる、構造化されたユーティリティシフトを通じて異質性をモデル化する。
そこで本研究では,総括的デバイアス推定と UCB スタイルのポリシを組み合わせたバイアス対応フレームワークであるTransfer Joint Assortment-Pricing (TJAP) を開発した。
TJAPは統計的不確実性と転送誘起バイアスを別々に捉え、連続価格を均一に上回る2半径信頼境界を構築している。
整合した minimax regret bounds of order $\tilde{O}\!
\left(d\sqrt{\frac{T}{1+H}} + s_0\sqrt{T}\right),$revealing a transparent variance-bias tradeoff: Transferは共有された好み方向に沿って学習を加速し、異種コンポーネントは既約適応コストを課す。
数値実験は、TJAPがターゲットのみの学習とナイーブプールの両方に優れ、市場間の差異に頑健なままであることを示す理論を裏付けるものである。
関連論文リスト
- Towards Distribution-Agnostic Generalized Category Discovery [51.52673017664908]
データ不均衡とオープンエンドの分布は、現実の視覚世界の本質的な特性である。
我々は,BaCon(Self-Balanced Co-Advice contrastive framework)を提案する。
BaConは、対照的な学習ブランチと擬似ラベルブランチで構成され、DA-GCDタスクを解決するためのインタラクティブな監視を提供するために協力して動作する。
論文 参考訳(メタデータ) (2023-10-02T17:39:58Z) - Online covariance estimation for stochastic gradient descent under
Markovian sampling [20.02012768403544]
位数$Obig(sqrtd,n-1/8(log n)1/4big)$の収束率は、状態依存および状態依存マルコフサンプリングの下で確立される。
本手法はロジスティック回帰を用いた戦略分類に適用され, 学習中の特徴を適応的に修正し, 対象クラス分類に影響を与える。
論文 参考訳(メタデータ) (2023-08-03T00:21:30Z) - An IPW-based Unbiased Ranking Metric in Two-sided Markets [3.845857580909374]
本稿では,2つの市場におけるユーザ間のバイアスの複雑な相互作用について論じる。
そこで我々は,2面IPWという新しい推定器を提案し,その位置ベースを両面IPWと呼ぶ。
論文 参考訳(メタデータ) (2023-07-14T01:44:03Z) - Towards Multi-Agent Reinforcement Learning driven Over-The-Counter
Market Simulations [16.48389671789281]
オーバー・ザ・カウンタ市場において,流動性提供者と流動性取扱業者が相互作用するゲームについて検討した。
互いに対戦することで、深層強化学習主体のエージェントは創発的な行動を学ぶ。
遷移性仮定の下で,多エージェントポリシー勾配アルゴリズムの収束率を示す。
論文 参考訳(メタデータ) (2022-10-13T17:06:08Z) - Domain Adaptation with Factorizable Joint Shift [18.95213249351176]
本稿では、サンプリングバイアスの共存を扱うために、新しい仮定であるFacterizable Joint Shift (FJS)を提案する。
FJSは2つの要因間のバイアスの独立を前提としている。
また,共同重要度推定器を得るための識別学習目的であるJA(Joint Importance Aligning)を提案する。
論文 参考訳(メタデータ) (2022-03-06T07:58:51Z) - Learning Equilibria in Matching Markets from Bandit Feedback [139.29934476625488]
不確実性の下で安定した市場成果を学習するためのフレームワークとアルゴリズムを開発する。
私たちの研究は、大規模なデータ駆動の市場において、いつ、どのように安定したマッチングが生じるかを明らかにするための第一歩を踏み出します。
論文 参考訳(メタデータ) (2021-08-19T17:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。