Fugu-MT 論文翻訳(概要): Learning in Position-Aware Multinomial Logit Bandits: From Multiplicative to General Position Effects

論文の概要: Learning in Position-Aware Multinomial Logit Bandits: From Multiplicative to General Position Effects

arxiv url: http://arxiv.org/abs/2605.17238v1
Date: Sun, 17 May 2026 03:28:22 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:47.795735
Title: Learning in Position-Aware Multinomial Logit Bandits: From Multiplicative to General Position Effects
Title（参考訳）: 位置対応型マルチノードロジットバンドの学習:乗算から一般的な位置効果へ
Authors: Xi Chen, Shibo Dai, Jiameng Lyu, Yuan Zhou,
Abstract要約: MNL(Multinomial Logit)選択フレームワークにおける動的関節配置選択と位置決め問題について検討する。本研究は,各積のアトラクションを位置特異因子でスケールする乗法的位置効果モデルから,各積に独立なアトラクションパラメータを割り当てた一般位置効果モデルまで幅広い。
参考スコア（独自算出の注目度）: 7.4613942546828165
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study the dynamic joint assortment selection and positioning problem, where the attraction of each product depends on both its intrinsic appeal and its display position under a Multinomial Logit (MNL) choice framework. Our study ranges from the multiplicative position effects model, in which each product's attraction is scaled by a position-specific factor, to a general position effects model assigning independent attraction parameters to every product--position pair to capture heterogeneous synergies. For both models, we design round-based learning algorithms that update decisions after every single feedback, and establish the first regret-optimal characterization. Besides, our round-based algorithms provide the prompt operations needed by modern platforms. For the multiplicative model, we develop a cross-position pairwise maximum likelihood estimator with a clipping mechanism, and prove that our algorithm P2MLE-UCB attains a regret of $\tilde{O}(\sqrt{NT})$, matching the lower bound and closing the $\sqrt{K}$ gap left by prior epoch-based analyses. For the general model, we establish a minimax lower bound and propose GP2-UCB with a matching upper bound. Moreover, we design an efficient subroutine for the per-round joint assortment and positioning optimization based on Dinkelbach's method and maximum-weight bipartite matching. Numerical experiments on synthetic data and the Expedia dataset show that our algorithms consistently outperform state-of-the-art benchmarks.
Abstract（参考訳）: そこで本研究では,MNL(Multinomial Logit)選択フレームワークの下で,各製品の魅力と表示位置に依存する動的関節配置選択と位置決め問題について検討する。本研究は,各積のアトラクションが位置特異因子によってスケールされる乗法的位置効果モデルから,各積に独立なアトラクションパラメータを割り当てた一般位置効果モデルから,不均一なシナジーを捉えるための配置対まで幅広い。どちらのモデルに対しても,フィードバック1回ごとに決定を更新するラウンドベースの学習アルゴリズムを設計し,最初の後悔と最適な特徴を確立する。さらに、私たちのラウンドベースのアルゴリズムは、現代的なプラットフォームに必要な迅速な操作を提供します。乗法モデルでは、クリッピング機構を持つクロスポジション最大極大推定器を開発し、我々のアルゴリズム P2MLE-UCB が、下界に一致する$\tilde{O}(\sqrt{NT})$を補足し、事前のエポック解析によって残されたギャップを閉じて、後悔することを示す。一般モデルでは,ミニマックス下界を確立し,対応する上界を持つGP2-UCBを提案する。さらに、ディンケルバッハ法と最大重み付き二分法マッチングに基づいて、円周関節配置と位置決め最適化のための効率的なサブルーチンを設計する。合成データとExpediaデータセットの数値実験により、我々のアルゴリズムは一貫して最先端のベンチマークを上回ります。

関連論文リスト

RANSAC Scoring Functions: Analysis and Reality Check [0.0]
我々は,候補となる幾何モデルにスコア(適合の質)を割り当てることの問題を再考する。しきい値に基づくパラメータ化は、確率ベースでロバストなM推定器の統一的なビューにつながることを示す。
論文参考訳（メタデータ） (2025-12-22T20:08:46Z)
Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [45.99743804547533]
2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。 TPAUC最適化のための既存のアルゴリズムは未探索のままである。 TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文参考訳（メタデータ） (2025-05-28T03:55:05Z)
Kullback-Leibler Barycentre of Stochastic Processes [0.0]
エージェントが様々な専門家のモデルに対する見解と洞察を組み合わせることを目的とした問題を考える。バリセントモデルの存在と特異性を示し、ラドン-ニコディム微分の明示的な表現を証明する。組み合わせモデルの最適ドリフトを近似する2つのディープラーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-07-05T20:45:27Z)
MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.47072100963017]
Amortized Pareto Front (MAP) を用いた新しい低演算アルゴリズム Model Merging を導入する。 MAPは、複数のモデルをマージするためのスケーリング係数のセットを効率的に識別し、関連するトレードオフを反映する。また,タスク数が比較的少ないシナリオではベイジアンMAP,タスク数の多い状況ではNested MAPを導入し,計算コストを削減した。
論文参考訳（メタデータ） (2024-06-11T17:55:25Z)
Sample-efficient Learning of Infinite-horizon Average-reward MDPs with General Function Approximation [53.17668583030862]
一般関数近似の文脈において,無限水平平均逆マルコフ決定過程(AMDP)について検討する。最適化最適化(LOOP)と呼ばれる新しいアルゴリズムフレームワークを提案する。我々は LOOP がサブ線形 $tildemathcalO(mathrmpoly(d, mathrmsp(V*)) sqrtTbeta )$ regret を達成することを示す。
論文参考訳（メタデータ） (2024-04-19T06:24:22Z)
Towards Efficient Pareto-optimal Utility-Fairness between Groups in Repeated Rankings [7.6275971668447005]
消費者と生産者のパレート最適バランスを保証し、ランキングの列を計算する問題に対処する。本稿では,全ての項目が露出する点を表すペルムタヘドロンであるExpohedronを用いて,上記の問題に対する新しいアプローチを提案する。さらに,Expohedronの囲む$n$-sphereの最適化問題を緩和し,実行時間を大幅に改善する効率的な手法を提案する。
論文参考訳（メタデータ） (2024-02-22T05:48:54Z)
Improving Sample Efficiency of Model-Free Algorithms for Zero-Sum Markov Games [66.2085181793014]
モデルフリーのステージベースQ-ラーニングアルゴリズムはモデルベースアルゴリズムと同じ$H$依存の最適性を享受できることを示す。本アルゴリズムは,楽観的値関数と悲観的値関数のペアとして参照値関数を更新するキーとなる新しい設計を特徴とする。
論文参考訳（メタデータ） (2023-08-17T08:34:58Z)
BOtied: Multi-objective Bayesian optimization with tied multivariate ranks [33.414682601242006]
本稿では,非支配解と結合累積分布関数の極端量子化との自然な関係を示す。このリンクにより、我々はPareto対応CDFインジケータと関連する取得関数BOtiedを提案する。種々の合成および実世界の問題に対する実験により,BOtied は最先端MOBO 取得関数より優れていることが示された。
論文参考訳（メタデータ） (2023-06-01T04:50:06Z)
Transformers meet Stochastic Block Models: Attention with Data-Adaptive Sparsity and Cost [53.746169882193456]
最近の研究は、自己注意の二次的コストを克服するために、様々なスパークアテンションモジュールを提案している。本稿では,それぞれの注意を混合メンバーシップブロックモデルで表現することで,両方の問題を解決するモデルを提案する。我々のモデルは、以前の効率的な変種とオリジナルのトランスフォーマーより優れており、十分に注目されています。
論文参考訳（メタデータ） (2022-10-27T15:30:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。