論文の概要: Rate-Optimal Contextual Online Matching Bandit
- arxiv url: http://arxiv.org/abs/2205.03699v1
- Date: Sat, 7 May 2022 18:28:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 14:36:59.377770
- Title: Rate-Optimal Contextual Online Matching Bandit
- Title(参考訳): レート最適コンテキストオンラインマッチング帯域
- Authors: Yuantong Li, Chi-hua Wang, Guang Cheng, Will Wei Sun
- Abstract要約: 我々は、マッチング決定における動的嗜好を可能にする新しいコンテキストオンラインマッチング圧縮(COMBO)について検討する。
本稿では,CC-ETCがサブ線形後悔上界O(log(T))を達成し,一致した下界を証明し,レート最適化アルゴリズムであることを示す。
- 参考スコア(独自算出の注目度): 19.317374572079363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Two-sided online matching platforms have been employed in various markets.
However, agents' preferences in present market are usually implicit and unknown
and must be learned from data. With the growing availability of side
information involved in the decision process, modern online matching
methodology demands the capability to track preference dynamics for agents
based on their contextual information. This motivates us to consider a novel
Contextual Online Matching Bandit prOblem (COMBO), which allows dynamic
preferences in matching decisions. Existing works focus on multi-armed bandit
with static preference, but this is insufficient: the two-sided preference
changes as along as one-side's contextual information updates, resulting in
non-static matching. In this paper, we propose a Centralized Contextual -
Explore Then Commit (CC-ETC) algorithm to adapt to the COMBO. CC-ETC solves
online matching with dynamic preference. In theory, we show that CC-ETC
achieves a sublinear regret upper bound O(log(T)) and is a rate-optimal
algorithm by proving a matching lower bound. In the experiments, we demonstrate
that CC-ETC is robust to variant preference schemes, dimensions of contexts,
reward noise levels, and contexts variation levels.
- Abstract(参考訳): 両面のオンラインマッチングプラットフォームは様々な市場で採用されている。
しかし、現在の市場でのエージェントの好みは通常暗黙的で未知であり、データから学ぶ必要がある。
意思決定プロセスに関わるサイド情報の可用性が高まる中、現代のオンラインマッチング手法では、文脈情報に基づいてエージェントの嗜好ダイナミクスを追跡する能力が要求される。
これは、マッチング決定における動的好みを可能にする、新しいContextual Online Matching Bandit prOblem (COMBO)を考える動機となっている。
既存の作業は静的な選好を伴うマルチアームバンディットに重点を置いているが、これは不十分である。
本稿では,COMBOに適応するためのCC-ETC(Centralized ContextualExplore Then Commit)アルゴリズムを提案する。
CC-ETCは動的好みでオンラインマッチングを解決する。
理論的には、CC-ETC はサブ線形後悔上界 O(log(T)) を達成し、一致した下界を証明してレート最適化アルゴリズムであることを示す。
実験では, CC-ETCは, 異なる選好スキーム, 文脈次元, 報酬雑音レベル, 文脈変動レベルに対して堅牢であることを示した。
関連論文リスト
- Dynamic Weighted Combiner for Mixed-Modal Image Retrieval [8.683144453481328]
フレキシブル検索パラダイムとしてのMixed-Modal Image Retrieval (MMIR) が注目されている。
以前のアプローチは常に2つの重要な要因のため、限られたパフォーマンスを達成する。
以上の課題に対処するための動的重み付け結合器(DWC)を提案する。
論文 参考訳(メタデータ) (2023-12-11T07:36:45Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - Conflict-Based Cross-View Consistency for Semi-Supervised Semantic
Segmentation [34.97083511196799]
半教師付きセマンティックセグメンテーション(SSS)は近年研究の関心が高まっている。
現在の手法は、しばしば擬似ラベリングプロセスの確証バイアスに悩まされる。
本稿では,2分岐協調学習フレームワークに基づく新しいコンフリクトベースクロスビュー整合性(CCVC)手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T14:02:16Z) - Fully Dynamic Online Selection through Online Contention Resolution
Schemes [15.149188998019186]
逆/確率的環境下でのオンライン選択の完全動的問題について検討する。
対戦環境におけるオンライン選択問題に対するアプローチは、オンラインコンテント解決スキームの概念によって与えられる。
論文 参考訳(メタデータ) (2023-01-08T19:35:11Z) - BASM: A Bottom-up Adaptive Spatiotemporal Model for Online Food Ordering
Service [7.088699796818076]
オンライン注文サービス(オンライン注文サービス、英: Online-Ordering Service、FOS)は、ユーザーが望むものを注文するのを助ける位置情報ベースのサービスである。
本稿では、異なる時間的データ分布に適応的に適合する新しい適応モデル(StemporalM)を提案する。
また,BASMの有効性を検証するために,TAUC(Time- period-wise AUC)とCAUC(City-wise AUC)の2つの新しい指標を導入した。
論文 参考訳(メタデータ) (2022-11-22T06:08:57Z) - Age of Semantics in Cooperative Communications: To Expedite Simulation
Towards Real via Offline Reinforcement Learning [53.18060442931179]
協調リレー通信システムにおける状態更新のセマンティックス更新度を測定するための意味学年代(AoS)を提案する。
オンライン・ディープ・アクター・クリティック(DAC)学習手法を,政治時間差学習の枠組みに基づいて提案する。
そこで我々は,以前に収集したデータセットから最適制御ポリシーを推定する,新しいオフラインDAC方式を提案する。
論文 参考訳(メタデータ) (2022-09-19T11:55:28Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z) - Rationalizing Text Matching: Learning Sparse Alignments via Optimal
Transport [14.86310501896212]
本研究では,この選択的合理化アプローチをテキストマッチングに拡張する。
目標は、下流の予測の正当化として、トークンや文などのテキストを共同で選択し、調整することである。
我々のアプローチでは、入力間の最小コストアライメントを見つけるために最適なトランスポート(OT)を採用している。
論文 参考訳(メタデータ) (2020-05-27T01:20:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。