論文の概要: Trading Vector Data in Vector Databases
- arxiv url: http://arxiv.org/abs/2511.07139v1
- Date: Mon, 10 Nov 2025 14:20:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.299516
- Title: Trading Vector Data in Vector Databases
- Title(参考訳): ベクトルデータベースにおける取引ベクトルデータ
- Authors: Jin Cheng, Xiangxiang Dai, Ningning Ding, John C. S. Lui, Jianwei Huang,
- Abstract要約: オンライン学習では,販売者が不確実な検索コストに直面し,購入者が投稿した価格にフィードバックを提供する。
1)構成学習における不均一な部分的フィードバック,(2)価格学習における変数的および複雑なフィードバック,(3)構成と価格決定の間の固有の結合である。
- 参考スコア(独自算出の注目度): 40.491965422030525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vector data trading is essential for cross-domain learning with vector databases, yet it remains largely unexplored. We study this problem under online learning, where sellers face uncertain retrieval costs and buyers provide stochastic feedback to posted prices. Three main challenges arise: (1) heterogeneous and partial feedback in configuration learning, (2) variable and complex feedback in pricing learning, and (3) inherent coupling between configuration and pricing decisions. We propose a hierarchical bandit framework that jointly optimizes retrieval configurations and pricing. Stage I employs contextual clustering with confidence-based exploration to learn effective configurations with logarithmic regret. Stage II adopts interval-based price selection with local Taylor approximation to estimate buyer responses and achieve sublinear regret. We establish theoretical guarantees with polynomial time complexity and validate the framework on four real-world datasets, demonstrating consistent improvements in cumulative reward and regret reduction compared with existing methods.
- Abstract(参考訳): ベクトルデータトレーディングは、ベクトルデータベースによるクロスドメイン学習には不可欠だが、ほとんど探索されていない。
オンライン学習では,販売者が不確実な検索コストに直面し,購入者が投稿価格に対して確率的なフィードバックを提供する。
1)構成学習における不均一な部分的フィードバック,(2)価格学習における変数的および複雑なフィードバック,(3)構成と価格決定の間の固有の結合である。
検索設定と価格を協調的に最適化する階層的帯域幅フレームワークを提案する。
ステージ1では、信頼に基づく探索とコンテキストクラスタリングを使用して、対数的後悔を伴う効果的な構成を学習します。
ステージIIは、局所的なテイラー近似を用いた間隔ベースの価格選択を採用し、買い手反応を推定し、サブ線形後悔を達成する。
我々は,多項式時間複雑性による理論的保証を確立し,実世界の4つのデータセット上でのフレームワークの検証を行い,既存の手法と比較して累積報酬と後悔の削減の一貫性を実証した。
関連論文リスト
- Spatial Supply Repositioning with Censored Demand Data [10.797160099834306]
我々は、一方通行のオンデマンド車両共有サービスによるネットワーク在庫システムについて検討する。
このような一般的な在庫ネットワークにおいて最適なポリシーを見つけることは解析的にも計算的にも困難である。
我々の研究は、共有モビリティビジネスの生存性における在庫管理の重要性を強調している。
論文 参考訳(メタデータ) (2025-01-31T15:16:02Z) - Learning to Price with Resource Constraints: From Full Information to Machine-Learned Prices [13.68761797358598]
我々はknapsackによる動的価格問題について検討し、資源制約下での探索と利用のバランスをとることの課題に対処する。
本稿では, 事前情報を持たないシナリオを対象としたオンライン学習アルゴリズムと, 予測誤りを既知の上限付きマシン学習情報量を利用した推定-then-select re-solveアルゴリズムの3つのアルゴリズムを紹介する。
論文 参考訳(メタデータ) (2025-01-24T00:46:52Z) - Dual-Agent Deep Reinforcement Learning for Dynamic Pricing and Replenishment [15.273192037219077]
不整合決定周波数下での動的価格設定と補充問題について検討する。
我々は、包括的な市場データに基づいてトレーニングされた決定木に基づく機械学習アプローチを統合する。
このアプローチでは、2つのエージェントが価格と在庫を処理し、さまざまなスケールで更新される。
論文 参考訳(メタデータ) (2024-10-28T15:12:04Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning [70.22819290458581]
人間のフィードバックによる強化学習(RLHF)は、現在の大規模言語モデルパイプラインにおいて広く採用されているアプローチである。
提案手法では,(1)OODを回避するためのオン・ポリシー・クエリと,(2)プライオリティ・クエリの最も情報性の高いデータを選択するためのアクティブ・ラーニングという2つの重要なイノベーションを導入している。
論文 参考訳(メタデータ) (2024-07-02T10:09:19Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z) - Multitask Learning and Bandits via Robust Statistics [3.103098467546532]
意思決定者は、しばしば多くの関連するが不均一な学習問題に直面している。
本稿では,この構造をサンプル効率良く活用する2段階マルチタスク学習推定器を提案する。
我々の推定器は、一般的な失業推定器と比較して、特徴次元$d$のサンプル複雑性境界を改善した。
論文 参考訳(メタデータ) (2021-12-28T17:37:08Z) - Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning [100.73223416589596]
深層強化学習を用いたコスト依存型ポートフォリオ選択手法を提案する。
具体的には、価格系列パターンと資産相関の両方を抽出するために、新しい2ストリームポートフォリオポリシーネットワークを考案した。
蓄積したリターンを最大化し、強化学習によるコストの両立を抑えるため、新たなコスト感受性報酬関数が開発された。
論文 参考訳(メタデータ) (2020-03-06T06:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。