論文の概要: QueryMarket: Cost-Aware Online Active Learning in Data Markets
- arxiv url: http://arxiv.org/abs/2606.17805v1
- Date: Tue, 16 Jun 2026 11:28:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.401636
- Title: QueryMarket: Cost-Aware Online Active Learning in Data Markets
- Title(参考訳): QueryMarket: データ市場におけるコスト対応オンラインアクティブラーニング
- Authors: Xiwen Huang, Pierre Pinson,
- Abstract要約: 我々は,データ価格と情報駆動選択を統合したOVBAL(オンライン分散に基づくアクティブラーニング)を提案する。
OVBALは、非定常ストリームと不均一なラベルコストに適応する、単純で完全なオンライン決定ルールを提供する。
合成データと実世界の太陽光発電予測タスクの実験は、OVBALが特に売り手中心の価格で有効であることを示している。
- 参考スコア(独自算出の注目度): 2.7429630700600893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data acquisition is a major bottleneck for learning in real-time streams: analysts must decide on the fly which labels to purchase while respecting a rolling budget. However, existing online active learning rarely unifies pricing, information gain, and rolling budget constraints under concept drift. We introduce QueryMarket, a market-inspired framework that queries each incoming data point based on its estimated utility to the model and its price. Within this framework, we propose OVBAL (online variance-based active learning), which integrates data pricing with information-driven selection by estimating each sample's marginal utility via a D-optimality criterion with exponential forgetting and executing cost-aware purchases under rolling budget constraints. OVBAL yields a simple, fully online decision rule that adapts to nonstationary streams and heterogeneous label costs. Experiments on synthetic data and a real-world solar power generation forecasting task show that OVBAL is particularly effective under seller-centric pricing and yields a more favorable long-run error-cost trade-off in the real-world task under both pricing schemes.
- Abstract(参考訳): データ取得は、リアルタイムストリームで学ぶ上での大きなボトルネックである。アナリストは、ローリング予算を尊重しながら、どのラベルを購入するかを決めなければならない。
しかし、既存のオンラインアクティブラーニングは、価格、情報ゲイン、そしてコンセプトドリフトの下でのローリング予算の制約を統合することは滅多にない。
我々はQueryMarketを紹介した。QueryMarketはマーケットにインスパイアされたフレームワークで、モデルとその価格に対する推定ユーティリティに基づいて、各入ってくるデータポイントを問合せする。
本フレームワークでは,データ価格と情報駆動選択を統合したOVBAL(オンライン分散型アクティブラーニング)を提案する。
OVBALは、非定常ストリームと不均一なラベルコストに適応する、単純で完全なオンライン決定ルールを提供する。
合成データと実世界の太陽光発電予測タスクの実験は、OVBALが特に売り手中心の価格で有効であることを示し、両方の価格体系の下で現実のタスクにおいてより好ましい長期的エラーコストトレードオフをもたらすことを示している。
関連論文リスト
- How to Purchase Labels? A Cost-Effective Approach Using Active Learning Markets [2.7429630700600893]
ラベルの購入手段として,アクティブな学習市場を紹介し,分析する。
これは、機能やサンプルを購入するためにすでに存在する多くの提案とは対照的である。
本稿では,単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単
論文 参考訳(メタデータ) (2025-11-25T18:34:33Z) - BAT: Benchmark for Auto-bidding Task [67.56067222427946]
本稿では,最も普及している2種類のオークション形式を含むオークションベンチマークを提案する。
我々は,新しいデータセットに基づいて,一連の堅牢なベースラインを実装した。
このベンチマークは、研究者や実践者が革新的なオートバイディングアルゴリズムを開発し、洗練するための、ユーザフレンドリで直感的なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-05-13T12:12:34Z) - Compute-Constrained Data Selection [77.06528009072967]
多くの強力なデータ選択手法は、ほとんど計算に最適ではないことが分かりました。
計算最適トレーニングでは、パープレキシティと勾配データ選択は、それぞれ5xと10xのトレーニング-選択モデルサイズ比を必要とする。
論文 参考訳(メタデータ) (2024-10-21T17:11:21Z) - A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints [54.46126953873298]
顧客に対して順次表示される補完アイテムの動的価格設定の問題に対処する。
各項目の価格を個別に最適化するのは効果がないため、補完項目のコヒーレントな価格ポリシーが不可欠である。
実世界のデータからランダムに生成した合成設定を用いて,我々のアプローチを実証的に評価し,制約違反や後悔の観点からその性能を比較した。
論文 参考訳(メタデータ) (2024-07-08T09:55:31Z) - A Bargaining-based Approach for Feature Trading in Vertical Federated
Learning [54.51890573369637]
本稿では,垂直的フェデレートラーニング(VFL)において,経済的に効率的な取引を促進するための交渉型特徴取引手法を提案する。
当社のモデルでは,収益ベース最適化の目的を考慮し,パフォーマンスゲインベースの価格設定を取り入れている。
論文 参考訳(メタデータ) (2024-02-23T10:21:07Z) - Data Acquisition: A New Frontier in Data-centric AI [65.90972015426274]
まず、現在のデータマーケットプレースを調査し、データセットに関する詳細な情報を提供するプラットフォームが不足していることを明らかにする。
次に、データプロバイダと取得者間のインタラクションをモデル化するベンチマークであるDAMチャレンジを紹介します。
提案手法の評価は,機械学習における効果的なデータ取得戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-11-22T22:15:17Z) - Addressing Budget Allocation and Revenue Allocation in Data Market
Environments Using an Adaptive Sampling Algorithm [14.206050847214652]
本稿では,予算配分と収益配分を同時に線形時間で解く新しいアルゴリズムを提案する。
新しいアルゴリズムでは、モデルに最も貢献しているプロバイダからデータを選択するアダプティブサンプリングプロセスを採用している。
予算を効率的に利用し,収益配分特性がShapleyに類似していることを示すアルゴリズムを理論的に保証する。
論文 参考訳(メタデータ) (2023-06-05T02:28:19Z) - Stochastic Online Fisher Markets: Static Pricing Limits and Adaptive Enhancements [3.2732273647357437]
我々は、民間で知られたユーティリティーと予算パラメーターを持つユーザが順次到着する、オンライン型のフィッシャーマーケットについて研究する。
この設定では,まず静的な価格設定アルゴリズムの限界について検討し,全ユーザに対して均一な価格設定を行う。
我々は,ユーザの予算とユーティリティパラメータの分布を熟知した適応型ポストプライシングアルゴリズムを設計し,ユーザ消費の過去の観測に基づいて価格を調整した。
論文 参考訳(メタデータ) (2022-04-27T05:03:45Z) - Stream-based Active Learning with Verification Latency in Non-stationary
Environments [6.883906273999368]
本研究では, 有限, 時間可変, 未知の検証遅延が, 概念ドリフトの有無がALアプローチに与える影響について検討する。
PRopagateは、要求されたがまだ知られていないラベルを予測する遅延独立ユーティリティ推定器である。
提案手法が常に最先端の手法よりも優れていることを実証的に示す。
論文 参考訳(メタデータ) (2022-04-14T08:51:15Z) - Data-Driven Online Interactive Bidding Strategy for Demand Response [0.30586855806896046]
需要応答(DR)は、ピークシェービングのサービスを提供し、短い応答期間と低コストで再生可能エネルギー利用の効率を高める。
自動DR、インセンティブDR、緊急DR、需要入札など、さまざまなカテゴリーのDRが確立されている。
本稿では,スマートメーターデータと関数を併用した入札・購買戦略について検討する。
その結果, 多様な状況に直面した場合, 提案モデルでは, 入札ルールをオフラインで学習し, 適切な入札を行うことにより, 最適利益を得ることができることがわかった。
論文 参考訳(メタデータ) (2022-02-09T02:44:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。