論文の概要: How to Purchase Labels? A Cost-Effective Approach Using Active Learning Markets
- arxiv url: http://arxiv.org/abs/2511.20605v1
- Date: Tue, 25 Nov 2025 18:34:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.614567
- Title: How to Purchase Labels? A Cost-Effective Approach Using Active Learning Markets
- Title(参考訳): ラベルの購入方法 : アクティブラーニング市場を用いた費用対効果アプローチ
- Authors: Xiwen Huang, Pierre Pinson,
- Abstract要約: ラベルの購入手段として,アクティブな学習市場を紹介し,分析する。
これは、機能やサンプルを購入するためにすでに存在する多くの提案とは対照的である。
本稿では,単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単元単
- 参考スコア(独自算出の注目度): 2.7429630700600893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce and analyse active learning markets as a way to purchase labels, in situations where analysts aim to acquire additional data to improve model fitting, or to better train models for predictive analytics applications. This comes in contrast to the many proposals that already exist to purchase features and examples. By originally formalising the market clearing as an optimisation problem, we integrate budget constraints and improvement thresholds into the label acquisition process. We focus on a single-buyer-multiple-seller setup and propose the use of two active learning strategies (variance based and query-by-committee based), paired with distinct pricing mechanisms. They are compared to a benchmark random sampling approach. The proposed strategies are validated on real-world datasets from two critical application domains: real estate pricing and energy forecasting. Results demonstrate the robustness of our approach, consistently achieving superior performance with fewer labels acquired compared to conventional methods. Our proposal comprises an easy-to-implement practical solution for optimising data acquisition in resource-constrained environments.
- Abstract(参考訳): モデル適合性を改善するために新たなデータを取得すること,あるいは予測分析アプリケーションのためのモデルトレーニングを改善することを目的とした,ラベル購入の手段として,アクティブな学習市場を紹介し,分析する。
これは、機能やサンプルを購入するためにすでに存在する多くの提案とは対照的である。
当初、市場クリアリングを最適化問題として定式化することにより、予算制約と改善しきい値をラベル取得プロセスに統合する。
本稿では,単層複数販売方式に着目し,異なる価格設定機構と組み合わせた2つのアクティブラーニング戦略(分散ベースとクエリ・バイ・コミットベース)を提案する。
これらは、ベンチマークランダムサンプリングアプローチと比較される。
提案した戦略は、不動産価格とエネルギー予測という2つの重要なアプリケーション領域の実際のデータセットで検証される。
その結果,従来の手法に比べてラベルの獲得が少なかったため,優れた性能を保ちながら,アプローチの堅牢性を示すことができた。
本提案では,資源制約環境におけるデータ取得を最適化するための実践的ソリューションを提案する。
関連論文リスト
- On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - Transfer Learning for Nonparametric Contextual Dynamic Pricing [17.420508136662257]
動的価格戦略は、市場条件や顧客特性に基づいて価格を調整することで、企業が収益を最大化する上で不可欠である。
この制限を克服するための有望なアプローチの1つは、関連する製品や市場からの情報を活用して、焦点となる価格決定を知らせることである。
本稿では,ソースドメインからの事前収集データを効果的に活用し,対象ドメインの価格決定を効率化する,新しいTLDPアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-31T01:05:04Z) - Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning [70.22819290458581]
人間のフィードバックによる強化学習(RLHF)は、現在の大規模言語モデルパイプラインにおいて広く採用されているアプローチである。
提案手法では,(1)OODを回避するためのオン・ポリシー・クエリと,(2)プライオリティ・クエリの最も情報性の高いデータを選択するためのアクティブ・ラーニングという2つの重要なイノベーションを導入している。
論文 参考訳(メタデータ) (2024-07-02T10:09:19Z) - How Many Validation Labels Do You Need? Exploring the Design Space of
Label-Efficient Model Ranking [40.39898960460575]
本稿では,LEMR (Label-Efficient Model Ranking) を提案し,MoraBench Benchmarkを提案する。
LEMRは、未ラベルのバリデーションセットからインスタンスを戦略的にアノテートすることで、モデル選択におけるコストのかかるアノテーションの必要性を最小限にする新しいフレームワークである。
論文 参考訳(メタデータ) (2023-12-04T04:20:38Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and
Multi-Period Optimization Approach [29.11201102550876]
半パラメトリック構造モデルを構築し、価格の弾力性を学習し、対物需要を予測する。
本稿では,有限販売地平線上での消耗品全体の利益を最大化するために,多周期動的価格アルゴリズムを提案する。
提案されたフレームワークは、よく知られたeコマースの新鮮な小売シナリオであるFreshippoにうまくデプロイされている。
論文 参考訳(メタデータ) (2021-05-18T07:01:37Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Toward Optimal Probabilistic Active Learning Using a Bayesian Approach [4.380488084997317]
アクティブラーニングは、コストの高いラベリングリソースを効率よく効果的に割り当てることで、ラベリングコストを削減することを目的としている。
提案したモデルにおける既存の選択戦略を再構築することにより、どの側面が現在の最先端に包含されていないかを説明することができる。
論文 参考訳(メタデータ) (2020-06-02T15:59:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。