論文の概要: NH-CROP: Robust Pricing for Governed Language Data Assets under Cost Uncertainty
- arxiv url: http://arxiv.org/abs/2605.01745v1
- Date: Sun, 03 May 2026 06:48:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.919998
- Title: NH-CROP: Robust Pricing for Governed Language Data Assets under Cost Uncertainty
- Title(参考訳): NH-CROP: コスト不確実性下での言語データ集合のロバスト価格
- Authors: Xu Zheng, Feiyu Wu, Zhuocheng Wang, Yiming Dai, Hui Li,
- Abstract要約: 我々は,管理言語データ資産のオンライン価格を,コストの不確実性の下で検討する。
我々は、無害な情報取得ゲートを備えた堅牢な価格設定フレームワークであるtextscNH-CROPを紹介した。
- 参考スコア(独自算出の注目度): 7.123785374544969
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Language data are increasingly acquired and governed as assets, yet platforms often price candidate resources before knowing their true privacy or access costs. We study online pricing for governed language data assets under cost uncertainty. At each round, a platform observes an NLP task, a candidate asset, and a coarse cost estimate, may pay for a refined cost signal, posts a price, and receives safe net revenue. We introduce \textsc{NH-CROP}, a clipped robust pricing framework with a no-harm information-acquisition gate. The method compares direct pricing, risk-aware pricing, and verify-then-price, and acquires information only when its estimated decision value exceeds the best no-verification alternative. Across synthetic, real-proxy, and downstream-utility-grounded benchmarks, clipped \textsc{NH-CROP} variants improve or remain competitive with price-only and risk-aware baselines. Causal ablations show that paid verification is not the main source of gains in real-proxy and utility-grounded settings: the strongest learned policies often choose not to verify. Oracle and high-decision-value diagnostics show that refined cost information can still have substantial local value. Overall, governed language-data platforms should calibrate pricing under uncertain access costs first and verify only when information is cheap and decision-actionable.
- Abstract(参考訳): 言語データは資産として取得され、管理されるようになっているが、プラットフォームは真のプライバシやアクセスコストを知る前に、候補リソースを価格に設定することが多い。
我々は,管理言語データ資産のオンライン価格を,コストの不確実性の下で検討する。
各ラウンドにおいて、プラットフォームは、NLPタスク、候補資産、および粗いコスト見積を観察し、洗練されたコストシグナルを支払い、価格を投稿し、安全な純利益を受け取ることができる。
我々は,無害な情報取得ゲートを備えたロバストな価格設定フレームワークである‘textsc{NH-CROP} を紹介した。
本手法は, 直接価格, リスク対応価格, バリデーション価格を比較し, その推定決定値が最良不確定値を超える場合にのみ情報を取得する。
合成、実プロキシ、ダウンストリームユーティリティグラウンドベンチマーク全体において、クリップされた \textsc{NH-CROP} 変種は、価格のみのベースラインとリスク対応ベースラインとの競争性を改善し、維持する。
因果解法は、有給検証が実際のプロキシとユーティリティグラウンドの設定における利益の主な源ではないことを示している。
Oracleと高精度な診断は、洗練されたコスト情報は依然として相当な局所的な価値を持つことを示している。
全体として、管理された言語データプラットフォームは、まず不確実なアクセスコストで価格を調整し、情報が安価で意思決定可能な場合にのみ検証する必要がある。
関連論文リスト
- The Price of Ignorance: Information-Free Quotation for Data Retention in Machine Unlearning [9.926764766573056]
我々は,ユーザのパラメータの知識を必要とせず,ユーザがデータ供給を自己選択する情報フリーな上昇引用機構を設計する。
我々は、最適パーソナライズされた価格(すべてを知っている)と情報のない引用(何も知らない)との福祉ギャップを、無視の価格を形式化する。
論文 参考訳(メタデータ) (2026-04-13T14:14:35Z) - Early Classification of Time Series in Non-Stationary Cost Regimes [0.1259953341639576]
時系列の早期分類(ECTS)は、できるだけ早く予測をしなければならない意思決定の問題に対処する。
既存の手法の多くは、学習目的を規定する時間依存意思決定コストは、既知の、固定された、そして正しく指定されていると仮定している。
本研究では,非定常性(非定常性)の実践的形態として,誤分類と意思決定遅延コストのバランスの漂流と,名目的訓練時間モデルから逸脱した意思決定コストの実現の2つについて検討する。
論文 参考訳(メタデータ) (2026-01-31T22:09:56Z) - All That Glisters Is Not Gold: A Benchmark for Reference-Free Counterfactual Financial Misinformation Detection [67.89888669159899]
RFC Benchは、現実的なニュースの下で財務的な誤情報に関する大規模な言語モデルを評価するためのベンチマークである。
このベンチマークでは、2つの補完的なタスクが定義されている。
論文 参考訳(メタデータ) (2026-01-07T18:18:28Z) - Cost-Optimal Active AI Model Evaluation [71.2069549142394]
生成AIシステムの開発には、継続的な評価、データ取得、アノテーションが必要である。
我々は、安価だがしばしば不正確で弱いレーダの使用を積極的にバランスさせる新しいコスト認識手法を開発した。
我々は、弱者と強者の間で所定のアノテーション予算を割り当てるためのコスト最適化政策のファミリーを導出する。
論文 参考訳(メタデータ) (2025-06-09T17:14:41Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - A Marketplace Price Anomaly Detection System at Scale [3.8632181427836945]
MoatPlusは、成長するマーケットプレースプラットフォームのためのスケーラブルな価格異常検出フレームワークである。
価格に基づく機能の不規則を検出するために、モデルのアンサンブルを構築します。
提案手法は, 高精度アンカーカバレッジを最大46.6%向上させる。
論文 参考訳(メタデータ) (2023-10-06T16:41:51Z) - Insurance pricing on price comparison websites via reinforcement
learning [7.023335262537794]
本稿では,モデルベースとモデルフリーの手法を統合することで,最適価格政策を学習する強化学習フレームワークを提案する。
また、オフラインデータセットを一貫した方法で価格ポリシーを評価することの重要性を強調した。
論文 参考訳(メタデータ) (2023-08-14T04:44:56Z) - Hierarchical Adaptive Contextual Bandits for Resource Constraint based
Recommendation [49.69139684065241]
コンテキスト多重武装バンディット(MAB)は、様々な問題において最先端のパフォーマンスを達成する。
本稿では,階層型適応型文脈帯域幅法(HATCH)を提案する。
論文 参考訳(メタデータ) (2020-04-02T17:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。