論文の概要: Competition over data: how does data purchase affect users?
- arxiv url: http://arxiv.org/abs/2201.10774v1
- Date: Wed, 26 Jan 2022 06:44:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-27 20:42:25.541415
- Title: Competition over data: how does data purchase affect users?
- Title(参考訳): データに対する競争: データ購入がユーザに与える影響は?
- Authors: Yongchan Kwon, Antonio Ginart, James Zou
- Abstract要約: 競合する予測者がラベル付きデータを取得して予測品質を向上させるとどうなるかを検討する。
この現象は、競合が各予測者に集団のサブセットを専門化するよう促すトレードオフによって自然に起こることを示す。
- 参考スコア(独自算出の注目度): 15.644822986029377
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: As machine learning (ML) is deployed by many competing service providers, the
underlying ML predictors also compete against each other, and it is
increasingly important to understand the impacts and biases from such
competition. In this paper, we study what happens when the competing predictors
can acquire additional labeled data to improve their prediction quality. We
introduce a new environment that allows ML predictors to use active learning
algorithms to purchase labeled data within their budgets while competing
against each other to attract users. Our environment models a critical aspect
of data acquisition in competing systems which has not been well-studied
before. We found that the overall performance of an ML predictor improves when
predictors can purchase additional labeled data. Surprisingly, however, the
quality that users experience -- i.e. the accuracy of the predictor selected by
each user -- can decrease even as the individual predictors get better. We show
that this phenomenon naturally arises due to a trade-off whereby competition
pushes each predictor to specialize in a subset of the population while data
purchase has the effect of making predictors more uniform. We support our
findings with both experiments and theories.
- Abstract(参考訳): マシンラーニング(ML)は多くの競合サービスプロバイダによってデプロイされるため、基盤となるML予測器も互いに競合するようになり、このような競合の影響やバイアスを理解することがますます重要になる。
本稿では,競合する予測者がラベル付きデータを取得して予測品質を向上できる場合について検討する。
我々はML予測者がアクティブな学習アルゴリズムを使って予算内でラベル付きデータを購入できる新しい環境を導入し、ユーザを引き付けるために競合する。
私たちの環境は、これまでよく研究されていなかった競合システムにおけるデータ取得の重要な側面をモデル化しています。
ML予測器の全体的な性能は、予測器が追加のラベル付きデータを購入できる場合に向上することがわかった。
しかし、意外なことに、ユーザが経験する品質、すなわち、各ユーザが選択した予測器の精度は、個々の予測器が良くなるにつれて低下する可能性がある。
この現象は、データ購入が予測者をより均一にする効果がある一方で、競合相手が各予測者を集団のサブセットに特化するよう促すトレードオフによって自然に発生することを示す。
我々は実験と理論の両方で発見を支持している。
関連論文リスト
- Do We Really Even Need Data? [2.3749120526936465]
研究者は、事前学習されたアルゴリズムの予測を結果変数として利用している。
推測のための標準的なツールは、真で観測されていない結果が予測された値に置き換えられたときに、独立変数と利害関係の関連性を誤って表現することができる。
論文 参考訳(メタデータ) (2024-01-14T23:19:21Z) - Cross-Prediction-Powered Inference [15.745692520785074]
クロスプレディクション(Cross-prediction)は、機械学習を利用した推論の検証方法である。
予測による推論の適応よりもクロス予測の方が一貫して強力であることを示す。
論文 参考訳(メタデータ) (2023-09-28T17:01:58Z) - Learning for Counterfactual Fairness from Observational Data [62.43249746968616]
公正な機械学習は、人種、性別、年齢などの特定の保護された(感受性のある)属性によって記述されるある種のサブグループに対して、学習モデルのバイアスを取り除くことを目的としている。
カウンターファクトフェアネスを達成するための既存の手法の前提条件は、データに対する因果モデルの事前の人間の知識である。
本研究では,新しいフレームワークCLAIREを提案することにより,因果関係を付与せずに観測データから対実的に公正な予測を行う問題に対処する。
論文 参考訳(メタデータ) (2023-07-17T04:08:29Z) - Is augmentation effective to improve prediction in imbalanced text
datasets? [3.1690891866882236]
データ拡張なしでカットオフを調整することは、オーバーサンプリング手法と同じような結果をもたらすと我々は主張する。
この結果は、不均衡なデータを扱うための様々なアプローチの長所と短所の理解に寄与する。
論文 参考訳(メタデータ) (2023-04-20T13:07:31Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Competing AI: How does competition feedback affect machine learning? [14.350250426090893]
コンペティションによって予測者が特定のサブ人口に特化し、一般人口よりもパフォーマンスが悪くなることを示す。
市場に競合する予測者が多すぎるか多すぎることが、全体的な予測品質を損なう可能性があることを示す。
論文 参考訳(メタデータ) (2020-09-15T00:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。