論文の概要: Variational Bayesian Inference for Crowdsourcing Predictions
- arxiv url: http://arxiv.org/abs/2006.00778v2
- Date: Tue, 2 Jun 2020 02:53:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 05:45:21.730700
- Title: Variational Bayesian Inference for Crowdsourcing Predictions
- Title(参考訳): クラウドソーシング予測のための変分ベイズ推定
- Authors: Desmond Cai, Duc Thien Nguyen, Shiau Hong Lim, Laura Wynter
- Abstract要約: 2つの異なる作業者ノイズモデルに対する変分ベイズ手法を開発した。
合成および実世界のデータセットに対する我々の評価は、これらの手法が既存の非ベイズ的手法よりもはるかに優れていることを示している。
- 参考スコア(独自算出の注目度): 6.878219199575748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowdsourcing has emerged as an effective means for performing a number of
machine learning tasks such as annotation and labelling of images and other
data sets. In most early settings of crowdsourcing, the task involved
classification, that is assigning one of a discrete set of labels to each task.
Recently, however, more complex tasks have been attempted including asking
crowdsource workers to assign continuous labels, or predictions. In essence,
this involves the use of crowdsourcing for function estimation. We are
motivated by this problem to drive applications such as collaborative
prediction, that is, harnessing the wisdom of the crowd to predict quantities
more accurately. To do so, we propose a Bayesian approach aimed specifically at
alleviating overfitting, a typical impediment to accurate prediction models in
practice. In particular, we develop a variational Bayesian technique for two
different worker noise models - one that assumes workers' noises are
independent and the other that assumes workers' noises have a latent low-rank
structure. Our evaluations on synthetic and real-world datasets demonstrate
that these Bayesian approaches perform significantly better than existing
non-Bayesian approaches and are thus potentially useful for this class of
crowdsourcing problems.
- Abstract(参考訳): クラウドソーシングは、アノテーションや画像やその他のデータセットのラベル付けなど、多数の機械学習タスクを実行する効果的な手段として登場した。
クラウドソーシングのほとんどの初期の設定では、タスクは各タスクに個別のラベルセットの1つを割り当てる、分類を含む。
しかし最近では、クラウドソースワーカーに連続ラベルや予測を割り当てるよう求めるなど、より複雑なタスクが試みられている。
本質的に、これは関数推定にクラウドソーシングを使うことを伴う。
私たちはこの問題に動機づけられて、コラボレーティブな予測、すなわち、群衆の知恵を利用してより正確な量を予測するといったアプリケーションを駆動しています。
そこで本研究では,正確な予測モデルに対する典型的な障害であるオーバーフィッティングの緩和を目的としたベイズ手法を提案する。
特に、労働者の騒音が独立していると仮定するものと、労働者の騒音が潜在的な低ランク構造を持つと仮定する2つの異なる労働者ノイズモデルに対する変分ベイズ的手法を開発する。
合成および実世界のデータセットに対する我々の評価は、これらのベイズ的アプローチが既存の非ベイズ的アプローチよりもはるかに優れており、この種のクラウドソーシング問題に潜在的に有用であることを示している。
関連論文リスト
- Adaptive Crowdsourcing Via Self-Supervised Learning [20.393114559367202]
一般的なクラウドソーシングシステムでは、多くのクラウドワーカーがグループ見積もりを作成するために提供した潜在量の推定値が平均される。
我々は,自己教師付き学習と新しいアグリゲーションスキームを活用する新しいアプローチ,予測学習者を開発した。
論文 参考訳(メタデータ) (2024-01-24T05:57:36Z) - Discrete Key-Value Bottleneck [95.61236311369821]
ディープニューラルネットワークは、データストリームがi.d.d.であり、ラベル付きデータが豊富である分類タスクでうまく機能する。
この課題に対処した強力なアプローチの1つは、手軽に利用可能なデータ量に対する大規模なエンコーダの事前トレーニングと、タスク固有のチューニングである。
しかし、新しいタスクを考えると、多くの重みを微調整する必要があるため、エンコーダの重みを更新することは困難であり、その結果、以前のタスクに関する情報を忘れてしまう。
この問題に対処するモデルアーキテクチャを提案し,個別かつ学習可能なキー値符号のペアを含む離散的ボトルネックの上に構築する。
論文 参考訳(メタデータ) (2022-07-22T17:52:30Z) - The Optimal Noise in Noise-Contrastive Learning Is Not What You Think [80.07065346699005]
この仮定から逸脱すると、実際により良い統計的推定結果が得られることが示される。
特に、最適な雑音分布は、データと異なり、また、別の家族からさえも異なる。
論文 参考訳(メタデータ) (2022-03-02T13:59:20Z) - A Worker-Task Specialization Model for Crowdsourcing: Efficient
Inference and Fundamental Limits [20.955889997204693]
クラウドソーシングシステムは、専門家でない労働者を用いて比較的低コストでデータをラベル付けするための効果的なプラットフォームとして登場した。
本稿では、各タスクとワーカーが独自の(未知の)タイプを持つ、$d$-type Specialization modelという新しいモデルを検討する。
本稿では,タスクの種類や作業者のタイプが不明な場合でも,順序的に最適限を満たすラベル推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-19T05:32:59Z) - Crowdsourcing with Meta-Workers: A New Way to Save the Budget [50.04836252733443]
我々は,AIに適したタスクの種類をメタラーニングで学習したマシンアノテータであるEmphmeta-workerの概念を紹介した。
一般の群衆労働者とは異なり、メタワーカーは信頼性があり、安定しており、さらに重要なことはタイヤレスで自由である。
論文 参考訳(メタデータ) (2021-11-07T12:40:29Z) - Robust Deep Learning from Crowds with Belief Propagation [6.643082745560235]
ワーカとタスク間のローカル依存関係を表すグラフィカルモデルは、ノイズの多い回答から真のラベルを推論する原則的な方法を提供する。
多くの場合、本当のラベルではなく、クラウドソースされたデータセットから直接、目に見えないデータに取り組んでいる予測モデルが必要です。
本稿では,ニューラルネットワークがタスク特徴から真のラベルを生成する新しいデータ生成プロセスを提案する。
論文 参考訳(メタデータ) (2021-11-01T07:20:16Z) - Shifts: A Dataset of Real Distributional Shift Across Multiple
Large-Scale Tasks [44.61070965407907]
現場の現状を考えると、分散シフトの影響を受け、様々なモードのタスクの標準化された大規模データセットが必要である。
本研究では,不確実性推定と分布シフトに対するロバスト性評価のためのemphShiftsデータセットを提案する。
論文 参考訳(メタデータ) (2021-07-15T16:59:34Z) - Bayesian Semi-supervised Crowdsourcing [71.20185379303479]
クラウドソーシングは、大規模なデータセットを効率的にラベル付けし、さまざまな学習タスクを実行するための強力なパラダイムとして登場した。
この研究は、半スーパービジョンの2つの体制の下で、半教師付きクラウドソース分類を扱う。
論文 参考訳(メタデータ) (2020-12-20T23:18:51Z) - Leveraging Clickstream Trajectories to Reveal Low-Quality Workers in
Crowdsourced Forecasting Platforms [22.995941896769843]
本稿では,クリックストリームトラジェクトリを用いた作業者のクラスタ識別のための計算フレームワークを提案する。
このフレームワークは、群衆のコンセンサスから遠く離れた精度の予測を行う労働者など、さまざまなタイプのアンダーパフォーマーを明らかにすることができる。
本研究は, クリックストリームクラスタリングと分析が, 群集の知恵を活かしたプラットフォームにおけるクラウドワーカーのパフォーマンスを診断するための基本的なツールであることを示唆する。
論文 参考訳(メタデータ) (2020-09-04T00:26:38Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z) - Plausible Counterfactuals: Auditing Deep Learning Classifiers with
Realistic Adversarial Examples [84.8370546614042]
ディープラーニングモデルのブラックボックスの性質は、彼らがデータから何を学ぶかについて、未回答の疑問を提起している。
GAN(Generative Adversarial Network)とマルチオブジェクトは、監査されたモデルに妥当な攻撃を与えるために使用される。
その実用性は人間の顔の分類タスクの中で示され、提案されたフレームワークの潜在的可能性を明らかにしている。
論文 参考訳(メタデータ) (2020-03-25T11:08:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。