論文の概要: Semi-verified Learning from the Crowd with Pairwise Comparisons
- arxiv url: http://arxiv.org/abs/2106.07080v1
- Date: Sun, 13 Jun 2021 20:05:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 08:01:59.472539
- Title: Semi-verified Learning from the Crowd with Pairwise Comparisons
- Title(参考訳): 対比較による群衆からの半検証学習
- Authors: Shiwei Zeng and Jie Shen
- Abstract要約: 本研究では,豊かなクエリによるブール値関数のクラウドソースによるPAC学習の課題について検討する。
特に、学習者は、与えられたインスタンスのラベルや、一対のインスタンスの比較タグを取得するために、群衆に問い合わせることができると考えている。
これは難しい問題であり、最近になって、群衆の大半が正しいシナリオのために予算効率のアルゴリズムが確立されたばかりです。
- 参考スコア(独自算出の注目度): 4.8728183994912415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of {\em crowdsourced PAC learning} of Boolean-valued
functions through enriched queries, a problem that has attracted a surge of
recent research interests. In particular, we consider that the learner may
query the crowd to obtain a label of a given instance or a comparison tag of a
pair of instances. This is a challenging problem and only recently have
budget-efficient algorithms been established for the scenario where the
majority of the crowd are correct. In this work, we investigate the
significantly more challenging case that the majority are incorrect which
renders learning impossible in general. We show that under the {semi-verified
model} of Charikar~et~al.~(2017), where we have (limited) access to a trusted
oracle who always returns the correct annotation, it is possible to learn the
underlying function while the labeling cost is significantly mitigated by the
enriched and more easily obtained queries.
- Abstract(参考訳): 本研究では,最近の研究の関心の高まりを生かした,boolean-valued関数の"em crowdsourced pac learning"の問題について検討する。
特に、学習者は、与えられたインスタンスのラベルまたは一対のインスタンスの比較タグを取得するために、群衆に問い合わせることができる。
これは難しい問題であり、最近になって、群衆の大半が正しいシナリオのために予算効率のアルゴリズムが確立された。
本研究は,学習を一般的に不可能にしている多数派が誤りであることを示す。
また,Charikar~et~al.〜(2017)の半検証モデルの下では,常に正しいアノテーションを返却する信頼できる託主に対して(限定的な)アクセスが可能であり,ラベル付けコストがリッチで容易に得られるクエリによって著しく軽減される一方で,基礎となる関数を学習可能であることを示す。
関連論文リスト
- From Chaos to Clarity: Claim Normalization to Empower Fact-Checking [57.024192702939736]
Claim Normalization(別名 ClaimNorm)は、複雑でノイズの多いソーシャルメディア投稿を、より単純で分かりやすい形式に分解することを目的としている。
本稿では,チェーン・オブ・ソートとクレーム・チェック・バシネス推定を利用した先駆的アプローチであるCACNを提案する。
実験により, CACNは様々な評価尺度において, いくつかの基準値を上回る性能を示した。
論文 参考訳(メタデータ) (2023-10-22T16:07:06Z) - Correcting Underrepresentation and Intersectional Bias for Fair
Classification [55.2480439325792]
偏見バイアスによって劣化したデータから学習する問題について考察し, 正の例を, 一定の数のセンシティブなグループに対して, 異なる未知のレートでフィルタする。
交叉群のメンバーシップが各交叉率を計算不能にするような設定であっても,少数の偏りのないデータを用いてグループワイド・ドロップアウトパラメータを効率的に推定できることが示される。
我々は,この学習と再重み付け過程をカプセル化するアルゴリズムを提案し,高い確率で真の分布に対する仮説のリスクが任意に近いことをPACスタイルの強い保証を提供する。
論文 参考訳(メタデータ) (2023-06-19T18:25:44Z) - Find a witness or shatter: the landscape of computable PAC learning [63.26015736148707]
本稿では,最近の3つのオープンな質問を解き,CPAC学習可能性の研究に寄与する。
まず,全てのCPAC学習可能なクラスが,サンプルの複雑さで適切なCPAC学習が可能なクラスに含まれることを証明した。
第二に、適切に学習できるが、計算不能に急速に増加するサンプルの複雑さに限り、決定可能な仮説のクラスが存在することを示す。
論文 参考訳(メタデータ) (2023-02-06T02:52:36Z) - PAC Verification of Statistical Algorithms [0.10878040851637999]
本研究では,PAC学習目標を満たす仮説(機械学習モデル)を対話的証明を用いて検証する,PAC検証の設定を開発する。
我々は、$mathbbR$を超える間隔の和のPAC検証のためのプロトコルを提案し、そのタスクの提案したプロトコルを改善し、より低い境界の$d$への依存と一致させる。
最終結果は,クエリの制約を満たす統計的アルゴリズムの検証のためのプロトコルである。
論文 参考訳(メタデータ) (2022-11-28T23:57:27Z) - MaxMatch: Semi-Supervised Learning with Worst-Case Consistency [149.03760479533855]
半教師付き学習(SSL)のための最悪ケース整合正則化手法を提案する。
本稿では,ラベル付きトレーニングデータとラベル付きトレーニングデータとを別々に比較した経験的損失項からなるSSLの一般化について述べる。
この境界によって動機づけられたSSLの目的は、元のラベルのないサンプルと、その複数の拡張版との最大の矛盾を最小限に抑えるものである。
論文 参考訳(メタデータ) (2022-09-26T12:04:49Z) - Analyzing Lottery Ticket Hypothesis from PAC-Bayesian Theory Perspective [25.157282476221482]
我々は、PAC-ベイズ理論がLTHと一般化行動の関係を明確に理解できることを示した。
PAC-Bayesバウンダリをスパイク・アンド・スラブ分布を用いて,入賞チケットの分析を行う。
論文 参考訳(メタデータ) (2022-05-15T15:58:27Z) - Learning Stochastic Majority Votes by Minimizing a PAC-Bayes
Generalization Bound [15.557653926558638]
分類器の有限アンサンブルに対する多数票の対について検討し、その一般化特性について検討する。
ディリクレ分布でインスタンス化し、予測されるリスクに対して閉じた形式と微分可能な表現を可能にする。
結果の多数決学習アルゴリズムは、最先端の精度と(非空きな)厳密な境界から恩恵を得る。
論文 参考訳(メタデータ) (2021-06-23T16:57:23Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Efficient PAC Learning from the Crowd with Pairwise Comparison [7.594050968868919]
PAC学習しきい値関数の問題を,アノテータが(騒々しい)ラベルやペア比較タグを付与できる群から検討する。
我々は、学習とアノテーションをインターリーブするラベル効率のアルゴリズムを設計し、アルゴリズムの一定のオーバーヘッドをもたらす。
論文 参考訳(メタデータ) (2020-11-02T16:37:55Z) - Probably Approximately Correct Constrained Learning [135.48447120228658]
我々は、ほぼ正しい学習フレームワーク(PAC)に基づく一般化理論を開発する。
PAC学習可能なクラスも制約のある学習者であるという意味では,学習者の導入は学習問題を難しくするものではないことを示す。
このソリューションの特性を分析し,制約付き学習が公平でロバストな分類における問題にどのように対処できるかを説明する。
論文 参考訳(メタデータ) (2020-06-09T19:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。