論文の概要: Improving Human-Labeled Data through Dynamic Automatic Conflict
Resolution
- arxiv url: http://arxiv.org/abs/2012.04169v1
- Date: Tue, 8 Dec 2020 02:22:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:29:45.063289
- Title: Improving Human-Labeled Data through Dynamic Automatic Conflict
Resolution
- Title(参考訳): 動的自動コンフリクト解決によるヒューマンラベルデータの改善
- Authors: David Q. Sun, Hadas Kotek, Christopher Klein, Mayank Gupta, William
Li, Jason D. Williams
- Abstract要約: 本稿では,典型的なクラウドソーシング意味的アノテーションタスクによって生成されるラベルのノイズを,スケーラブルに推定する手法を提案する。
これは、他の一般的なラベリング戦略と比較して、ラベリングプロセスのエラーを最大20-30%削減する。
- 参考スコア(独自算出の注目度): 3.704650670259798
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper develops and implements a scalable methodology for (a) estimating
the noisiness of labels produced by a typical crowdsourcing semantic annotation
task, and (b) reducing the resulting error of the labeling process by as much
as 20-30% in comparison to other common labeling strategies. Importantly, this
new approach to the labeling process, which we name Dynamic Automatic Conflict
Resolution (DACR), does not require a ground truth dataset and is instead based
on inter-project annotation inconsistencies. This makes DACR not only more
accurate but also available to a broad range of labeling tasks. In what follows
we present results from a text classification task performed at scale for a
commercial personal assistant, and evaluate the inherent ambiguity uncovered by
this annotation strategy as compared to other common labeling strategies.
- Abstract(参考訳): 本稿では, (a) 一般的なクラウドソーシング・セマンティック・アノテーションタスクによるラベルのノイズを推定するスケーラブルな手法を開発し, (b) 他の一般的なラベル手法と比較して, ラベル処理のエラーを最大20~30%低減する手法を提案する。
重要なことに、このラベル付けプロセスに対する新しいアプローチは、動的自動競合解決(DACR)と呼ばれ、基礎となる真理データセットを必要とせず、プロジェクト間アノテーションの不整合に基づいている。
これにより、DACRはより正確であるだけでなく、幅広いラベリングタスクにも利用できる。
以下では,商用パーソナルアシスタントに対して大規模に実施したテキスト分類タスクの結果を示し,他の一般的なラベリング戦略と比較して,このアノテーション戦略によって明らかにされる固有のあいまいさを評価する。
関連論文リスト
- Leveraging Label Semantics and Meta-Label Refinement for Multi-Label Question Classification [11.19022605804112]
本稿では,新手法RR2QCを多ラベル質問分類に適用する。
ラベルセマンティクスとメタラベルの改良を使用して、パーソナライズされた学習とリソースレコメンデーションを強化する。
実験の結果,RR2QCはPrecision@kとF1スコアの既存の分類方法よりも優れていた。
論文 参考訳(メタデータ) (2024-11-04T06:27:14Z) - IntenDD: A Unified Contrastive Learning Approach for Intent Detection
and Discovery [12.905097743551774]
バックボーンを符号化する共有発話を利用した統一手法であるIntenDDを提案する。
IntenDDは完全に教師なしのコントラスト学習戦略を用いて表現学習を行う。
当社のアプローチは,3つのタスクのすべてにおいて,競争上のベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2023-10-25T16:50:24Z) - Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - Robust Representation Learning for Unreliable Partial Label Learning [86.909511808373]
部分ラベル学習(Partial Label Learning, PLL)は、弱い教師付き学習の一種で、各トレーニングインスタンスに候補ラベルのセットが割り当てられる。
これはUn Reliable partial Label Learning (UPLL) と呼ばれ、部分ラベルの本質的な信頼性の欠如とあいまいさにより、さらなる複雑さをもたらす。
本研究では,信頼できない部分ラベルに対するモデル強化を支援するために,信頼性に欠けるコントラスト学習を活用するUnreliability-Robust Representation Learning framework(URRL)を提案する。
論文 参考訳(メタデータ) (2023-08-31T13:37:28Z) - IDAS: Intent Discovery with Abstractive Summarization [16.731183915325584]
目的発見における近年の競合手法は,抽象的な要約に基づく発話のクラスタリングによってより優れることを示す。
我々は、大規模言語モデルに促すことで、記述的発話ラベルの集合を収集するIDASアプローチに貢献する。
発話とそのノイズラベルは、凍結した事前訓練されたエンコーダによって符号化され、その後クラスタ化され、潜伏した意図を回復する。
論文 参考訳(メタデータ) (2023-05-31T12:19:40Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - A Deep Model for Partial Multi-Label Image Classification with Curriculum Based Disambiguation [42.0958430465578]
部分多重ラベル(PML)画像分類問題について検討する。
既存のPMLメソッドは通常、ノイズの多いラベルをフィルタリングするための曖昧な戦略を設計する。
本稿では,PMLの表現能力と識別能力を高めるための深層モデルを提案する。
論文 参考訳(メタデータ) (2022-07-06T02:49:02Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Learning with Noisy Labels by Targeted Relabeling [52.0329205268734]
クラウドソーシングプラットフォームは、ディープニューラルネットワークをトレーニングするためのデータセット収集によく使用される。
本稿では,少数のアノテーションを予約して,高い確率でラベル付け可能なエラーを明示的に緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T20:37:29Z) - Group-aware Label Transfer for Domain Adaptive Person Re-identification [179.816105255584]
Unsupervised Adaptive Domain (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインデータセットで訓練されたモデルを、さらなるアノテーションなしでターゲットドメインデータセットに適応することを目的としている。
最も成功したUDA-ReIDアプローチは、クラスタリングに基づく擬似ラベル予測と表現学習を組み合わせて、2つのステップを交互に実行する。
疑似ラベル予測と表現学習のオンラインインタラクションと相互促進を可能にするグループ認識ラベル転送(GLT)アルゴリズムを提案します。
論文 参考訳(メタデータ) (2021-03-23T07:57:39Z) - Few-shot Slot Tagging with Collapsed Dependency Transfer and
Label-enhanced Task-adaptive Projection Network [61.94394163309688]
本稿では,現在最先端の少数ショット分類モデルであるTapNetに基づくラベル強化タスク適応プロジェクションネットワーク(L-TapNet)を提案する。
実験結果から,本モデルは1ショット設定で14.64点のF1スコアで最強の少ショット学習ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-06-10T07:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。