論文の概要: Learning Ambiguity from Crowd Sequential Annotations
- arxiv url: http://arxiv.org/abs/2301.01579v1
- Date: Wed, 4 Jan 2023 12:53:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 15:05:43.394394
- Title: Learning Ambiguity from Crowd Sequential Annotations
- Title(参考訳): 集団系列アノテーションからあいまいさを学ぶ
- Authors: Xiaolei Lu
- Abstract要約: 多くのクラウドソーシング学習手法は、アノテータ間の不一致をノイズラベリングとして扱う。
本稿では,信頼性アノテータ間の相違を検討するために,クラウドシークエンシャルsからの学習あいまい性(Learning Ambiguity)というフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.370633147306388
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most crowdsourcing learning methods treat disagreement between annotators as
noisy labelings while inter-disagreement among experts is often a good
indicator for the ambiguity and uncertainty that is inherent in natural
language. In this paper, we propose a framework called Learning Ambiguity from
Crowd Sequential Annotations (LA-SCA) to explore the inter-disagreement between
reliable annotators and effectively preserve confusing label information.
First, a hierarchical Bayesian model is developed to infer ground-truth from
crowds and group the annotators with similar reliability together. By modeling
the relationship between the size of group the annotator involved in, the
annotator's reliability and element's unambiguity in each sequence,
inter-disagreement between reliable annotators on ambiguous elements is
computed to obtain label confusing information that is incorporated to
cost-sensitive sequence labeling. Experimental results on POS tagging and NER
tasks show that our proposed framework achieves competitive performance in
inferring ground-truth from crowds and predicting unknown sequences, and
interpreting hierarchical clustering results helps discover labeling patterns
of annotators with similar reliability.
- Abstract(参考訳): 多くのクラウドソーシング学習手法は、アノテータ間の不一致をノイズラベリングとして扱う一方で、専門家間の意見の相違は、自然言語に固有の曖昧さと不確実性を示す良い指標である。
本稿では,信頼性のあるアノテーション間の差異を探索し,紛らわしいラベル情報を効果的に保存するために,クラウド・シーケンシャルアノテーション(la-sca)からの学習曖昧性(learning ambiguity)という枠組みを提案する。
まず, 階層ベイズモデルを用いて, 群集から地中を推定し, 同様の信頼性で注釈をグループ化する。
関係するアノテータのサイズ、各シーケンスにおけるアノテータの信頼性と要素の曖昧さの関係をモデル化することにより、あいまいな要素に対する信頼できるアノテータ間の差異を計算し、コストに敏感なシーケンスラベリングに組み込まれたラベル混乱情報を得る。
posタグとnerタスクの実験結果から,提案手法は,群集から基底を推測し未知のシーケンスを予測し,階層的クラスタリングの結果を解釈することで,類似した信頼性を持つ注釈者のラベル付けパターンを発見できることがわかった。
関連論文リスト
- Dynamic Correlation Learning and Regularization for Multi-Label Confidence Calibration [60.95748658638956]
本稿では,多ラベルシナリオにおける信頼度を適切に評価することを目的としたマルチラベル信頼性タスクを提案する。
既存のシングルラベルキャリブレーション手法では、セマンティックな混乱に対処するために欠かせないカテゴリ相関を考慮できない。
本稿では,多粒度セマンティック相関を利用した動的相関学習と正規化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-09T13:26:21Z) - A Unified Label-Aware Contrastive Learning Framework for Few-Shot Named Entity Recognition [6.468625143772815]
ラベル認識型トークンレベルのコントラスト学習フレームワークを提案する。
提案手法は,ラベルのセマンティクスを接尾辞のプロンプトとして活用することでコンテキストを豊かにする。
コンテキストネイティブとコンテキストラベルの対比学習目標を同時に最適化する。
論文 参考訳(メタデータ) (2024-04-26T06:19:21Z) - Drawing the Same Bounding Box Twice? Coping Noisy Annotations in Object
Detection with Repeated Labels [6.872072177648135]
そこで本研究では,基礎的真理推定手法に適合する新しい局所化アルゴリズムを提案する。
また,本アルゴリズムは,TexBiGデータセット上でのトレーニングにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-18T13:08:44Z) - Robust Representation Learning for Unreliable Partial Label Learning [86.909511808373]
部分ラベル学習(Partial Label Learning, PLL)は、弱い教師付き学習の一種で、各トレーニングインスタンスに候補ラベルのセットが割り当てられる。
これはUn Reliable partial Label Learning (UPLL) と呼ばれ、部分ラベルの本質的な信頼性の欠如とあいまいさにより、さらなる複雑さをもたらす。
本研究では,信頼できない部分ラベルに対するモデル強化を支援するために,信頼性に欠けるコントラスト学習を活用するUnreliability-Robust Representation Learning framework(URRL)を提案する。
論文 参考訳(メタデータ) (2023-08-31T13:37:28Z) - A Confidence-based Partial Label Learning Model for Crowd-Annotated
Named Entity Recognition [74.79785063365289]
名前付きエンティティ認識(NER)のための既存のモデルは、主に大規模ラベル付きデータセットに基づいている。
我々は,クラウドアノテートNERに対する先行信頼度(アノテータによる提案)と後続信頼度(モデルによる学習)を統合するために,信頼に基づく部分ラベル学習(CPLL)手法を提案する。
論文 参考訳(メタデータ) (2023-05-21T15:31:23Z) - Adversary-Aware Partial label learning with Label distillation [47.18584755798137]
本稿では、Ad-Aware partial Label Learningを紹介し、各インスタンスの候補ラベルのコレクションに、ノイズの多いラベルのセットである$textitrival$を紹介します。
提案手法は, CIFAR10, CIFAR100, CUB200データセットに対して有望な結果を得る。
論文 参考訳(メタデータ) (2023-04-02T10:18:30Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Semi-Supervised Learning of Semantic Correspondence with Pseudo-Labels [26.542718087103665]
SemiMatchは意味論的に類似した画像間の密接な対応を確立するための半教師付きソリューションである。
筆者らのフレームワークは,ソースと弱増強ターゲット間のモデル予測自体を用いて擬似ラベルを生成し,擬似ラベルを用いてソースと強増強ターゲット間のモデルの再学習を行う。
実験では、SemiMatchは様々なベンチマーク、特にPF-Willowにおける最先端のパフォーマンスを大きなマージンで達成している。
論文 参考訳(メタデータ) (2022-03-30T03:52:50Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。