論文の概要: Crowdsourcing Learning as Domain Adaptation: A Case Study on Named
Entity Recognition
- arxiv url: http://arxiv.org/abs/2105.14980v1
- Date: Mon, 31 May 2021 14:11:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 17:37:01.863052
- Title: Crowdsourcing Learning as Domain Adaptation: A Case Study on Named
Entity Recognition
- Title(参考訳): ドメイン適応型クラウドソーシング学習--名前付きエンティティ認識を事例として
- Authors: Xin Zhang, Guangwei Xu, Yueheng Sun, Meishan Zhang, Pengjun Xie
- Abstract要約: この作業では、個々のアノテーションに関して、すべてのクラウドソースアノテーションをゴールドスタンダードとして扱う点が異なる。
クラウドソーシングはドメイン適応と非常によく似ており,近年のクロスドメイン手法の進歩は,クラウドソーシングにほぼ直接適用可能である。
本研究は,クラウドソーシングの非教師的および教師的双方の学習について検討し,小規模のエキスパートアノテーションが利用できないか,あるいは利用できないことを仮定する。
- 参考スコア(独自算出の注目度): 19.379850806513232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowdsourcing is regarded as one prospective solution for effective
supervised learning, aiming to build large-scale annotated training data by
crowd workers. Previous studies focus on reducing the influences from the
noises of the crowdsourced annotations for supervised models. We take a
different point in this work, regarding all crowdsourced annotations as
gold-standard with respect to the individual annotators. In this way, we find
that crowdsourcing could be highly similar to domain adaptation, and then the
recent advances of cross-domain methods can be almost directly applied to
crowdsourcing. Here we take named entity recognition (NER) as a study case,
suggesting an annotator-aware representation learning model that inspired by
the domain adaptation methods which attempt to capture effective domain-aware
features. We investigate both unsupervised and supervised crowdsourcing
learning, assuming that no or only small-scale expert annotations are
available. Experimental results on a benchmark crowdsourced NER dataset show
that our method is highly effective, leading to a new state-of-the-art
performance. In addition, under the supervised setting, we can achieve
impressive performance gains with only a very small scale of expert
annotations.
- Abstract(参考訳): クラウドソーシングは、クラウドワーカーによる大規模アノテートトレーニングデータの構築を目的とした、効果的な教師付き学習のための有望なソリューションであると考えられている。
これまでの研究は、クラウドソースアノテーションによる教師付きモデルに対するノイズの影響の低減に重点を置いていた。
この作業では、個々のアノテーションに関して、すべてのクラウドソースアノテーションをゴールドスタンダードとして扱う点が異なる。
このようにして、クラウドソーシングはドメイン適応と非常によく似ており、最近のクロスドメイン手法の進歩はクラウドソーシングにほぼ直接適用できる。
ここでは、名前付きエンティティ認識(ner)を研究事例として、効果的なドメイン認識機能を取り込もうとするドメイン適応法に触発されたアノテーション-アウェア表現学習モデルを提案する。
クラウドソーシング学習の教師なし,教師なし,教師なしの双方を調査し,小規模のエキスパートアノテーションが利用可能でないことを仮定した。
ベンチマーククラウドソースによるNERデータセットの実験結果から,本手法は高い有効性を示し,新たな最先端性能を実現した。
さらに、監督された設定の下では、非常に小さな専門家のアノテーションだけで素晴らしいパフォーマンス向上を達成できます。
関連論文リスト
- Diverse Deep Feature Ensemble Learning for Omni-Domain Generalized Person Re-identification [30.208890289394994]
Person ReIDメソッドは、異なるデータセット間でトレーニングとテストを行うと、パフォーマンスが大幅に低下する。
本研究は,ドメイン一般化手法が単一データセットのベンチマークにおいて,単一ドメイン管理手法を著しく過小評価していることを明らかにする。
本稿では,自己アンサンブルによる深い特徴の多様性を生かし,ODG-ReIDを実現する方法を提案する。
論文 参考訳(メタデータ) (2024-10-11T02:27:11Z) - Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - CDFSL-V: Cross-Domain Few-Shot Learning for Videos [58.37446811360741]
ビデオのアクション認識は、いくつかのラベル付き例でのみ、新しいカテゴリを認識するための効果的なアプローチである。
既存のビデオアクション認識の方法は、同じドメインからの大きなラベル付きデータセットに依存している。
本稿では,自己教師付き学習とカリキュラム学習を活用した,クロスドメインな数ショットビデオ行動認識手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T19:44:27Z) - Prompting Diffusion Representations for Cross-Domain Semantic
Segmentation [101.04326113360342]
拡散事前学習は、セマンティックセグメンテーションのための並外れた領域一般化結果を達成する。
本研究では,シーンプロンプトとプロンプトランダム化戦略を導入し,セグメンテーションヘッドを訓練する際に,ドメイン不変情報をさらに混乱させる。
論文 参考訳(メタデータ) (2023-07-05T09:28:25Z) - Accelerating exploration and representation learning with offline
pre-training [52.6912479800592]
1つのオフラインデータセットから2つの異なるモデルを別々に学習することで、探索と表現の学習を改善することができることを示す。
ノイズコントラスト推定と補助報酬モデルを用いて状態表現を学習することで、挑戦的なNetHackベンチマークのサンプル効率を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2023-03-31T18:03:30Z) - Feature Diversity Learning with Sample Dropout for Unsupervised Domain
Adaptive Person Re-identification [0.0]
本稿では,ノイズの多い擬似ラベルを限定することで,より優れた一般化能力を持つ特徴表現を学習する手法を提案する。
我々は,古典的な相互学習アーキテクチャの下で,FDL(Feature Diversity Learning)と呼ばれる新しい手法を提案する。
実験の結果,提案するFDL-SDは,複数のベンチマークデータセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-01-25T10:10:48Z) - Clustering augmented Self-Supervised Learning: Anapplication to Land
Cover Mapping [10.720852987343896]
本稿では,自己教師型学習のためのクラスタリングに基づくプレテキストタスクを用いて,土地被覆マッピングの新しい手法を提案する。
社会的に関係のある2つのアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-08-16T19:35:43Z) - Multi-Pretext Attention Network for Few-shot Learning with
Self-supervision [37.6064643502453]
補助的なサンプルに依存しない自己教師付き学習のための,新しい拡張不要な手法を提案する。
さらに,従来の拡張信頼手法とGCを組み合わせるために,特定の注意機構を利用するマルチテキスト注意ネットワーク(MAN)を提案する。
miniImageNetおよびtieredImageNetデータセット上でMANを幅広く評価し、提案手法が最新(SOTA)関連手法より優れていることを実証した。
論文 参考訳(メタデータ) (2021-03-10T10:48:37Z) - Self-Supervised Features Improve Open-World Learning [13.880789191591088]
本稿では,インクリメンタル学習,アウトオブディストリビューション検出,オープンワールド学習を組み合わせた統一オープンワールドフレームワークを提案する。
教師なしの特徴表現の下では、未知をラベル外空間または分布外検出のいずれかに分類する。
私たちのパイプラインのインクリメンタルな学習コンポーネントは、imagenet-100プロトコルの最先端と比較して実行するゼロ例のオンラインモデルです。
論文 参考訳(メタデータ) (2021-02-15T21:03:05Z) - Can Semantic Labels Assist Self-Supervised Visual Representation
Learning? [194.1681088693248]
近隣環境におけるコントラスト調整(SCAN)という新しいアルゴリズムを提案する。
一連のダウンストリームタスクにおいて、SCANは従来の完全教師付きおよび自己教師付きメソッドよりも優れたパフォーマンスを達成する。
本研究は, セマンティックラベルが自己指導的手法の補助に有用であることを明らかにする。
論文 参考訳(メタデータ) (2020-11-17T13:25:00Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。