論文の概要: Active Learning Over Multiple Domains in Natural Language Tasks
- arxiv url: http://arxiv.org/abs/2202.00254v1
- Date: Tue, 1 Feb 2022 07:27:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-02 22:48:07.792646
- Title: Active Learning Over Multiple Domains in Natural Language Tasks
- Title(参考訳): 自然言語課題における複数領域のアクティブラーニング
- Authors: Shayne Longpre, Julia Reisler, Edward Greg Huang, Yi Lu, Andrew Frank,
Nikhil Ramesh, Chris DuBois
- Abstract要約: 本研究では、アクティブラーニング(AL)、ドメインシフト検出(DS)、マルチドメインサンプリングの様々な技術について調査する。
4種類の手法から18種類の取得関数を抽出し, H-diversergence法, 特に提案した変種DAL-Eが有効であることを示す。
本研究は,自然言語タスクにおける多分野能動的学習に直面する実践者に対して,既存の手法と新しい手法の両方を包括的に分析した最初の事例である。
- 参考スコア(独自算出の注目度): 6.8700723936987975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Studies of active learning traditionally assume the target and source data
stem from a single domain. However, in realistic applications, practitioners
often require active learning with multiple sources of out-of-distribution
data, where it is unclear a priori which data sources will help or hurt the
target domain. We survey a wide variety of techniques in active learning (AL),
domain shift detection (DS), and multi-domain sampling to examine this
challenging setting for question answering and sentiment analysis. We ask (1)
what family of methods are effective for this task? And, (2) what properties of
selected examples and domains achieve strong results? Among 18 acquisition
functions from 4 families of methods, we find H- Divergence methods, and
particularly our proposed variant DAL-E, yield effective results, averaging
2-3% improvements over the random baseline. We also show the importance of a
diverse allocation of domains, as well as room-for-improvement of existing
methods on both domain and example selection. Our findings yield the first
comprehensive analysis of both existing and novel methods for practitioners
faced with multi-domain active learning for natural language tasks.
- Abstract(参考訳): アクティブラーニングの研究は、伝統的にターゲットとソースデータは単一のドメインに由来すると仮定する。
しかし、現実的なアプリケーションでは、実践者は複数のアウト・オブ・ディストリビューションデータソースでアクティブな学習を必要とすることが多い。
質問応答と感情分析の難易度を検討するため, アクティブラーニング(AL), ドメインシフト検出(DS), マルチドメインサンプリングの多種多様な手法を調査した。
1)この課題にどのような方法が有効であるか?
そして、(2)選択された例とドメインの特性は、強い結果をもたらすか?
4種類の方法から得られた18種類の取得関数のうち,h-発散法,特に提案するdal-eは,ランダムベースラインに対して平均2-3%改善した。
また、ドメインの多彩な割り当ての重要性と、既存のメソッドをドメイン選択とサンプル選択の両方で改善する余地があることも示す。
本研究は,自然言語タスクにおけるマルチドメインアクティブラーニングに直面する実践者にとって,既存の方法と新しい方法の両方について,初めて包括的な分析を行うものである。
関連論文リスト
- An Unsupervised Domain Adaptation Method for Locating Manipulated Region in partially fake Audio [43.91918688112442]
多様性とエントロピーを考慮したサンプルマイニング(SDE)という教師なし手法を提案する。
本手法は、まず、ソースドメインの異なる視点から優れたパフォーマンスを達成する多様な専門家のコレクションから学習する。
対象ドメインから未知のサンプルの10%を導入することで、F1スコアは43.84%となり、第2ベット法に比べて77.2%の相対的な増加を示した。
論文 参考訳(メタデータ) (2024-07-11T07:32:16Z) - Domain Adversarial Active Learning for Domain Generalization
Classification [8.003401798449337]
ドメイン一般化モデルは、ソースドメインデータからクロスドメイン知識を学び、未知のターゲットドメインの性能を改善することを目的としている。
近年の研究では、多種多様なソース・ドメイン・サンプルがドメインの一般化能力を高めることが示されている。
そこで本研究では,ドメイン一般化における分類タスクに対するDAAL(Domain-adversarial Active Learning)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-10T10:59:22Z) - Revisiting the Domain Shift and Sample Uncertainty in Multi-source
Active Domain Transfer [69.82229895838577]
Active Domain Adaptation (ADA)は、アノテートするターゲットデータの限られた数を選択することで、新しいターゲットドメインにおけるモデル適応を最大限に向上することを目的としている。
この設定は、複数のソースからトレーニングデータを収集するより実践的なシナリオを無視します。
これは、ADAを単一のソースドメインから複数のソースドメインに拡張する、新しい、挑戦的な知識転送の設定を目標にしています。
論文 参考訳(メタデータ) (2023-11-21T13:12:21Z) - Perturbation-Based Two-Stage Multi-Domain Active Learning [31.073745612552926]
本稿では、よく認識されたASP-MTLモデルに組み込んだ摂動型2段階多段階アクティブラーニング(P2S-MDAL)手法を提案する。
P2S-MDALは、ドメインの予算を割り当て、多様性の選択のための領域を確立する。
モデルの共有特徴抽出器のロバスト性を評価するために摂動距離が導入された。
論文 参考訳(メタデータ) (2023-06-19T04:58:32Z) - Label Distribution Learning for Generalizable Multi-source Person
Re-identification [48.77206888171507]
人物再識別(Re-ID)は,映像監視システムにおいて重要な技術である。
教師付きモデルを任意の未確認領域に直接適用することは困難である。
一般化可能な多ソース人物Re-IDタスクに対処する新しいラベル分散学習法(LDL)を提案する。
論文 参考訳(メタデータ) (2022-04-12T15:59:10Z) - Self-Supervised Graph Neural Network for Multi-Source Domain Adaptation [51.21190751266442]
ドメイン適応(DA)は、テストデータがトレーニングデータの同じ分布に完全に従わない場合に、シナリオに取り組む。
大規模未ラベルサンプルから学習することで、自己教師型学習がディープラーニングの新しいトレンドとなっている。
我々は,より効果的なタスク間情報交換と知識共有を実現するために,新しい textbfSelf-textbf Supervised textbfGraph Neural Network (SSG) を提案する。
論文 参考訳(メタデータ) (2022-04-08T03:37:56Z) - Unsupervised Sentiment Analysis by Transferring Multi-source Knowledge [22.880509132587807]
感情分析のための2段階のドメイン適応フレームワークを提案する。
最初の段階では、マルチタスクの方法論に基づく共有プライベートアーキテクチャを使用して、ドメイン共通機能を明示的にモデル化する。
第2段階では、複数のソースドメインから知識を転送するために、共有プライベートアーキテクチャに2つの精巧なメカニズムが組み込まれています。
論文 参考訳(メタデータ) (2021-05-09T03:02:19Z) - Domain Adaptation for Learning Generator from Paired Few-Shot Data [72.04430033118426]
十分なソースデータと少数のターゲットデータを持つジェネレータを学習するためのペアドフェーショットGAN(PFS-GAN)モデルを提案する。
提案手法は,複数のベースラインと比較して,より多様性の高い生成対象ドメインデータに対して,定量的,定性的な結果が得られる。
論文 参考訳(メタデータ) (2021-02-25T10:11:44Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Domain Adaption for Knowledge Tracing [65.86619804954283]
本稿では,DAKT問題に対処するための新しい適応型フレームワーク,すなわち知識追跡(AKT)を提案する。
まず,Deep Knowledge Trace(DKT)に基づく教育的特徴(スリップ,推測,質問文など)を取り入れ,優れた知識追跡モデルを得る。
第2の側面として、3つのドメイン適応プロセスを提案し、採用する。まず、ターゲットモデルトレーニングに有用なソースインスタンスを選択するために、自動エンコーダを事前訓練する。
論文 参考訳(メタデータ) (2020-01-14T15:04:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。