論文の概要: Unsupervised Domain Adaptation using Lexical Transformations and Label
Injection for Twitter Data
- arxiv url: http://arxiv.org/abs/2307.10210v1
- Date: Fri, 14 Jul 2023 13:19:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-23 11:29:41.327043
- Title: Unsupervised Domain Adaptation using Lexical Transformations and Label
Injection for Twitter Data
- Title(参考訳): 語彙変換とラベルインジェクションを用いたtwitterデータの教師なしドメイン適応
- Authors: Akshat Gupta, Xiaomo Liu, Sameena Shah
- Abstract要約: ソース・ドメイン・データセットを簡単な語彙変換で修正し、ソース・データセットの分布とターゲット・データセットの分布との領域シフトを減らす。
変換されたソースドメインデータセットに基づいてトレーニングされたモデルは、ゼロショットモデルよりも大幅にパフォーマンスが向上することがわかった。
- 参考スコア(独自算出の注目度): 5.602808449691402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain adaptation is an important and widely studied problem in natural
language processing. A large body of literature tries to solve this problem by
adapting models trained on the source domain to the target domain. In this
paper, we instead solve this problem from a dataset perspective. We modify the
source domain dataset with simple lexical transformations to reduce the domain
shift between the source dataset distribution and the target dataset
distribution. We find that models trained on the transformed source domain
dataset performs significantly better than zero-shot models. Using our proposed
transformations to convert standard English to tweets, we reach an unsupervised
part-of-speech (POS) tagging accuracy of 92.14% (from 81.54% zero shot
accuracy), which is only slightly below the supervised performance of 94.45%.
We also use our proposed transformations to synthetically generate tweets and
augment the Twitter dataset to achieve state-of-the-art performance for POS
tagging.
- Abstract(参考訳): ドメイン適応は自然言語処理において重要かつ広く研究されている問題である。
大量の文献が、ソースドメインでトレーニングされたモデルをターゲットドメインに適応させることで、この問題を解決しようとする。
本稿では,この問題をデータセットの観点から解決する。
ソースドメインデータセットを単純な語彙変換で修正し、ソースデータセット分布とターゲットデータセット分布の間のドメインシフトを削減する。
変換されたソースドメインデータセットに基づいてトレーニングされたモデルは、ゼロショットモデルよりも大幅にパフォーマンスが向上することがわかった。
提案した変換を用いて、標準英語をつぶやきに変換することで、92.14%のタグ付け精度(81.54%のゼロショット精度から)に達し、94.45%の教師付きパフォーマンスをわずかに下回っている。
また、提案する変換を使ってツイートを合成し、twitterデータセットを拡張し、posタグの最先端のパフォーマンスを実現します。
関連論文リスト
- Transcending Domains through Text-to-Image Diffusion: A Source-Free
Approach to Domain Adaptation [6.649910168731417]
ドメイン適応(ドメイン適応、Domain Adaptation、DA)は、アノテートデータが不十分なターゲットドメインにおけるモデルの性能を高める方法である。
本研究では,対象領域のサンプルに基づいてトレーニングしたテキスト・ツー・イメージ拡散モデルを用いて,ソースデータを生成する新しいSFDAフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-02T23:38:17Z) - Informative Data Mining for One-Shot Cross-Domain Semantic Segmentation [84.82153655786183]
Informative Data Mining (IDM) と呼ばれる新しいフレームワークを提案し、セマンティックセグメンテーションのための効率的なワンショットドメイン適応を実現する。
IDMは、最も情報性の高いサンプルを特定するために不確実性に基づく選択基準を提供し、迅速に適応し、冗長なトレーニングを減らす。
提案手法は,GTA5/SYNTHIAからCityscapesへの適応タスクにおいて,既存の手法より優れ,56.7%/55.4%の最先端のワンショット性能を実現している。
論文 参考訳(メタデータ) (2023-09-25T15:56:01Z) - Domain Adaptation for Time-Series Classification to Mitigate Covariate
Shift [3.071136270246468]
本稿では,2つのステップに基づいた新しいドメイン適応手法を提案する。
まず、いくつかのサンプルから、ソースからターゲットドメインへの最適なクラス依存変換を探索する。
次に、埋め込み類似性技術を用いて、推論時に対応する変換を選択する。
論文 参考訳(メタデータ) (2022-04-07T10:27:14Z) - On-target Adaptation [82.77980951331854]
ドメイン適応は、Emphtargetドメインでのトレーニングとテストの間のシフトを軽減することを目指している。
ほとんどの適応法は、ソースデータとターゲットデータに対する共同最適化によるソースデータに依存している。
対象データから純粋に表現を学習するオン・ターゲット適応による大幅な改善を示す。
論文 参考訳(メタデータ) (2021-09-02T17:04:18Z) - Transformer-Based Source-Free Domain Adaptation [134.67078085569017]
本研究では,ソースフリードメイン適応(SFDA)の課題について検討する。
我々は、FDAの一般化モデルを学ぶためのTransformer(TransDA)という、汎用的で効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T23:06:26Z) - Source Free Domain Adaptation with Image Translation [33.46614159616359]
大規模なデータセットをリリースする努力は、プライバシと知的財産権の考慮によって損なわれる可能性がある。
実現可能な代替手段は、代わりに事前訓練されたモデルをリリースすることである。
本稿では,対象画像のスタイルを未知のソース画像に変換する画像翻訳手法を提案する。
論文 参考訳(メタデータ) (2020-08-17T17:57:33Z) - Unsupervised Intra-domain Adaptation for Semantic Segmentation through
Self-Supervision [73.76277367528657]
畳み込みニューラルネットワークに基づくアプローチは、セマンティックセグメンテーションにおいて顕著な進歩を遂げた。
この制限に対処するために、グラフィックエンジンから生成された注釈付きデータを使用してセグメンテーションモデルをトレーニングする。
ドメイン間およびドメイン間ギャップを最小化する2段階の自己教師付きドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T15:24:11Z) - Deep Domain-Adversarial Image Generation for Domain Generalisation [115.21519842245752]
マシンラーニングモデルは通常、ソースデータセットでトレーニングされたり、異なるディストリビューションのターゲットデータセットで評価されたりする際に、ドメインシフトの問題に悩まされる。
この問題を解決するために、ドメイン一般化(DG)手法は、訓練されたモデルが未知のドメインに一般化できるように、複数のソースドメインからのデータを活用することを目的としている。
我々はemphDeep Domain-Adversarial Image Generation (DDAIG)に基づく新しいDG手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T23:17:47Z) - Supervised Domain Adaptation using Graph Embedding [86.3361797111839]
領域適応法は、2つの領域間の分布がシフトし、それを認識しようとすると仮定する。
グラフ埋め込みに基づく汎用フレームワークを提案する。
提案手法が強力なドメイン適応フレームワークにつながることを示す。
論文 参考訳(メタデータ) (2020-03-09T12:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。