論文の概要: ReMask: A Robust Information-Masking Approach for Domain Counterfactual
Generation
- arxiv url: http://arxiv.org/abs/2305.02858v1
- Date: Thu, 4 May 2023 14:19:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 15:24:59.050399
- Title: ReMask: A Robust Information-Masking Approach for Domain Counterfactual
Generation
- Title(参考訳): ReMask: ドメイン対実生成のためのロバストな情報マスキングアプローチ
- Authors: Pengfei Hong, Rishabh Bhardwaj, Navonil Majumdar, Somak Aditya,
Soujanya Poria
- Abstract要約: ドメインのカウンターファクト生成は、テキストをソースドメインから特定のターゲットドメインに変換することを目的としています。
我々は、周波数とアテンションノルムに基づくマスキングを含む3段階のドメイン難読化アプローチを用いて、ドメイン固有のキューをマスキングし、ドメインの一般的なコンテキストを復元する。
本モデルは, 対向領域適応設定における平均精度を1.4%向上させることにより, 最先端技術よりも優れる。
- 参考スコア(独自算出の注目度): 16.275230631985824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain shift is a big challenge in NLP, thus, many approaches resort to
learning domain-invariant features to mitigate the inference phase domain
shift. Such methods, however, fail to leverage the domain-specific nuances
relevant to the task at hand. To avoid such drawbacks, domain counterfactual
generation aims to transform a text from the source domain to a given target
domain. However, due to the limited availability of data, such frequency-based
methods often miss and lead to some valid and spurious domain-token
associations. Hence, we employ a three-step domain obfuscation approach that
involves frequency and attention norm-based masking, to mask domain-specific
cues, and unmasking to regain the domain generic context. Our experiments
empirically show that the counterfactual samples sourced from our masked text
lead to improved domain transfer on 10 out of 12 domain sentiment
classification settings, with an average of 2% accuracy improvement over the
state-of-the-art for unsupervised domain adaptation (UDA). Further, our model
outperforms the state-of-the-art by achieving 1.4% average accuracy improvement
in the adversarial domain adaptation (ADA) setting. Moreover, our model also
shows its domain adaptation efficacy on a large multi-domain intent
classification dataset where it attains state-of-the-art results. We release
the codes publicly at \url{https://github.com/declare-lab/remask}.
- Abstract(参考訳): ドメインシフトはnlpの大きな課題であり、多くのアプローチは推論フェーズのドメインシフトを緩和するためにドメイン不変機能を学ぶことに依存している。
しかし、そのような方法は、手元のタスクに関連するドメイン固有のニュアンスを活用できない。
このような欠点を避けるため、ドメインの偽生成は、テキストをソースドメインから所定のターゲットドメインに変換することを目的としている。
しかし、データの可用性が限られているため、そのような周波数ベースの手法は、しばしば有効でスプリアスなドメイン・トケンの関連を見逃し、引き起こす。
したがって、周波数と注意規範に基づくマスキング、ドメイン固有のヒントをマスキングし、ドメインジェネリックコンテキストをアンマスキングする3段階のドメイン難読化アプローチを用いる。
我々の実験では、マスキングされたテキストから抽出された偽のサンプルは、12のドメイン感情分類設定のうち10のドメイン転送を改善し、教師なしドメイン適応(uda)の最先端よりも平均2%精度が向上することを示した。
さらに,対戦領域適応(ADA)設定における平均精度を1.4%向上させることで,最先端のモデルよりも優れることを示す。
さらに,本モデルでは,最新の結果が得られる大規模多ドメインインテント分類データセットに対して,そのドメイン適応性を示す。
コードを公開するのは \url{https://github.com/declare-lab/remask} です。
関連論文リスト
- DomainVerse: A Benchmark Towards Real-World Distribution Shifts For
Tuning-Free Adaptive Domain Generalization [27.099706316752254]
我々はAdaptive Domain Generalization (ADG)のための新しいデータセットDomainVerseを確立する。
DomainVerseは、導入した階層的なドメインシフトの定義に相応しく、390のきめ細かい現実的なドメインから約0.5万の画像で構成されている。
チューニング不要適応型ドメイン一般化のためのDomain CLIPとDomain++ CLIPという2つの手法を提案する。
論文 参考訳(メタデータ) (2024-03-05T07:10:25Z) - Cyclically Disentangled Feature Translation for Face Anti-spoofing [61.70377630461084]
循環不整合特徴変換ネットワーク(CDFTN)と呼ばれる新しい領域適応手法を提案する。
CDFTNは、(1)ソースドメイン不変の生長特徴と2)ドメイン固有のコンテンツ特徴とを持つ擬似ラベル付きサンプルを生成する。
ソースドメインラベルの監督の下で、合成擬似ラベル付き画像に基づいてロバスト分類器を訓練する。
論文 参考訳(メタデータ) (2022-12-07T14:12:34Z) - Generalizable Representation Learning for Mixture Domain Face
Anti-Spoofing [53.82826073959756]
ドメイン一般化(DG)に基づく対スプーフィングアプローチは、予期せぬシナリオの堅牢性のために注目を集めています。
ドメインダイナミック調整メタラーニング(D2AM)についてドメインラベルを使わずに提案する。
この制限を克服するため,ドメインダイナミック調整メタラーニング(D2AM)を提案する。
論文 参考訳(メタデータ) (2021-05-06T06:04:59Z) - Learning to Share by Masking the Non-shared for Multi-domain Sentiment
Classification [24.153584996936424]
テキストからドメイン関連語を明示的にマスキングし,これらのドメインに依存しないテキストからドメイン不変感の特徴を学習し,それらのマスキング語を用いてドメイン認識文表現を形成するネットワークを提案する。
適応度の高い複数領域感情分類データセットの実証実験により,提案モデルの有効性が実証された。
論文 参考訳(メタデータ) (2021-04-17T08:15:29Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Disentanglement-based Cross-Domain Feature Augmentation for Effective
Unsupervised Domain Adaptive Person Re-identification [87.72851934197936]
Unsupervised Domain Adaptive (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインからラベル付きターゲットドメインへ知識を転送することを目的としている。
ひとつの課題は、トレーニング用に信頼できるラベルでターゲットドメインサンプルを生成する方法だ。
ディスタングルメントに基づくクロスドメイン機能拡張戦略を提案する。
論文 参考訳(メタデータ) (2021-03-25T15:28:41Z) - Unsupervised Cross-domain Image Classification by Distance Metric Guided
Feature Alignment [11.74643883335152]
教師なしドメイン適応は、ソースドメインからターゲットドメインに知識を転送する有望な道である。
本稿では,距離メトリックガイド機能アライメント(MetFA)を提案する。
我々のモデルは、クラス分布アライメントを統合して、ソースドメインからターゲットドメインにセマンティック知識を転送します。
論文 参考訳(メタデータ) (2020-08-19T13:36:57Z) - Discrepancy Minimization in Domain Generalization with Generative
Nearest Neighbors [13.047289562445242]
ドメイン一般化(Domain Generalization, DG)は、複数のソースドメインでトレーニングされた機械学習モデルが、統計の異なるターゲットドメインでうまく一般化できないという、ドメインシフトの問題を扱う。
シフト対象領域の一般化を保証するのに失敗するソースドメイン全体にわたるドメイン不変表現を学習することにより、ドメイン一般化の問題を解決するために、複数のアプローチが提案されている。
本稿では,GNNDM(Generative Nearest Neighbor Based Discrepancy Minimization)法を提案する。
論文 参考訳(メタデータ) (2020-07-28T14:54:25Z) - Domain Adaptation for Semantic Parsing [68.81787666086554]
本稿では,ドメイン適応のための新しいセマンティクスを提案する。このセマンティクスでは,ソースドメインと比較して,対象ドメインのアノテーション付きデータがはるかに少ない。
我々のセマンティックな利点は、2段階の粗大なフレームワークから得ており、2段階の異なる正確な処理を提供できる。
ベンチマークデータセットの実験により、我々の手法はいくつかの一般的なドメイン適応戦略より一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-06-23T14:47:41Z) - Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。
これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文 参考訳(メタデータ) (2020-05-14T04:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。