論文の概要: Attribution-Guided Masking for Robust Cross-Domain Sentiment Classification
- arxiv url: http://arxiv.org/abs/2605.03091v1
- Date: Mon, 04 May 2026 19:09:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.616134
- Title: Attribution-Guided Masking for Robust Cross-Domain Sentiment Classification
- Title(参考訳): ロバストなクロスドメイン感性分類のための属性誘導型マスキング
- Authors: Shubham Harkare, Arvind Yogesh Suresh Babu, Yash Kulkarni,
- Abstract要約: AGM(Atribution-Guided Masking)は、微調整中に高属性のスプリアストークンを動的に検出し、ペナルティ化する訓練時間介入である。
我々の定性的分析は、AGMが@mentions、ハッシュタグ、slangといったドメイン固有のトークンへの属性を抑えることを確認した。
我々のアブレーション研究は、帰属誘導マスキングが重要な要素であることをさらに確認している。
- 参考スコア(独自算出の注目度): 1.4719924357068723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While pre-trained Transformer models achieve high accuracy on in-domain sentiment classification, they frequently experience severe performance degradation when transferring to out-of-domain data. We hypothesize that this generalization gap is driven by reliance on domain-specific spurious tokens. After demonstrating that post-hoc-token-level attribution drift fails to predict this gap, we propose Attribution-Guided Masking (AGM), a training time intervention that dynamically detects and penalizes highly attributed spurious tokens during fine-tuning. AGM's core component is a gradient based attribution masking loss ($\mathcal{L}_{mask}$), which can optionally be combined with a counterfactual contrastive loss to enforce domain-invariant representations, all without requiring target-domain labels or human annotation. Evaluated in a strict zero-shot transfer setting across four diverse domains with eight random seeds, AGM achieves competitive generalization compared to five strong baselines on the hardest transfer (Sentiment140): $Δ$ = 0.244 versus DANN (0.264), DRO (0.248), Fish (0.247), and IRM (0.238), while uniquely providing token-level interpretability into which features drive the generalization gap. Our qualitative analysis confirms that AGM suppresses attribution on domain-specific tokens such as @mentions, hashtags, and slang, shifting reliance toward domain-invariant sentiment markers. Our ablation study further confirms that attribution-guided masking is the critical component: removing it or replacing it with random token selection consistently degrades performance on difficult transfers.
- Abstract(参考訳): 事前訓練されたTransformerモデルは、ドメイン内の感情分類において高い精度を達成するが、ドメイン外データへの転送時に、しばしば深刻なパフォーマンス劣化を経験する。
この一般化ギャップは、ドメイン固有のスプリアストークンに依存することによって引き起こされるという仮説を立てる。
ポストホック-トケンレベルの帰属ドリフトがこのギャップを予測できないことを実証した後、我々は、微調整中に高属性のスプリアストークンを動的に検出し、ペナルティ化する訓練時間介入であるAttribution-Guided Masking (AGM)を提案する。
AGMのコアコンポーネントはグラデーションベースの属性マスキング損失(\mathcal{L}_{mask}$)であり、ターゲットドメインラベルや人間のアノテーションを必要とせずに、ドメイン不変表現を強制するために、反ファクト的な対照的な損失と任意に組み合わせることができる。
8つのランダムなシードを持つ4つのドメインにわたる厳密なゼロショット転送設定で評価され、AGMは最も難しい転送における5つの強いベースライン(Sentiment140):$Δ$ = 0.244 vs DANN (0.264), DRO (0.248), Fish (0.247), IRM (0.238)に対して競合的な一般化を達成する一方で、特徴が一般化ギャップを駆動するトークンレベルの解釈可能性を提供する。
我々の定性的分析は、AGMが@mentions、ハッシュタグ、slangなどのドメイン固有のトークンへの帰属を抑え、ドメイン不変の感情マーカーへの依存をシフトすることを確認する。
我々のアブレーション研究は、帰属誘導マスキングが重要な要素であることをさらに確認している。
関連論文リスト
- Unsupervised Domain Adaptation for Action Recognition via Self-Ensembling and Conditional Embedding Alignment [2.06242362470764]
本稿では, 整合正則化, 時間アンサンブル, 条件分布アライメントの3つの関数からなる新しい共同最適化アーキテクチャを提案する。
$mu$DARは、平均マクロF1スコアを4つのベンチマークwHARデータセットで6つの最先端UDAメソッドで改善する$approx$4-12%の範囲をもたらす。
論文 参考訳(メタデータ) (2024-10-23T00:59:27Z) - Semi Supervised Heterogeneous Domain Adaptation via Disentanglement and Pseudo-Labelling [4.33404822906643]
半教師付きドメイン適応法は、ソースラベル付きドメインからの情報を利用して、少ないラベル付きターゲットドメインを一般化する。
このような設定は半教師付き不均質ドメイン適応(SSHDA)と表記される。
SHEDD(Semi-supervised Heterogeneous Domain Adaptation via Disentanglement)は,対象ドメインの学習に適したエンドツーエンドのニューラルネットワークフレームワークである。
論文 参考訳(メタデータ) (2024-06-20T08:02:49Z) - ReMask: A Robust Information-Masking Approach for Domain Counterfactual
Generation [16.275230631985824]
ドメインのカウンターファクト生成は、テキストをソースドメインから特定のターゲットドメインに変換することを目的としています。
我々は、周波数とアテンションノルムに基づくマスキングを含む3段階のドメイン難読化アプローチを用いて、ドメイン固有のキューをマスキングし、ドメインの一般的なコンテキストを復元する。
本モデルは, 対向領域適応設定における平均精度を1.4%向上させることにより, 最先端技術よりも優れる。
論文 参考訳(メタデータ) (2023-05-04T14:19:02Z) - Cyclically Disentangled Feature Translation for Face Anti-spoofing [61.70377630461084]
循環不整合特徴変換ネットワーク(CDFTN)と呼ばれる新しい領域適応手法を提案する。
CDFTNは、(1)ソースドメイン不変の生長特徴と2)ドメイン固有のコンテンツ特徴とを持つ擬似ラベル付きサンプルを生成する。
ソースドメインラベルの監督の下で、合成擬似ラベル付き画像に基づいてロバスト分類器を訓練する。
論文 参考訳(メタデータ) (2022-12-07T14:12:34Z) - Generalizable Representation Learning for Mixture Domain Face
Anti-Spoofing [53.82826073959756]
ドメイン一般化(DG)に基づく対スプーフィングアプローチは、予期せぬシナリオの堅牢性のために注目を集めています。
ドメインダイナミック調整メタラーニング(D2AM)についてドメインラベルを使わずに提案する。
この制限を克服するため,ドメインダイナミック調整メタラーニング(D2AM)を提案する。
論文 参考訳(メタデータ) (2021-05-06T06:04:59Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Disentanglement-based Cross-Domain Feature Augmentation for Effective
Unsupervised Domain Adaptive Person Re-identification [87.72851934197936]
Unsupervised Domain Adaptive (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインからラベル付きターゲットドメインへ知識を転送することを目的としている。
ひとつの課題は、トレーニング用に信頼できるラベルでターゲットドメインサンプルを生成する方法だ。
ディスタングルメントに基づくクロスドメイン機能拡張戦略を提案する。
論文 参考訳(メタデータ) (2021-03-25T15:28:41Z) - Domain Adversarial Fine-Tuning as an Effective Regularizer [80.14528207465412]
自然言語処理(NLP)では、下流タスクに転送される事前訓練された言語モデル(LM)が、最先端の結果を得るために最近示されている。
標準的な微調整は、事前トレーニング中にキャプチャされた汎用ドメイン表現を分解することができる。
本稿では,新しい正規化手法である After; 有効正規化器としてのドメイン・アダクショナル・ファイン・チューニングを提案する。
論文 参考訳(メタデータ) (2020-09-28T14:35:06Z) - Inductive Unsupervised Domain Adaptation for Few-Shot Classification via
Clustering [16.39667909141402]
ショットの分類は、多様なドメインに適応する必要がある場合、苦労する傾向があります。
本稿では、ClusteringによるFew-shot分類のためのドメイン適応性能を改善するためのフレームワークDaFeCを紹介する。
提案手法は, 絶対利得(分類精度)が4.95%, 9.55%, 3.99%, 11.62%であった。
論文 参考訳(メタデータ) (2020-06-23T08:17:48Z) - A Balanced and Uncertainty-aware Approach for Partial Domain Adaptation [142.31610972922067]
この研究は、特にターゲットドメインのクラスラベルがソースドメインのサブセットである場合に、教師なしのドメイン適応問題に対処する。
本稿では,ドメイン逆境学習に基づく新しいドメイン適応手法 BA$3$US を提案し,BAA(Ba balanced Adversarial Alignment)とAUS(Adaptive Uncertainty Suppression)の2つの新しい手法を提案する。
複数のベンチマーク実験の結果、BA$3$USが部分的なドメイン適応タスクの最先端を超越していることが示されている。
論文 参考訳(メタデータ) (2020-03-05T11:37:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。