論文の概要: Additive Interventions Yield Robust Multi-Domain Machine Translation
Models
- arxiv url: http://arxiv.org/abs/2210.12727v1
- Date: Sun, 23 Oct 2022 13:47:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 16:36:13.890346
- Title: Additive Interventions Yield Robust Multi-Domain Machine Translation
Models
- Title(参考訳): 付加的介入によるロバスト多ドメイン機械翻訳モデル
- Authors: Elijah Rippeth and Matt Post
- Abstract要約: 大規模マルチドメイン機械翻訳における付加的介入の役割について検討する。
ドメインラベルがテストドメインと一致する場合、介入ベースシステムとタグベースシステムのパフォーマンス差は小さいが、介入ベースシステムはラベルエラーに対して堅牢である。
- 参考スコア(独自算出の注目度): 8.685027815947779
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Additive interventions are a recently-proposed mechanism for controlling
target-side attributes in neural machine translation. In contrast to tag-based
approaches which manipulate the raw source sequence, interventions work by
directly modulating the encoder representation of all tokens in the sequence.
We examine the role of additive interventions in a large-scale multi-domain
machine translation setting and compare its performance in various inference
scenarios. We find that while the performance difference is small between
intervention-based systems and tag-based systems when the domain label matches
the test domain, intervention-based systems are robust to label error, making
them an attractive choice under label uncertainty. Further, we find that the
superiority of single-domain fine-tuning comes under question when training
data size is scaled, contradicting previous findings.
- Abstract(参考訳): 加法介入は、最近発表されたニューラルマシン翻訳のターゲット側の属性を制御するメカニズムである。
ソースシーケンスを操作するタグベースのアプローチとは対照的に、介入はシーケンス内のすべてのトークンのエンコーダ表現を直接調整することで機能する。
大規模マルチドメイン機械翻訳における付加的介入の役割について検討し,その性能を様々な推論シナリオで比較する。
ドメインラベルがテストドメインと一致する場合、介入ベースシステムとタグベースシステムのパフォーマンス差は小さいが、介入ベースシステムはラベルエラーに対して堅牢であり、ラベルの不確実性の下で魅力的な選択となる。
さらに、トレーニングデータのサイズが大きくなると、単ドメインファインチューニングの優位性が問題視され、以前の結果と矛盾する。
関連論文リスト
- Multi-Source Unsupervised Domain Adaptation with Prototype Aggregation [8.139534851987364]
マルチソースドメイン適応(MSDA)は、産業モデル一般化において重要な役割を果たす。
MSDAにおける最近の取り組みは、マルチドメイン分散アライメントの強化に焦点を当てている。
本稿では,クラスレベルとドメインレベルにおけるソースドメインとターゲットドメインの相違をモデル化するプロトタイプアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2024-12-20T06:44:35Z) - DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - Domain Adaptation Using Pseudo Labels [16.79672078512152]
ラベル付き対象データがない場合、教師なしのドメイン適応アプローチは、ソースとターゲットドメインの限界分布を整合させようとする。
我々は,複数段階の擬似ラベル修正手法を用いて,対象ドメインの正確なラベルを決定するために事前訓練ネットワークをデプロイする。
複数のデータセットに対する結果から, 複雑な最先端技術と比較して, 簡単な手順の有効性が示された。
論文 参考訳(メタデータ) (2024-02-09T22:15:11Z) - Task-specific Inconsistency Alignment for Domain Adaptive Object
Detection [38.027790951157705]
大量のラベル付きデータでトレーニングされた検出器は、データ分散ギャップのある特定のシナリオで劇的なパフォーマンス劣化を示すことが多い。
本稿では,タスク固有の不整合アライメント(TIA)を提案する。
TIAは,従来の最先端手法よりも,様々なシナリオにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2022-03-29T08:36:33Z) - Exploring Sequence Feature Alignment for Domain Adaptive Detection
Transformers [141.70707071815653]
本稿では,検出変圧器の適応に特化して設計された新しいシーケンス特徴アライメント(SFA)法を提案する。
SFAはドメインクエリベースの機能アライメント(DQFA)モジュールとトークンワイド機能アライメント(TDA)モジュールで構成される。
3つの挑戦的なベンチマーク実験により、SFAは最先端のドメイン適応オブジェクト検出方法より優れていることが示された。
論文 参考訳(メタデータ) (2021-07-27T07:17:12Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Unsupervised Out-of-Domain Detection via Pre-trained Transformers [56.689635664358256]
ドメイン外の入力は予測不能なアウトプットを引き起こし、時には破滅的な安全性の問題を引き起こす。
本研究は、教師なしのドメイン内データのみを用いて、ドメイン外サンプルを検出する問題に対処する。
検出精度を高めるために、ドメイン固有の2つの微調整手法が提案されている。
論文 参考訳(メタデータ) (2021-06-02T05:21:25Z) - Re-energizing Domain Discriminator with Sample Relabeling for
Adversarial Domain Adaptation [88.86865069583149]
Unsupervised Domain Adapt (UDA)メソッドは、ドメインの競合トレーニングを利用して、機能を調整してドメインのギャップを減らす。
本研究では,Re-enforceable Adversarial Domain Adaptation (RADA) と呼ばれる効率的な最適化戦略を提案する。
RADAは、動的ドメインラベルを使用して、トレーニング中にドメイン識別器を再活性化することを目指しています。
論文 参考訳(メタデータ) (2021-03-22T08:32:55Z) - Revisiting Mahalanobis Distance for Transformer-Based Out-of-Domain
Detection [60.88952532574564]
本稿では,ドメイン外インテント検出手法を徹底的に比較する。
意図分類のための3つの標準データセット上で,複数のコンテキストエンコーダとメソッドを効率良く評価する。
本研究の主目的は,超微調整トランスフォーマーを用いたドメイン内データエンコーダが優れた結果をもたらすことである。
論文 参考訳(メタデータ) (2021-01-11T09:10:58Z) - Learning a Domain Classifier Bank for Unsupervised Adaptive Object
Detection [48.19258721979389]
本稿では,ディープネットワークに基づく物体検出のための細粒度領域アライメント手法を提案する。
そこで我々は,適応検出器として細粒度領域アライメント機構を備えた素物体検出器を開発した。
3つの一般的な転送ベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-07-06T09:12:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。