Fugu-MT 論文翻訳(概要): mask-Net: Learning Context Aware Invariant Features using Adversarial Forgetting (Student Abstract)

論文の概要: mask-Net: Learning Context Aware Invariant Features using Adversarial Forgetting (Student Abstract)

arxiv url: http://arxiv.org/abs/2011.12979v5
Date: Mon, 18 Oct 2021 12:56:38 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-21 03:32:49.151860
Title: mask-Net: Learning Context Aware Invariant Features using Adversarial Forgetting (Student Abstract)
Title（参考訳）: mask-Net: 逆予測を用いた文脈認識不変特徴の学習(学習要約)
Authors: Hemant Yadav, Atul Anshuman Singh, Rachit Mittal, Sunayana Sitaram, Yi Yu, Rajiv Ratn Shah
Abstract要約: 本稿では,対向的無視(AF)を用いた不変性を誘導する新しい手法を提案する。 STTタスクのアクセントのような不変性を学習するための最初の実験は、従来のモデルと比較して単語誤り率(WER)の点でより優れた一般化を実現している。
参考スコア（独自算出の注目度）: 46.61843360106884
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Training a robust system, e.g.,Speech to Text (STT), requires large datasets. Variability present in the dataset such as unwanted nuisances and biases are the reason for the need of large datasets to learn general representations. In this work, we propose a novel approach to induce invariance using adversarial forgetting (AF). Our initial experiments on learning invariant features such as accent on the STT task achieve better generalizations in terms of word error rate (WER) compared to the traditional models. We observe an absolute improvement of 2.2% and 1.3% on out-of-distribution and in-distribution test sets, respectively.
Abstract（参考訳）: 例えば、Speech to Text (STT)のような堅牢なシステムのトレーニングには、大規模なデータセットが必要である。望ましくないニュアサンスやバイアスのようなデータセットに存在する可変性は、一般的な表現を学ぶために大きなデータセットを必要とする理由である。そこで本研究では,対向的無視(AF)を用いた不変性誘導手法を提案する。 STTタスクのアクセントのような不変性を学習するための最初の実験は、従来のモデルと比較して単語誤り率(WER)の点でより優れた一般化を実現する。アウト・オブ・ディストリビューションおよびイン・ディストリビューションテストセットにおいて,絶対的な2.2%と1.3%の改善が観察された。

関連論文リスト

Prompt Tuning Vision Language Models with Margin Regularizer for Few-Shot Learning under Distribution Shifts [13.21626568246313]
視覚言語基礎モデルが、分布やクラスが全く異なるデータセットに適応できるかどうかを解析する。本稿では,少数のサンプルに対して,このような大規模VLMを直接適用するための新しいプロンプトチューニング手法であるPromptMarginを提案する。 PromptMarginは、このタスクのテキストと視覚的なプロンプトを効果的に調整し、2つのメインモジュールを持っている。
論文参考訳（メタデータ） (2025-05-21T13:26:56Z)
Improving General Text Embedding Model: Tackling Task Conflict and Data Imbalance through Model Merging [33.23758947497205]
高度な埋め込みモデルは、通常、大規模マルチタスクデータと複数のタスクをまたいだ共同トレーニングを用いて開発される。これらの課題を克服するために、独立に訓練されたモデルを組み合わせて勾配の衝突を緩和し、データ分散のバランスをとるモデルマージングについて検討する。本稿では,勾配降下を用いたタスクベクトル空間内の最適モデル組合せを効率的に探索する新たな手法であるSelf Positioningを提案する。
論文参考訳（メタデータ） (2024-10-19T08:39:21Z)
Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文参考訳（メタデータ） (2024-06-07T11:37:45Z)
The Trade-off between Universality and Label Efficiency of Representations from Contrastive Learning [32.15608637930748]
2つのデシダラタの間にはトレードオフがあることを示し、同時に両方を達成できない可能性があることを示す。我々は、理論データモデルを用いて分析を行い、より多様な事前学習データにより、異なるタスクに対してより多様な機能が得られる一方で、タスク固有の機能に重点を置いていないことを示す。
論文参考訳（メタデータ） (2023-02-28T22:14:33Z)
Gaussian Switch Sampling: A Second Order Approach to Active Learning [11.775252660867285]
能動的学習において、取得関数は、モデル多様体内の表現位置に直接情報性を定義する。本稿では,アクティブラーニングの文脈における情報内容とサンプルの重要性の2次定義を提案する。我々は,モデル表現が訓練データの欠如によって制約されている場合でも,その定義が極めて正確な重要度スコアを生成することを示す。
論文参考訳（メタデータ） (2023-02-16T15:24:56Z)
CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文参考訳（メタデータ） (2022-06-01T03:02:07Z)
CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文参考訳（メタデータ） (2022-02-11T13:49:51Z)
Adaptive Prototypical Networks with Label Words and Joint Representation Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。 FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文参考訳（メタデータ） (2021-01-10T11:25:42Z)
Squared $\ell_2$ Norm as Consistency Loss for Leveraging Augmented Data to Learn Robust and Invariant Representations [76.85274970052762]
元のサンプルと拡張されたサンプルの埋め込み/表現の距離を規則化することは、ニューラルネットワークの堅牢性を改善するための一般的なテクニックである。本稿では、これらの様々な正規化選択について検討し、埋め込みの正規化方法の理解を深める。私たちが特定したジェネリックアプローチ(squared $ell$ regularized augmentation)は、それぞれ1つのタスクのために特別に設計されたいくつかの手法より優れていることを示す。
論文参考訳（メタデータ） (2020-11-25T22:40:09Z)
Supervised Contrastive Learning for Pre-trained Language Model Fine-tuning [23.00300794016583]
最先端の自然言語理解分類モデルは2段階に従う。微調整段階に対する教師付きコントラスト学習(SCL)の目的を提案する。提案した微調整目的は、微調整訓練データにおいて、異なるレベルのノイズに対してより堅牢なモデルに導かれる。
論文参考訳（メタデータ） (2020-11-03T01:10:39Z)
Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文参考訳（メタデータ） (2020-08-08T03:02:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。