Fugu-MT 論文翻訳(概要): Multitask Fine-Tuning and Generative Adversarial Learning for Improved Auxiliary Classification

論文の概要: Multitask Fine-Tuning and Generative Adversarial Learning for Improved Auxiliary Classification

arxiv url: http://arxiv.org/abs/2408.15265v1
Date: Sun, 11 Aug 2024 20:05:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-01 16:42:01.563233
Title: Multitask Fine-Tuning and Generative Adversarial Learning for Improved Auxiliary Classification
Title（参考訳）: 改良された補助分類のためのマルチタスクファインチューニングと生成逆学習
Authors: Christopher Sun, Abishek Satish,
Abstract要約: 3つの下流タスクをマルチタスクで微調整するための新しいBERTアーキテクチャを実装した。我々のモデルであるMultitask BERTは、レイヤ共有とトリプルトアーキテクチャ、カスタム文ペアトークン化、損失ペアリング、勾配手術を取り入れています。また、BERTに生成逆学習を適用し、潜在空間から写像して偽の埋め込みを生成する条件付きジェネレータモデルを構築した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this study, we implement a novel BERT architecture for multitask fine-tuning on three downstream tasks: sentiment classification, paraphrase detection, and semantic textual similarity prediction. Our model, Multitask BERT, incorporates layer sharing and a triplet architecture, custom sentence pair tokenization, loss pairing, and gradient surgery. Such optimizations yield a 0.516 sentiment classification accuracy, 0.886 paraphase detection accuracy, and 0.864 semantic textual similarity correlation on test data. We also apply generative adversarial learning to BERT, constructing a conditional generator model that maps from latent space to create fake embeddings in $\mathbb{R}^{768}$. These fake embeddings are concatenated with real BERT embeddings and passed into a discriminator model for auxiliary classification. Using this framework, which we refer to as AC-GAN-BERT, we conduct semi-supervised sensitivity analyses to investigate the effect of increasing amounts of unlabeled training data on AC-GAN-BERT's test accuracy. Overall, aside from implementing a high-performing multitask classification system, our novelty lies in the application of adversarial learning to construct a generator that mimics BERT. We find that the conditional generator successfully produces rich embeddings with clear spatial correlation with class labels, demonstrating avoidance of mode collapse. Our findings validate the GAN-BERT approach and point to future directions of generator-aided knowledge distillation.
Abstract（参考訳）: 本研究では、感情分類、パラフレーズ検出、意味的テキスト類似性予測という3つの下流タスクをマルチタスクで微調整するための新しいBERTアーキテクチャを実装した。我々のモデルであるMultitask BERTは、レイヤ共有とトリプルトアーキテクチャ、カスタム文ペアトークン化、損失ペアリング、勾配手術を取り入れています。このような最適化により、テストデータに対する0.516の感情分類精度、0.886のパラフェーズ検出精度、0.864のセマンティックテキスト類似性相関が得られる。また、BERTに対して生成的逆数学習を適用し、潜在空間から写像して$\mathbb{R}^{768}$で偽の埋め込みを生成する条件生成モデルを構築する。これらの偽の埋め込みは、実際のBERT埋め込みと連結され、補助分類のための識別器モデルに渡される。本稿では,AC-GAN-BERTと呼ぶこのフレームワークを用いて,AC-GAN-BERTの試験精度に及ぼすラベルなしトレーニングデータの増加の影響を半教師付き感度解析により検討する。全体として、高性能なマルチタスク分類システムの実装は別として、BERTを模倣するジェネレータを構築するための逆学習の適用が新規である。条件付きジェネレータは,クラスラベルと明確な空間相関を持つリッチな埋め込みを実現し,モード崩壊の回避を実証する。本研究は, GAN-BERT法を検証し, ジェネレータによる知識蒸留の今後の方向性を示唆するものである。

関連論文リスト

Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。 DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。 10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文参考訳（メタデータ） (2024-07-20T01:34:13Z)
Make BERT-based Chinese Spelling Check Model Enhanced by Layerwise Attention and Gaussian Mixture Model [33.446533426654995]
我々は、BERTベースのCSCモデルを強化するために、異種知識注入フレームワークを設計する。複数層表現を生成するために,n-gram-based layerwise self-attention の新たな形式を提案する。実験の結果,提案手法は4つの強力なベースラインモデルに対して安定な性能向上をもたらすことがわかった。
論文参考訳（メタデータ） (2023-12-27T16:11:07Z)
A Diffusion Weighted Graph Framework for New Intent Discovery [25.364554033681515]
New Intent Discovery (NID)は、ラベルのないデータから、新しいインテントと既知のインテントの両方を認識することを目的としている。従来の手法では、量と品質のバランスが取れないノイズの多い監視信号を生成する。本稿では,データ固有の意味的類似性と構造的関連性の両方を捉えるために,DWGF(Diffusion Weighted Graph Framework)を提案する。
論文参考訳（メタデータ） (2023-10-24T13:43:01Z)
Threshold-Consistent Margin Loss for Open-World Deep Metric Learning [42.03620337000911]
画像検索にDeep Metric Learning (DML) で使われている既存の損失は、しばしば非均一なクラス内およびクラス間表現構造に繋がる。不整合はしばしば、商用画像検索システムを展開する際のしきい値選択過程を複雑にする。クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
論文参考訳（メタデータ） (2023-07-08T21:16:41Z)
ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文参考訳（メタデータ） (2023-06-04T02:55:25Z)
Pretraining Without Attention [114.99187017618408]
本研究では、状態空間モデル(SSM)に基づくシーケンスルーティングの最近の進歩を利用して、注意を払わずに事前学習を探索する。 BiGS は GLUE 上で BERT の事前トレーニング精度と一致し、近似なしで 4096 トークンの長期事前トレーニングに拡張できる。
論文参考訳（メタデータ） (2022-12-20T18:50:08Z)
Birds of a Feather Trust Together: Knowing When to Trust a Classifier via Adaptive Neighborhood Aggregation [30.34223543030105]
我々は、NeighborAggがアダプティブ近隣アグリゲーションを介して2つの重要な情報を利用する方法を示す。また, 誤り検出の密接な関連課題へのアプローチを拡張し, 偽陰性境界に対する理論的カバレッジを保証する。
論文参考訳（メタデータ） (2022-11-29T18:43:15Z)
Hybrid Routing Transformer for Zero-Shot Learning [83.64532548391]
本稿ではハイブリッド・ルーティング・トランス (HRT) と呼ばれる新しいトランス・デコーダモデルを提案する。ボトムアップとトップダウンの動的ルーティング経路の両方で構築されたアクティブアテンションを組み込んで,属性に整合した視覚的特徴を生成する。 HRTデコーダでは,属性対応の視覚特徴,対応する属性セマンティクス,およびクラス属性ベクトル間の相関関係を静的なルーティングで計算し,最終クラスラベルの予測を生成する。
論文参考訳（メタデータ） (2022-03-29T07:55:08Z)
Diversity Enhanced Active Learning with Strictly Proper Scoring Rules [4.81450893955064]
テキスト分類のための能動学習(AL)のための獲得関数について検討する。我々は、期待損失削減法(ELR)を、ログ確率や負平均二乗誤差などの(厳密な)スコアの増加を推定するために変換する。 BEMPSを用いた平均二乗誤差とログ確率を用いることで、ロバストな取得関数が得られることを示す。
論文参考訳（メタデータ） (2021-10-27T05:02:11Z)
Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文参考訳（メタデータ） (2021-07-07T11:43:59Z)
Deep Semi-supervised Knowledge Distillation for Overlapping Cervical Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文参考訳（メタデータ） (2020-07-21T13:27:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。