Fugu-MT 論文翻訳(概要): On Data Augmentation for Extreme Multi-label Classification

論文の概要: On Data Augmentation for Extreme Multi-label Classification

arxiv url: http://arxiv.org/abs/2009.10778v1
Date: Tue, 22 Sep 2020 19:31:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-15 21:23:06.719033
Title: On Data Augmentation for Extreme Multi-label Classification
Title（参考訳）: 極端多重ラベル分類のためのデータ拡張について
Authors: Danqing Zhang, Tao Li, Haiyang Zhang, Bing Yin
Abstract要約: 極端多重ラベル分類(XMC)問題に対するデータ拡張に着目する。 XMCの最も難しい問題の1つは、ロングテールラベルの配布である。本稿では,シンプルで効果的な拡張フレームワークと最先端の分類器を提案する。
参考スコア（独自算出の注目度）: 25.26335913643624
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we focus on data augmentation for the extreme multi-label classification (XMC) problem. One of the most challenging issues of XMC is the long tail label distribution where even strong models suffer from insufficient supervision. To mitigate such label bias, we propose a simple and effective augmentation framework and a new state-of-the-art classifier. Our augmentation framework takes advantage of the pre-trained GPT-2 model to generate label-invariant perturbations of the input texts to augment the existing training data. As a result, it present substantial improvements over baseline models. Our contributions are two-factored: (1) we introduce a new state-of-the-art classifier that uses label attention with RoBERTa and combine it with our augmentation framework for further improvement; (2) we present a broad study on how effective are different augmentation methods in the XMC task.
Abstract（参考訳）: 本稿では,極端多重ラベル分類(XMC)問題に対するデータ拡張に着目した。 XMCの最も困難な問題の1つは、強力なモデルでさえ監督不足に悩まされる長い尾のラベル分布である。このようなラベルバイアスを軽減するために,単純かつ効果的な拡張フレームワークと最先端の分類器を提案する。この拡張フレームワークは,事前学習したgpt-2モデルを利用して入力テキストのラベル不変な摂動を生成し,既存のトレーニングデータの強化を行う。その結果、ベースラインモデルよりも大幅に改善されている。我々は,1)RoBERTaとラベルアテンションを併用した新しい最先端分類器を導入し,さらに改善するための拡張フレームワークと組み合わせ,(2)XMCタスクにおける異なる拡張方法がどの程度有効であるかを広く研究する。

関連論文リスト

Granular-ball Guided Masking: Structure-aware Data Augmentation [97.18560547134587]
Granular-ball Guided Masking (GBGM) は、Granular-ball Computing (GBC) によって誘導される構造対応強化戦略である。 GBGMは、粗い階層的なマスキングプロセスを通じて冗長な領域を抑えながら、意味的に豊富で構造上重要な領域を適応的に保存する。複数のベンチマークの実験では、分類精度とマスク画像再構成が一貫した改善が示されている。
論文参考訳（メタデータ） (2025-12-24T07:15:33Z)
SAFLEX: Self-Adaptive Augmentation via Feature Label Extrapolation [29.598247232905283]
本稿では,既存の拡張戦略と新たなデータセットと学習タスクのギャップを効果的に埋める,データ拡張のための新しい効率的な方法を提案する。我々の発見は、既存の拡張パイプラインを新しいデータタイプとタスクに適用する可能性を強調し、より適応性がありレジリエントなトレーニングフレームワークへの移行を示唆している。
論文参考訳（メタデータ） (2024-10-03T14:21:49Z)
PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。 CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文参考訳（メタデータ） (2024-09-08T15:02:25Z)
Multi-objective Representation for Numbers in Clinical Narratives: A CamemBERT-Bio-Based Alternative to Large-Scale LLMs [0.9208007322096533]
本稿では,数値の理解におけるトランスフォーマーモデルの限界について検討する。医学文書から抽出した数値を,CamemBERT-bioを用いて8つの特定の生理カテゴリーに分類することを目的とする。
論文参考訳（メタデータ） (2024-05-28T01:15:21Z)
Semi-supervised Medical Image Segmentation Method Based on Cross-pseudo Labeling Leveraging Strong and Weak Data Augmentation Strategies [2.8246591681333024]
本稿では,Fixmatch の概念を革新的に取り入れた半教師付きモデル DFCPS を提案する。整合性学習と自己学習を統合したクロス擬似スーパービジョンが導入された。我々のモデルは、ラベルなしデータの比率が異なる4つの区分全てにおいて、常に優れた性能を示す。
論文参考訳（メタデータ） (2024-02-17T13:07:44Z)
DualAug: Exploiting Additional Heavy Augmentation with OOD Data Rejection [77.6648187359111]
そこで本稿では,textbfDualAug という新しいデータ拡張手法を提案する。教師付き画像分類ベンチマークの実験では、DualAugは様々な自動データ拡張法を改善している。
論文参考訳（メタデータ） (2023-10-12T08:55:10Z)
Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot Text Classification Tasks [75.42002070547267]
テキスト分類におけるデータ拡張のための自己進化学習(SE)に基づくミックスアップ手法を提案する。モデル出力と原サンプルの1つのホットラベルを線形に補間して,新しい軟質なラベル混在を生成する,新しいインスタンス固有ラベル平滑化手法を提案する。
論文参考訳（メタデータ） (2023-05-22T23:43:23Z)
Retrieval-augmented Multi-label Text Classification [20.100081284294973]
マルチラベルテキスト分類は、大きなラベルセットの設定において難しい課題である。 Retrieval augmentationは、分類モデルのサンプル効率を改善することを目的としている。本手法は,法および生物医学領域の4つのデータセットに対して評価する。
論文参考訳（メタデータ） (2023-05-22T14:16:23Z)
Enhancing Label Sharing Efficiency in Complementary-Label Learning with Label Augmentation [92.4959898591397]
学習中に近隣の事例における補完ラベルの暗黙的な共有を分析した。相補的なラベル拡張による共有効率を向上させる新しい手法を提案する。実験結果から,従来のCLLモデルよりも相補的ラベル拡張により経験的性能が向上することが確認された。
論文参考訳（メタデータ） (2023-05-15T04:43:14Z)
DualMix: Unleashing the Potential of Data Augmentation for Online Class-Incremental Learning [14.194817677415065]
その結果,元のデータとの相関が低い拡張サンプルの方が,忘れの防止に有効であることが示唆された。本稿では,拡張サンプルとラベルを同時に混合する拡張ミックスアップ(EnMix)手法を提案する。クラス不均衡問題を解決するために、決定境界を調整するための適応混合法(AdpMix)を設計する。
論文参考訳（メタデータ） (2023-03-14T12:55:42Z)
BB-GCN: A Bi-modal Bridged Graph Convolutional Network for Multi-label Chest X-Ray Recognition [7.110986667249555]
マルチラベル胸部X線(英語版)(CXR)認識は、異なる病理の複数のラベルを同時に診断し識別する。従来の手法は、ローカルラベル情報をモデル化するために、状態変数の符号化とアテンションメカニズムに頼っていた。 Bi-modal Bridged Graph Convolutional Network (BB-GCN) モデルを提案する。
論文参考訳（メタデータ） (2023-02-22T01:03:53Z)
Extreme Zero-Shot Learning for Extreme Text Classification [80.95271050744624]
極端ゼロショットXMC (EZ-XMC) とフーショットXMC (FS-XMC) について検討した。自己教師付きコントラスト損失のあるトランスフォーマーベースのエンコーダの事前訓練を提案する。我々は,多スケール適応クラスタリング,ラベル正規化,擬陽性ペアによる自己学習などの手法を用いて,生テキストを徹底的に活用する事前学習手法MACLRを開発した。
論文参考訳（メタデータ） (2021-12-16T06:06:42Z)
Enforcing Mutual Consistency of Hard Regions for Semi-supervised Medical Image Segmentation [68.9233942579956]
半教師型医用画像セグメンテーションにおいて,ラベルのないハード領域を活用するための新しい相互整合性ネットワーク(MC-Net+)を提案する。 MC-Net+モデルは、限られたアノテーションで訓練された深いモデルは、非常に不確実で容易に分類された予測を出力する傾向があるという観察に動機づけられている。 MC-Net+のセグメンテーション結果と、最先端の5つの半教師付きアプローチを3つの公開医療データセットで比較した。
論文参考訳（メタデータ） (2021-09-21T04:47:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。