論文の概要: On Data Augmentation for Extreme Multi-label Classification
- arxiv url: http://arxiv.org/abs/2009.10778v1
- Date: Tue, 22 Sep 2020 19:31:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 21:23:06.719033
- Title: On Data Augmentation for Extreme Multi-label Classification
- Title(参考訳): 極端多重ラベル分類のためのデータ拡張について
- Authors: Danqing Zhang, Tao Li, Haiyang Zhang, Bing Yin
- Abstract要約: 極端多重ラベル分類(XMC)問題に対するデータ拡張に着目する。
XMCの最も難しい問題の1つは、ロングテールラベルの配布である。
本稿では,シンプルで効果的な拡張フレームワークと最先端の分類器を提案する。
- 参考スコア(独自算出の注目度): 25.26335913643624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we focus on data augmentation for the extreme multi-label
classification (XMC) problem. One of the most challenging issues of XMC is the
long tail label distribution where even strong models suffer from insufficient
supervision. To mitigate such label bias, we propose a simple and effective
augmentation framework and a new state-of-the-art classifier. Our augmentation
framework takes advantage of the pre-trained GPT-2 model to generate
label-invariant perturbations of the input texts to augment the existing
training data. As a result, it present substantial improvements over baseline
models. Our contributions are two-factored: (1) we introduce a new
state-of-the-art classifier that uses label attention with RoBERTa and combine
it with our augmentation framework for further improvement; (2) we present a
broad study on how effective are different augmentation methods in the XMC
task.
- Abstract(参考訳): 本稿では,極端多重ラベル分類(XMC)問題に対するデータ拡張に着目した。
XMCの最も困難な問題の1つは、強力なモデルでさえ監督不足に悩まされる長い尾のラベル分布である。
このようなラベルバイアスを軽減するために,単純かつ効果的な拡張フレームワークと最先端の分類器を提案する。
この拡張フレームワークは,事前学習したgpt-2モデルを利用して入力テキストのラベル不変な摂動を生成し,既存のトレーニングデータの強化を行う。
その結果、ベースラインモデルよりも大幅に改善されている。
我々は,1)RoBERTaとラベルアテンションを併用した新しい最先端分類器を導入し,さらに改善するための拡張フレームワークと組み合わせ,(2)XMCタスクにおける異なる拡張方法がどの程度有効であるかを広く研究する。
関連論文リスト
- SAFLEX: Self-Adaptive Augmentation via Feature Label Extrapolation [29.598247232905283]
本稿では,既存の拡張戦略と新たなデータセットと学習タスクのギャップを効果的に埋める,データ拡張のための新しい効率的な方法を提案する。
我々の発見は、既存の拡張パイプラインを新しいデータタイプとタスクに適用する可能性を強調し、より適応性がありレジリエントなトレーニングフレームワークへの移行を示唆している。
論文 参考訳(メタデータ) (2024-10-03T14:21:49Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Semi-supervised Medical Image Segmentation Method Based on Cross-pseudo
Labeling Leveraging Strong and Weak Data Augmentation Strategies [2.8246591681333024]
本稿では,Fixmatch の概念を革新的に取り入れた半教師付きモデル DFCPS を提案する。
整合性学習と自己学習を統合したクロス擬似スーパービジョンが導入された。
我々のモデルは、ラベルなしデータの比率が異なる4つの区分全てにおいて、常に優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-17T13:07:44Z) - DualAug: Exploiting Additional Heavy Augmentation with OOD Data
Rejection [77.6648187359111]
そこで本稿では,textbfDualAug という新しいデータ拡張手法を提案する。
教師付き画像分類ベンチマークの実験では、DualAugは様々な自動データ拡張法を改善している。
論文 参考訳(メタデータ) (2023-10-12T08:55:10Z) - Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot
Text Classification Tasks [75.42002070547267]
テキスト分類におけるデータ拡張のための自己進化学習(SE)に基づくミックスアップ手法を提案する。
モデル出力と原サンプルの1つのホットラベルを線形に補間して,新しい軟質なラベル混在を生成する,新しいインスタンス固有ラベル平滑化手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T23:43:23Z) - Retrieval-augmented Multi-label Text Classification [20.100081284294973]
マルチラベルテキスト分類は、大きなラベルセットの設定において難しい課題である。
Retrieval augmentationは、分類モデルのサンプル効率を改善することを目的としている。
本手法は,法および生物医学領域の4つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2023-05-22T14:16:23Z) - Enhancing Label Sharing Efficiency in Complementary-Label Learning with
Label Augmentation [92.4959898591397]
学習中に近隣の事例における補完ラベルの暗黙的な共有を分析した。
相補的なラベル拡張による共有効率を向上させる新しい手法を提案する。
実験結果から,従来のCLLモデルよりも相補的ラベル拡張により経験的性能が向上することが確認された。
論文 参考訳(メタデータ) (2023-05-15T04:43:14Z) - DualMix: Unleashing the Potential of Data Augmentation for Online
Class-Incremental Learning [14.194817677415065]
その結果,元のデータとの相関が低い拡張サンプルの方が,忘れの防止に有効であることが示唆された。
本稿では,拡張サンプルとラベルを同時に混合する拡張ミックスアップ(EnMix)手法を提案する。
クラス不均衡問題を解決するために、決定境界を調整するための適応混合法(AdpMix)を設計する。
論文 参考訳(メタデータ) (2023-03-14T12:55:42Z) - BB-GCN: A Bi-modal Bridged Graph Convolutional Network for Multi-label
Chest X-Ray Recognition [7.110986667249555]
マルチラベル胸部X線(英語版)(CXR)認識は、異なる病理の複数のラベルを同時に診断し識別する。
従来の手法は、ローカルラベル情報をモデル化するために、状態変数の符号化とアテンションメカニズムに頼っていた。
Bi-modal Bridged Graph Convolutional Network (BB-GCN) モデルを提案する。
論文 参考訳(メタデータ) (2023-02-22T01:03:53Z) - Extreme Zero-Shot Learning for Extreme Text Classification [80.95271050744624]
極端ゼロショットXMC (EZ-XMC) とフーショットXMC (FS-XMC) について検討した。
自己教師付きコントラスト損失のあるトランスフォーマーベースのエンコーダの事前訓練を提案する。
我々は,多スケール適応クラスタリング,ラベル正規化,擬陽性ペアによる自己学習などの手法を用いて,生テキストを徹底的に活用する事前学習手法MACLRを開発した。
論文 参考訳(メタデータ) (2021-12-16T06:06:42Z) - Enforcing Mutual Consistency of Hard Regions for Semi-supervised Medical
Image Segmentation [68.9233942579956]
半教師型医用画像セグメンテーションにおいて,ラベルのないハード領域を活用するための新しい相互整合性ネットワーク(MC-Net+)を提案する。
MC-Net+モデルは、限られたアノテーションで訓練された深いモデルは、非常に不確実で容易に分類された予測を出力する傾向があるという観察に動機づけられている。
MC-Net+のセグメンテーション結果と、最先端の5つの半教師付きアプローチを3つの公開医療データセットで比較した。
論文 参考訳(メタデータ) (2021-09-21T04:47:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。