論文の概要: Text2Tree: Aligning Text Representation to the Label Tree Hierarchy for
Imbalanced Medical Classification
- arxiv url: http://arxiv.org/abs/2311.16650v1
- Date: Tue, 28 Nov 2023 10:02:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-29 18:56:02.655552
- Title: Text2Tree: Aligning Text Representation to the Label Tree Hierarchy for
Imbalanced Medical Classification
- Title(参考訳): Text2Tree:不均衡医療分類のためのラベルツリー階層へのテキスト表現の調整
- Authors: Jiahuan Yan, Haojun Gao, Zhang Kai, Weize Liu, Danny Chen, Jian Wu,
Jintai Chen
- Abstract要約: 本稿では、医療用テキストにおけるデータ課題を再考し、Text2Treeと呼ばれるフレームワークに依存しない新しいアルゴリズムを提案する。
ラベルのICDコードツリー構造をカスケードアテンションモジュールに組み込んで階層型ラベル表現を学習する。
異なるラベルのサンプルを再利用・識別することでテキスト分類を向上させるために,2つの新しい学習手法であるSimisity Surrogate Learning (SSL) とDissimilarity Mixup Learning (DML) が考案された。
- 参考スコア(独自算出の注目度): 9.391704905671476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning approaches exhibit promising performances on various text
tasks. However, they are still struggling on medical text classification since
samples are often extremely imbalanced and scarce. Different from existing
mainstream approaches that focus on supplementary semantics with external
medical information, this paper aims to rethink the data challenges in medical
texts and present a novel framework-agnostic algorithm called Text2Tree that
only utilizes internal label hierarchy in training deep learning models. We
embed the ICD code tree structure of labels into cascade attention modules for
learning hierarchy-aware label representations. Two new learning schemes,
Similarity Surrogate Learning (SSL) and Dissimilarity Mixup Learning (DML), are
devised to boost text classification by reusing and distinguishing samples of
other labels following the label representation hierarchy, respectively.
Experiments on authoritative public datasets and real-world medical records
show that our approach stably achieves superior performances over classical and
advanced imbalanced classification methods.
- Abstract(参考訳): ディープラーニングアプローチは、様々なテキストタスクで有望なパフォーマンスを示す。
しかし、サンプルは極めて不均衡で不足していることが多いため、医学的テキスト分類に苦戦している。
外部医療情報を用いた補足的セマンティクスに焦点を当てた既存の主流アプローチとは違って,本研究では,医学テキストにおけるデータ課題を再考し,深層学習モデルのトレーニングにおいて,内部ラベル階層のみを利用するText2Treeと呼ばれる新しいフレームワーク非依存アルゴリズムを提案する。
我々は階層認識ラベル表現を学習するためのカスケードアテンションモジュールにラベルのicdコードツリー構造を埋め込む。
2つの新しい学習スキームであるSimisity Surrogate Learning (SSL) と Dissimilarity Mixup Learning (DML) は、ラベル表現階層に従って他のラベルのサンプルを再利用・識別することで、テキスト分類を強化するために考案された。
権威のある公開データセットと実世界の医療記録の実験により、我々のアプローチは古典的および高度な不均衡な分類方法よりも安定して優れた性能を発揮することが示された。
関連論文リスト
- Leveraging Label Semantics and Meta-Label Refinement for Multi-Label Question Classification [11.19022605804112]
本稿では,新手法RR2QCを多ラベル質問分類に適用する。
ラベルセマンティクスとメタラベルの改良を使用して、パーソナライズされた学習とリソースレコメンデーションを強化する。
実験の結果,RR2QCはPrecision@kとF1スコアの既存の分類方法よりも優れていた。
論文 参考訳(メタデータ) (2024-11-04T06:27:14Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Label Semantic Aware Pre-training for Few-shot Text Classification [53.80908620663974]
テキスト分類システムの一般化とデータ効率を向上させるために,ラベルセマンティック・アウェア事前学習(LSAP)を提案する。
LSAPは、ラベル付き文の2次事前学習を行うことにより、ラベルセマンティクスを事前学習された生成モデル(T5)に組み込む。
論文 参考訳(メタデータ) (2022-04-14T17:33:34Z) - Academic Resource Text Level Multi-label Classification based on
Attention [16.71166207897885]
階層的多ラベル学術テキスト分類(Hierarchical Multi-label academic text classification, HMTC)は、学術テキストを階層的に構造化されたラベリングシステムに割り当てることである。
本稿では,テキスト,キーワード,階層構造などの特徴を統合することで,学術テキスト(AHMCA)の注目に基づく階層的多言語分類アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-21T05:32:35Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Joint Learning of Hyperbolic Label Embeddings for Hierarchical
Multi-label Classification [9.996804039553858]
ラベルが階層内に存在するマルチラベル分類の問題を検討する。
共同学習のための新しい定式化を提案し,その効果を実証的に評価する。
論文 参考訳(メタデータ) (2021-01-13T10:58:54Z) - A Teacher-Student Framework for Semi-supervised Medical Image
Segmentation From Mixed Supervision [62.4773770041279]
そこで我々は,臓器と病変のセグメンテーションのための教師と学生のスタイルに基づくセミ教師付き学習フレームワークを開発した。
我々は,本モデルがバウンディングボックスの品質に対して堅牢であることを示し,フル教師付き学習手法と比較した性能を実現する。
論文 参考訳(メタデータ) (2020-10-23T07:58:20Z) - Joint Embedding of Words and Category Labels for Hierarchical
Multi-label Text Classification [4.2750700546937335]
階層的テキスト分類(HTC)は広く注目されており、幅広い応用の見通しがある。
本稿では,HTC の階層的微調整順序ニューロン LSTM (HFT-ONLSTM) に基づくテキストと親カテゴリの結合埋め込みを提案する。
論文 参考訳(メタデータ) (2020-04-06T11:06:08Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - An Ontology-Aware Framework for Audio Event Classification [19.11706899266862]
近年の音声イベント分類の進歩は、先行情報として利用可能なラベルクラスの構造と関係を無視していることが多い。
フィードフォワードオントロジー層とグラフ畳み込みネットワーク(GCN)の2つのコンポーネントを含むオントロジー対応ニューラルネットワークを提案する。
このフレームワークは、シングルラベルとマルチラベルオーディオイベント分類タスクのための2つのベンチマークデータセットで評価される。
論文 参考訳(メタデータ) (2020-01-27T20:07:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。