論文の概要: Simple Data Augmentation Techniques for Chinese Disease Normalization
- arxiv url: http://arxiv.org/abs/2306.01931v3
- Date: Thu, 13 Jun 2024 07:06:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-15 02:29:06.789074
- Title: Simple Data Augmentation Techniques for Chinese Disease Normalization
- Title(参考訳): 中国病の正規化のための簡易データ拡張技術
- Authors: Wenqian Cui, Xiangling Fu, Shaohui Liu, Mingjun Gu, Xien Liu, Ji Wu, Irwin King,
- Abstract要約: 病名正規化は医療分野において重要な課題である。
既存の疾患名正規化システムに対する最も大きな障害は、トレーニングデータの不足である。
本稿では,一連のデータ拡張手法といくつかのサポートモジュールを含む新しいデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 37.728046333074786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Disease name normalization is an important task in the medical domain. It classifies disease names written in various formats into standardized names, serving as a fundamental component in smart healthcare systems for various disease-related functions. Nevertheless, the most significant obstacle to existing disease name normalization systems is the severe shortage of training data. Consequently, we present a novel data augmentation approach that includes a series of data augmentation techniques and some supporting modules to help mitigate the problem. Our proposed methods rely on the Structural Invariance property of disease names and the Hierarchy property of the disease classification system. The goal is to equip the models with extensive understanding of the disease names and the hierarchical structure of the disease name classification system. Through extensive experimentation, we illustrate that our proposed approach exhibits significant performance improvements across various baseline models and training objectives, particularly in scenarios with limited training data.
- Abstract(参考訳): 病名正規化は医療分野において重要な課題である。
様々なフォーマットで書かれた疾患名を標準化された名前に分類し、さまざまな疾患関連機能のためのスマートヘルスケアシステムの基本コンポーネントとして機能する。
それでも、既存の病名正規化システムにとって最も重要な障害は、トレーニングデータの不足である。
そこで本研究では,一連のデータ拡張技術と,問題を緩和するためのサポートモジュールを含む,新たなデータ拡張手法を提案する。
提案手法は,疾患名の構造的不変性と疾患分類システムの階層性に依存する。
本研究の目的は, 疾患名分類システムの階層構造と, 疾患名に対する広範囲の理解をモデルに組み込むことである。
大規模な実験を通じて,提案手法は様々なベースラインモデルおよびトレーニング目標,特に限られたトレーニングデータを持つシナリオにおいて,大幅な性能向上を示すことを示す。
関連論文リスト
- Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline [42.49727243388804]
そこで本研究では,植物病原体認識データセットを提案する。
病気のクラスが最も多いだけでなく、各疾患に関するテキストベースの記述も含んでいる。
提案したデータセットは,実世界の疾患認識手法を評価するための理想的なテストベッドとみなすことができる。
論文 参考訳(メタデータ) (2024-08-06T11:49:13Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - Unsupervised Representation Learning Meets Pseudo-Label Supervised
Self-Distillation: A New Approach to Rare Disease Classification [26.864435224276964]
本稿では,2つの重要な新奇性を有するレア疾患分類への新しいハイブリッドアプローチを提案する。
まず、自己監督型コントラスト損失に基づく教師なし表現学習(URL)を採用する。
第二に、これらのURLを擬似ラベル管理分類と統合し、稀な疾患に関する知識を効果的に自己蒸留する。
論文 参考訳(メタデータ) (2021-10-09T12:56:09Z) - Lifelong Learning based Disease Diagnosis on Clinical Notes [24.146567779632107]
本稿では,医学的実体と文脈の融合,エピソディクス記憶の埋め込み,知識の保持に注意を払うことを提案する。
各種病院から収集した臨床記録を含む新しいベンチマークjarvis-40を樹立した。
提案手法は,提案するベンチマークで最先端の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-02-27T09:23:57Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Disease Normalization with Graph Embeddings [12.70213916725476]
NCBI 病性ベンチマークコーパスを用いて,本手法の訓練と試験を行った。
本稿では,分類学で利用可能な語彙情報とともに,MeSHのグラフィカルな構造を活用することで病名を表現することを提案する。
また、ニューラルネームのエンティティ認識モデルと、マルチタスク学習によるグラフベースのエンティティリンク手法を組み合わせることで、NCBIコーパスにおける疾患認識が改善されることを示す。
論文 参考訳(メタデータ) (2020-10-24T16:25:05Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。