論文の概要: Exploring semantic information in disease: Simple Data Augmentation Techniques for Chinese Disease Normalization
- arxiv url: http://arxiv.org/abs/2306.01931v2
- Date: Wed, 20 Mar 2024 03:33:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 22:57:10.522825
- Title: Exploring semantic information in disease: Simple Data Augmentation Techniques for Chinese Disease Normalization
- Title(参考訳): 疾患のセマンティック情報を探る:中国病の正規化のための簡易データ拡張技術
- Authors: Wenqian Cui, Xiangling Fu, Shaohui Liu, Mingjun Gu, Xien Liu, Ji Wu, Irwin King,
- Abstract要約: 病名正規化は医療分野において重要な課題である。
既存の疾患名正規化システムに対する最も大きな障害は、トレーニングデータの不足である。
本稿では,病名固有の意味情報を活用するために,カスタマイズされたデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 37.728046333074786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Disease name normalization is an important task in the medical domain. It classifies disease names written in various formats into standardized names, serving as a fundamental component in smart healthcare systems for various disease-related functions. Nevertheless, the most significant obstacle to existing disease name normalization systems is the severe shortage of training data. While data augmentation is a powerful approach for addressing data scarcity, our findings reveal that conventional data augmentation techniques often impede task performance, primarily due to the multi-axis and multi-granularity nature of disease names. Consequently, we introduce a set of customized data augmentation techniques designed to leverage the semantic information inherent in disease names. These techniques aim to enhance the model's understanding of the semantic intricacies and classification structure of disease names. Through extensive experimentation, we illustrate that our proposed plug-and-play methods not only surpass general data augmentation techniques but also exhibit significant performance improvements across various baseline models and training objectives, particularly in scenarios with limited training data. This underscores its potential for widespread application in medical language processing tasks.
- Abstract(参考訳): 病名正規化は医療分野において重要な課題である。
様々なフォーマットで書かれた疾患名を標準化された名前に分類し、さまざまな疾患関連機能のためのスマートヘルスケアシステムの基本コンポーネントとして機能する。
それでも、既存の病名正規化システムにとって最も重要な障害は、トレーニングデータの不足である。
データ拡張はデータ不足に対処するための強力なアプローチであるが、従来のデータ拡張技術は、主に疾患名の多軸および多粒性の性質のために、タスクパフォーマンスを阻害することが多い。
そこで本研究では,病名固有の意味情報を活用するために,カスタマイズしたデータ拡張手法を提案する。
これらの手法は、疾患名の意味的複雑さと分類構造に対するモデルの理解を高めることを目的としている。
広汎な実験を通して,提案手法は一般的なデータ拡張技術を超えるだけでなく,様々なベースラインモデルやトレーニング目標,特に限られたトレーニングデータを持つシナリオにおいて,大幅な性能向上を示すことを示す。
このことは、医療言語処理タスクに広く応用される可能性を示している。
関連論文リスト
- Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline [42.49727243388804]
そこで本研究では,植物病原体認識データセットを提案する。
病気のクラスが最も多いだけでなく、各疾患に関するテキストベースの記述も含んでいる。
提案したデータセットは,実世界の疾患認識手法を評価するための理想的なテストベッドとみなすことができる。
論文 参考訳(メタデータ) (2024-08-06T11:49:13Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - Unsupervised Representation Learning Meets Pseudo-Label Supervised
Self-Distillation: A New Approach to Rare Disease Classification [26.864435224276964]
本稿では,2つの重要な新奇性を有するレア疾患分類への新しいハイブリッドアプローチを提案する。
まず、自己監督型コントラスト損失に基づく教師なし表現学習(URL)を採用する。
第二に、これらのURLを擬似ラベル管理分類と統合し、稀な疾患に関する知識を効果的に自己蒸留する。
論文 参考訳(メタデータ) (2021-10-09T12:56:09Z) - Lifelong Learning based Disease Diagnosis on Clinical Notes [24.146567779632107]
本稿では,医学的実体と文脈の融合,エピソディクス記憶の埋め込み,知識の保持に注意を払うことを提案する。
各種病院から収集した臨床記録を含む新しいベンチマークjarvis-40を樹立した。
提案手法は,提案するベンチマークで最先端の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-02-27T09:23:57Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Disease Normalization with Graph Embeddings [12.70213916725476]
NCBI 病性ベンチマークコーパスを用いて,本手法の訓練と試験を行った。
本稿では,分類学で利用可能な語彙情報とともに,MeSHのグラフィカルな構造を活用することで病名を表現することを提案する。
また、ニューラルネームのエンティティ認識モデルと、マルチタスク学習によるグラフベースのエンティティリンク手法を組み合わせることで、NCBIコーパスにおける疾患認識が改善されることを示す。
論文 参考訳(メタデータ) (2020-10-24T16:25:05Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。