論文の概要: Exploring semantic information in disease: Simple Data Augmentation
Techniques for Chinese Disease Normalization
- arxiv url: http://arxiv.org/abs/2306.01931v1
- Date: Fri, 2 Jun 2023 22:12:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 21:23:30.271874
- Title: Exploring semantic information in disease: Simple Data Augmentation
Techniques for Chinese Disease Normalization
- Title(参考訳): 疾患のセマンティック情報を探る:中国病の正規化のための簡易データ拡張技術
- Authors: Wenqian Cui and Shaohui Liu and Xiangling Fu and Xien Liu and Ji Wu
- Abstract要約: 本稿では,病気の正規化のためのトレーニングタスクとして協調して機能する一連のデータ拡張手法を提案する。
提案手法は, 拡張されていない手法と比較して最大3%の性能向上が可能である。
- 参考スコア(独自算出の注目度): 21.497703900982884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The disease is a core concept in the medical field, and the task of
normalizing disease names is the basis of all disease-related tasks. However,
due to the multi-axis and multi-grain nature of disease names, incorrect
information is often injected and harms the performance when using general text
data augmentation techniques. To address the above problem, we propose a set of
data augmentation techniques that work together as an augmented training task
for disease normalization. Our data augmentation methods are based on both the
clinical disease corpus and standard disease corpus derived from ICD-10 coding.
Extensive experiments are conducted to show the effectiveness of our proposed
methods. The results demonstrate that our methods can have up to 3\%
performance gain compared to non-augmented counterparts, and they can work even
better on smaller datasets.
- Abstract(参考訳): この病気は医療分野における中核的な概念であり、病名標準化の課題は、すべての疾患関連タスクの基礎である。
しかし,病名の多軸・多結晶性のため,誤情報がしばしば注入され,一般的なテキストデータ拡張技術を用いた場合の性能が損なわれる。
そこで本研究では,疾患の正規化のための強化訓練タスクとして機能するデータ拡張手法を提案する。
ICD-10コードから得られた臨床疾患コーパスと標準疾患コーパスの両方に基づいてデータ拡張を行った。
提案手法の有効性を示すために広範な実験を行った。
その結果,提案手法は,提案手法に比べて最大3-%の性能向上が可能となり,より小さなデータセットでもより優れた処理が可能となった。
関連論文リスト
- Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline [42.49727243388804]
そこで本研究では,植物病原体認識データセットを提案する。
病気のクラスが最も多いだけでなく、各疾患に関するテキストベースの記述も含んでいる。
提案したデータセットは,実世界の疾患認識手法を評価するための理想的なテストベッドとみなすことができる。
論文 参考訳(メタデータ) (2024-08-06T11:49:13Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - Unsupervised Representation Learning Meets Pseudo-Label Supervised
Self-Distillation: A New Approach to Rare Disease Classification [26.864435224276964]
本稿では,2つの重要な新奇性を有するレア疾患分類への新しいハイブリッドアプローチを提案する。
まず、自己監督型コントラスト損失に基づく教師なし表現学習(URL)を採用する。
第二に、これらのURLを擬似ラベル管理分類と統合し、稀な疾患に関する知識を効果的に自己蒸留する。
論文 参考訳(メタデータ) (2021-10-09T12:56:09Z) - Lifelong Learning based Disease Diagnosis on Clinical Notes [24.146567779632107]
本稿では,医学的実体と文脈の融合,エピソディクス記憶の埋め込み,知識の保持に注意を払うことを提案する。
各種病院から収集した臨床記録を含む新しいベンチマークjarvis-40を樹立した。
提案手法は,提案するベンチマークで最先端の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-02-27T09:23:57Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Disease Normalization with Graph Embeddings [12.70213916725476]
NCBI 病性ベンチマークコーパスを用いて,本手法の訓練と試験を行った。
本稿では,分類学で利用可能な語彙情報とともに,MeSHのグラフィカルな構造を活用することで病名を表現することを提案する。
また、ニューラルネームのエンティティ認識モデルと、マルチタスク学習によるグラフベースのエンティティリンク手法を組み合わせることで、NCBIコーパスにおける疾患認識が改善されることを示す。
論文 参考訳(メタデータ) (2020-10-24T16:25:05Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。