論文の概要: Data Augmentation Techniques for Chinese Disease Name Normalization
- arxiv url: http://arxiv.org/abs/2501.01195v1
- Date: Thu, 02 Jan 2025 11:12:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:16:44.367405
- Title: Data Augmentation Techniques for Chinese Disease Name Normalization
- Title(参考訳): 中国病名正規化のためのデータ拡張技術
- Authors: Wenqian Cui, Xiangling Fu, Shaohui Liu, Mingjun Gu, Xien Liu, Ji Wu, Irwin King,
- Abstract要約: 病名正規化は医療分野において重要な課題である。
既存の疾患名正規化システムに対する最も大きな障害は、トレーニングデータの不足である。
本稿では,一連のデータ拡張手法といくつかのサポートモジュールを含む新しいデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 37.728046333074786
- License:
- Abstract: Disease name normalization is an important task in the medical domain. It classifies disease names written in various formats into standardized names, serving as a fundamental component in smart healthcare systems for various disease-related functions. Nevertheless, the most significant obstacle to existing disease name normalization systems is the severe shortage of training data. Consequently, we present a novel data augmentation approach that includes a series of data augmentation techniques and some supporting modules to help mitigate the problem. Through extensive experimentation, we illustrate that our proposed approach exhibits significant performance improvements across various baseline models and training objectives, particularly in scenarios with limited training data
- Abstract(参考訳): 病名正規化は医療分野において重要な課題である。
様々なフォーマットで書かれた疾患名を標準化された名前に分類し、さまざまな疾患関連機能のためのスマートヘルスケアシステムの基本コンポーネントとして機能する。
それでも、既存の病名正規化システムにとって最も重要な障害は、トレーニングデータの不足である。
そこで本研究では,一連のデータ拡張技術と,問題を緩和するためのサポートモジュールを含む,新たなデータ拡張手法を提案する。
大規模な実験を通じて,提案手法は様々なベースラインモデルおよびトレーニング目標,特に限られたトレーニングデータを持つシナリオにおいて,大幅な性能向上を示すことを示す。
関連論文リスト
- Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - Towards Foundation Models for Critical Care Time Series [38.09906416210531]
本稿では,コア処理変数を含む最初の大規模コレクションとして,シーケンスモデリングと転送学習研究のための調和データセットを提案する。
将来的には、このデータセットを拡張して、トランスファーラーニングのさらなる進歩と、重要な医療アプリケーションのためのスケーラブルで汎用的なモデルの開発をサポートする予定だ。
論文 参考訳(メタデータ) (2024-11-25T12:49:55Z) - Time-aware Heterogeneous Graph Transformer with Adaptive Attention Merging for Health Event Prediction [6.578298085691462]
本稿では,疾患領域の知識を同化し,薬物と疾患の複雑な関係を解明するための新しい異種グラフ学習モデルを提案する。
2つの医療データセットで評価したところ、予測精度と解釈可能性の両方において顕著な改善が見られた。
論文 参考訳(メタデータ) (2024-04-23T08:01:30Z) - Domain-invariant Clinical Representation Learning by Bridging Data Distribution Shift across EMR Datasets [28.59271580918754]
効果的な予後モデルは、医師が正確な診断を行い、パーソナライズされた治療計画を設計するのを助けることができる。
限られたデータ収集、不十分な臨床経験、プライバシと倫理上の懸念は、データの可用性を制限します。
本稿では,ソースとターゲットデータセット間の遷移モデルを構築するドメイン不変表現学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Simple Data Augmentation Techniques for Chinese Disease Normalization [37.728046333074786]
病名正規化は医療分野において重要な課題である。
既存の疾患名正規化システムに対する最も大きな障害は、トレーニングデータの不足である。
本稿では,一連のデータ拡張手法といくつかのサポートモジュールを含む新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2023-06-02T22:12:05Z) - Vocabulary Transfer for Biomedical Texts: Add Tokens if You Can Not Add Data [10.220652487259683]
我々は,対象語彙を拡張して,ドメイン固有のバイオメディカル用語を組み込む手法である語彙拡張に焦点を当てた。
以上の結果から,語彙拡張は,下流モデルの性能と推論時間の両方において,測定可能な改善をもたらすことが示唆された。
論文 参考訳(メタデータ) (2022-08-04T09:53:22Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。