論文の概要: Exploring semantic information in disease: Simple Data Augmentation Techniques for Chinese Disease Normalization
- arxiv url: http://arxiv.org/abs/2306.01931v2
- Date: Wed, 20 Mar 2024 03:33:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 22:57:10.522825
- Title: Exploring semantic information in disease: Simple Data Augmentation Techniques for Chinese Disease Normalization
- Title(参考訳): 疾患のセマンティック情報を探る:中国病の正規化のための簡易データ拡張技術
- Authors: Wenqian Cui, Xiangling Fu, Shaohui Liu, Mingjun Gu, Xien Liu, Ji Wu, Irwin King,
- Abstract要約: 病名正規化は医療分野において重要な課題である。
既存の疾患名正規化システムに対する最も大きな障害は、トレーニングデータの不足である。
本稿では,病名固有の意味情報を活用するために,カスタマイズされたデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 37.728046333074786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Disease name normalization is an important task in the medical domain. It classifies disease names written in various formats into standardized names, serving as a fundamental component in smart healthcare systems for various disease-related functions. Nevertheless, the most significant obstacle to existing disease name normalization systems is the severe shortage of training data. While data augmentation is a powerful approach for addressing data scarcity, our findings reveal that conventional data augmentation techniques often impede task performance, primarily due to the multi-axis and multi-granularity nature of disease names. Consequently, we introduce a set of customized data augmentation techniques designed to leverage the semantic information inherent in disease names. These techniques aim to enhance the model's understanding of the semantic intricacies and classification structure of disease names. Through extensive experimentation, we illustrate that our proposed plug-and-play methods not only surpass general data augmentation techniques but also exhibit significant performance improvements across various baseline models and training objectives, particularly in scenarios with limited training data. This underscores its potential for widespread application in medical language processing tasks.
- Abstract(参考訳): 病名正規化は医療分野において重要な課題である。
様々なフォーマットで書かれた疾患名を標準化された名前に分類し、さまざまな疾患関連機能のためのスマートヘルスケアシステムの基本コンポーネントとして機能する。
それでも、既存の病名正規化システムにとって最も重要な障害は、トレーニングデータの不足である。
データ拡張はデータ不足に対処するための強力なアプローチであるが、従来のデータ拡張技術は、主に疾患名の多軸および多粒性の性質のために、タスクパフォーマンスを阻害することが多い。
そこで本研究では,病名固有の意味情報を活用するために,カスタマイズしたデータ拡張手法を提案する。
これらの手法は、疾患名の意味的複雑さと分類構造に対するモデルの理解を高めることを目的としている。
広汎な実験を通して,提案手法は一般的なデータ拡張技術を超えるだけでなく,様々なベースラインモデルやトレーニング目標,特に限られたトレーニングデータを持つシナリオにおいて,大幅な性能向上を示すことを示す。
このことは、医療言語処理タスクに広く応用される可能性を示している。
関連論文リスト
- Time-aware Heterogeneous Graph Transformer with Adaptive Attention Merging for Health Event Prediction [12.768971586237067]
本稿では,疾患領域の知識を同化し,薬物と疾患の複雑な関係を解明するための新しい異種グラフ学習モデルを提案する。
2つの医療データセットで評価したところ、予測精度と解釈可能性の両方において顕著な改善が見られた。
論文 参考訳(メタデータ) (2024-04-23T08:01:30Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - Advancements in eHealth Data Analytics through Natural Language
Processing and Deep Learning [0.614609308117547]
この章では、非構造化(画像およびテキスト)eヘルスデータを解析するための、現在で最も高性能なソリューションについて批判的な研究を行っている。
この研究は、eHealthコンテキストにおける現在の自然言語処理とディープラーニング技術の比較も提供する。
論文 参考訳(メタデータ) (2024-01-19T17:51:11Z) - Domain-invariant Clinical Representation Learning by Bridging Data
Distribution Shift across EMR Datasets [16.317118701435742]
適切な診断を行い、パーソナライズされた治療計画を設計する上で、効果的な予後モデルが期待されている。
疾患の初期段階では、限られたデータ収集と臨床経験に加えて、プライバシと倫理の懸念から、参照のためのデータ可用性が制限される可能性がある。
本稿では、ソースデータセットからターゲットデータセットへの遷移モデルを構築するためのドメイン不変表現学習手法を紹介する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Knowledge-Guided Data-Centric AI in Healthcare: Progress, Shortcomings,
and Future Directions [7.673853485227739]
ディープラーニングは、特定の概念や意味の幅広い例を学ぶことができる。
医学において、特定の疾患に関する多様なトレーニングデータを持つことは、疾患を正確に予測できるモデルの開発につながる可能性がある。
潜在的な利点にもかかわらず、高品質な注釈付きデータが欠如しているため、画像ベースの診断には大きな進歩はなかった。
この記事では、データ表現の質を改善するためにデータ中心のアプローチを使うことの重要性を強調します。
論文 参考訳(メタデータ) (2022-12-27T19:35:14Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Unsupervised Representation Learning Meets Pseudo-Label Supervised
Self-Distillation: A New Approach to Rare Disease Classification [26.864435224276964]
本稿では,2つの重要な新奇性を有するレア疾患分類への新しいハイブリッドアプローチを提案する。
まず、自己監督型コントラスト損失に基づく教師なし表現学習(URL)を採用する。
第二に、これらのURLを擬似ラベル管理分類と統合し、稀な疾患に関する知識を効果的に自己蒸留する。
論文 参考訳(メタデータ) (2021-10-09T12:56:09Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。