論文の概要: Multi-Label Clinical Text Eligibility Classification and Summarization System
- arxiv url: http://arxiv.org/abs/2510.13115v1
- Date: Wed, 15 Oct 2025 03:21:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.48679
- Title: Multi-Label Clinical Text Eligibility Classification and Summarization System
- Title(参考訳): マルチラベル臨床テキストの可読度分類と要約システム
- Authors: Surya Tejaswi Yerramsetty, Almas Fathimah,
- Abstract要約: 本稿では,NLP(Natural Language Processing)とLLM(Large Language Models)を利用して,臨床用テキストの適性分類と要約を自動化するシステムを提案する。
このシステムは、ワード埋め込み(Word2Vec)や名前付きエンティティ認識などの特徴抽出手法を組み合わせて、関連する医療概念を識別する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical trials are central to medical progress because they help improve understanding of human health and the healthcare system. They play a key role in discovering new ways to detect, prevent, or treat diseases, and it is essential that clinical trials include participants with appropriate and diverse medical backgrounds. In this paper, we propose a system that leverages Natural Language Processing (NLP) and Large Language Models (LLMs) to automate multi-label clinical text eligibility classification and summarization. The system combines feature extraction methods such as word embeddings (Word2Vec) and named entity recognition to identify relevant medical concepts, along with traditional vectorization techniques such as count vectorization and TF-IDF (Term Frequency-Inverse Document Frequency). We further explore weighted TF-IDF word embeddings that integrate both count-based and embedding-based strengths to capture term importance effectively. Multi-label classification using Random Forest and SVM models is applied to categorize documents based on eligibility criteria. Summarization techniques including TextRank, Luhn, and GPT-3 are evaluated to concisely summarize eligibility requirements. Evaluation with ROUGE scores demonstrates the effectiveness of the proposed methods. This system shows potential for automating clinical trial eligibility assessment using data-driven approaches, thereby improving research efficiency.
- Abstract(参考訳): 臨床試験は、人間の健康と医療システムの理解を深めるのに役立つため、医療の進歩の中心である。
それらは疾患の検出、予防、治療の新たな方法を発見する上で重要な役割を担っており、臨床試験には適切な、多様な医学的背景を持つ参加者が含まれることが不可欠である。
本稿では,NLP(Natural Language Processing)とLLM(Large Language Models)を利用して,多ラベル臨床テキストの可読度分類と要約を自動化するシステムを提案する。
このシステムは、ワード埋め込み(Word2Vec)や名前付きエンティティ認識などの特徴抽出手法を組み合わせて、関連する医療概念を識別し、カウントベクトル化やTF-IDF(Term Frequency-Inverse Document Frequency)といった従来のベクトル化技術と組み合わせている。
さらに、項の重要性を効果的に捉えるために、カウントベースと埋め込みベースの長所を統合した重み付きTF-IDF単語埋め込みについて検討する。
ランダムフォレストモデルとSVMモデルを用いたマルチラベル分類を, 可視性基準に基づく文書分類に適用した。
TextRank, Luhn, GPT-3などの要約技術を評価し, 適性要件を簡潔に要約する。
ROUGEスコアを用いた評価は,提案手法の有効性を示す。
本システムは,データ駆動型アプローチによる臨床治験適性評価の自動化の可能性を示し,研究効率を向上する。
関連論文リスト
- Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Large Language Models for Healthcare Text Classification: A Systematic Review [4.8342038441006805]
大規模言語モデル(LLM)は、自然言語処理(NLP)のアプローチを根本的に変えた。
医療分野では、臨床ノートの分析、診断コーディング、その他のタスクにおいて、正確で費用効率のよいテキスト分類が不可欠である。
医療用テキストの自動分類にLLMを活用するために多くの研究がなされている。
論文 参考訳(メタデータ) (2025-03-03T04:16:13Z) - Systematic Literature Review on Clinical Trial Eligibility Matching [0.24554686192257422]
レビューでは、説明可能なAIと標準化されたオントロジーがクリニックの信頼を高め、採用を広げる方法が強調されている。
臨床治験採用におけるNLPの変革的ポテンシャルを十分に実現するためには、高度な意味的および時間的表現、拡張されたデータ統合、厳密な予測的評価のさらなる研究が必要である。
論文 参考訳(メタデータ) (2025-03-02T11:45:50Z) - SNOBERT: A Benchmark for clinical notes entity linking in the SNOMED CT clinical terminology [43.89160296332471]
本稿では,BERT モデルを用いた SNOMED CT のテキストスパンと特定の概念をリンクする手法を提案する。
本手法は, 候補選択と候補マッチングの2段階からなる。これらのモデルは, ラベル付き臨床ノートの公開データセットの中で, 最大規模で訓練された。
論文 参考訳(メタデータ) (2024-05-25T08:00:44Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Applying unsupervised keyphrase methods on concepts extracted from
discharge sheets [7.102620843620572]
各内容が記録されている部分を特定し、また、臨床テキストから意味を抽出するための重要な概念を特定する必要がある。
本研究では,臨床自然言語処理技術を用いて,これらの課題に対処した。
一般的な教師なしキーフレーズ抽出手法が検証され,評価されている。
論文 参考訳(メタデータ) (2023-03-15T20:55:25Z) - User-Driven Research of Medical Note Generation Software [49.85146209418244]
本稿では,医療用ノート生成システム開発における3ラウンドのユーザスタディについて述べる。
参加する臨床医の印象と,システムがどのようにそれらに価値あるものに適合すべきかの視点について論じる。
遠隔医療における3週間のシステムテストについて述べる。
論文 参考訳(メタデータ) (2022-05-05T10:18:06Z) - Automated Coding of Under-Studied Medical Concept Domains: Linking
Physical Activity Reports to the International Classification of Functioning,
Disability, and Health [22.196642357767338]
医療概念の多くの領域は、医学テキストの効果的なコーディングを支援するための、十分に発達した用語を欠いている。
本稿では,未研究の医療情報の自動符号化のための自然言語処理(NLP)技術を開発するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-27T20:02:59Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。