論文の概要: Weakly Supervised Text Classification on Free Text Comments in
Patient-Reported Outcome Measures
- arxiv url: http://arxiv.org/abs/2308.06199v1
- Date: Fri, 11 Aug 2023 15:47:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 13:35:52.910015
- Title: Weakly Supervised Text Classification on Free Text Comments in
Patient-Reported Outcome Measures
- Title(参考訳): 患者報告結果尺度におけるフリーテキストコメントの弱い教師付きテキスト分類
- Authors: Anna-Grace Linton (1), Vania Dimitrova (2), Amy Downing (3), Richard
Wagland (4), Adam Glaser (3) ((1) UKRI CDT in AI for Medical Diagnosis and
Care, University of Leeds, UK, (2) School of Computing, University of Leeds,
UK, (3) School of Medicine, University of Leeds, UK, (4) School of Health
Sciences, University of Southampton, UK)
- Abstract要約: 弱教師付きテキスト分類(WSTC)は、ラベル付きデータに制限のあるドメイン固有のテキストデータの分類に有用な分析手法である。
大腸癌患者が報告した健康関連QOL(Health-related Quality of Life, HRQoL)の判定のために, FTCに5つのWSTC手法を適用した。
その結果, ProMsデータには, モデル精度とテーマ間の差異が主因として, 適度な性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Free text comments (FTC) in patient-reported outcome measures (PROMs) data
are typically analysed using manual methods, such as content analysis, which is
labour-intensive and time-consuming. Machine learning analysis methods are
largely unsupervised, necessitating post-analysis interpretation. Weakly
supervised text classification (WSTC) can be a valuable method of analysis to
classify domain-specific text data in which there is limited labelled data. In
this paper, we apply five WSTC techniques to FTC in PROMs data to identify
health-related quality of life (HRQoL) themes reported by colorectal cancer
patients. The WSTC methods label all the themes mentioned in the FTC. The
results showed moderate performance on the PROMs data, mainly due to the
precision of the models, and variation between themes. Evaluation of the
classification performance illustrated the potential and limitations of keyword
based WSTC to label PROMs FTC when labelled data is limited.
- Abstract(参考訳): 患者報告結果測定(PROM)データにおける自由テキストコメント(FTC)は通常、労働集約的で時間を要するコンテンツ分析のような手動の手法を用いて分析される。
機械学習分析手法は、ほとんど教師なしであり、分析後の解釈を必要とする。
弱教師付きテキスト分類(WSTC)は、ラベル付きデータに制限があるドメイン固有のテキストデータを分類するのに有用な分析方法である。
本稿では,大腸癌患者の健康関連QOL(Health-related Quality of Life, HRQoL)の指標として, FTCに5つのWSTC手法を適用した。
WSTCメソッドはFTCで言及されているすべてのテーマをラベル付けする。
結果から,promsデータの性能は,主にモデルの精度とテーマ間のばらつきから中程度に低下した。
分類性能の評価は,ラベル付きデータが限定された場合,PROMs FTCをラベル付けするためのキーワードベースのWSTCの可能性と限界を示した。
関連論文リスト
- Attribute Structuring Improves LLM-Based Evaluation of Clinical Text
Summaries [62.32403630651586]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Data Augmentations for Improved (Large) Language Model Generalization [17.75815547057179]
本稿では,データの因果構造を知ることによって導かれる反ファクト的データ拡張を用いて,突発的特徴に対する介入をシミュレートすることを提案する。
この戦略は,ラベルが属性と突発的に相関しているような予測問題に適していることを示す。
論文 参考訳(メタデータ) (2023-10-19T14:59:25Z) - Leveraging text data for causal inference using electronic health
records [2.4374097382908477]
電子健康データを用いて因果推論を支援するためにテキストデータをどのように利用できるかを示す。
我々は、因果推論のためのマッチングを用いた研究に焦点をあてる。
臨床データの二次分析の範囲を、量的データが質の悪い領域や存在しない領域にまで広げたい。
論文 参考訳(メタデータ) (2023-06-09T16:06:02Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction [32.98121084823483]
本研究では,テストデータとトレーニングデータ間の分散シフトのリスクを低減するために,大量のラベルのないデータを活用することを提案する。
本稿では,無ラベルデータを利用する新しいMGCR法を提案し,TOWEに特化して2つのフィルタを設計し,異なる粒度でノイズデータをフィルタリングする。
論文 参考訳(メタデータ) (2022-08-17T13:19:26Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - An Interpretable End-to-end Fine-tuning Approach for Long Clinical Text [72.62848911347466]
EHRにおける非構造化臨床テキストには、意思決定支援、トライアルマッチング、振り返り研究を含むアプリケーションにとって重要な情報が含まれている。
最近の研究は、これらのモデルが他のNLPドメインにおける最先端の性能を考慮し、BERTベースのモデルを臨床情報抽出およびテキスト分類に応用している。
本稿では,SnipBERTという新しい微調整手法を提案する。SnipBERTは全音符を使用する代わりに,重要なスニペットを識別し,階層的に切り刻まれたBERTベースのモデルに供給する。
論文 参考訳(メタデータ) (2020-11-12T17:14:32Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Learning Interpretable and Discrete Representations with Adversarial
Training for Unsupervised Text Classification [87.28408260725138]
TIGANは、テキストを離散コードと連続ノイズを含む2つの非絡み合った表現にエンコードすることを学ぶ。
抽出したトピックの単語は,TIGANが一貫性と高度に解釈可能なトピックを学習していることを示している。
論文 参考訳(メタデータ) (2020-04-28T02:53:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。