論文の概要: Weakly Supervised Text Classification on Free Text Comments in
Patient-Reported Outcome Measures
- arxiv url: http://arxiv.org/abs/2308.06199v1
- Date: Fri, 11 Aug 2023 15:47:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 13:35:52.910015
- Title: Weakly Supervised Text Classification on Free Text Comments in
Patient-Reported Outcome Measures
- Title(参考訳): 患者報告結果尺度におけるフリーテキストコメントの弱い教師付きテキスト分類
- Authors: Anna-Grace Linton (1), Vania Dimitrova (2), Amy Downing (3), Richard
Wagland (4), Adam Glaser (3) ((1) UKRI CDT in AI for Medical Diagnosis and
Care, University of Leeds, UK, (2) School of Computing, University of Leeds,
UK, (3) School of Medicine, University of Leeds, UK, (4) School of Health
Sciences, University of Southampton, UK)
- Abstract要約: 弱教師付きテキスト分類(WSTC)は、ラベル付きデータに制限のあるドメイン固有のテキストデータの分類に有用な分析手法である。
大腸癌患者が報告した健康関連QOL(Health-related Quality of Life, HRQoL)の判定のために, FTCに5つのWSTC手法を適用した。
その結果, ProMsデータには, モデル精度とテーマ間の差異が主因として, 適度な性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Free text comments (FTC) in patient-reported outcome measures (PROMs) data
are typically analysed using manual methods, such as content analysis, which is
labour-intensive and time-consuming. Machine learning analysis methods are
largely unsupervised, necessitating post-analysis interpretation. Weakly
supervised text classification (WSTC) can be a valuable method of analysis to
classify domain-specific text data in which there is limited labelled data. In
this paper, we apply five WSTC techniques to FTC in PROMs data to identify
health-related quality of life (HRQoL) themes reported by colorectal cancer
patients. The WSTC methods label all the themes mentioned in the FTC. The
results showed moderate performance on the PROMs data, mainly due to the
precision of the models, and variation between themes. Evaluation of the
classification performance illustrated the potential and limitations of keyword
based WSTC to label PROMs FTC when labelled data is limited.
- Abstract(参考訳): 患者報告結果測定(PROM)データにおける自由テキストコメント(FTC)は通常、労働集約的で時間を要するコンテンツ分析のような手動の手法を用いて分析される。
機械学習分析手法は、ほとんど教師なしであり、分析後の解釈を必要とする。
弱教師付きテキスト分類(WSTC)は、ラベル付きデータに制限があるドメイン固有のテキストデータを分類するのに有用な分析方法である。
本稿では,大腸癌患者の健康関連QOL(Health-related Quality of Life, HRQoL)の指標として, FTCに5つのWSTC手法を適用した。
WSTCメソッドはFTCで言及されているすべてのテーマをラベル付けする。
結果から,promsデータの性能は,主にモデルの精度とテーマ間のばらつきから中程度に低下した。
分類性能の評価は,ラベル付きデータが限定された場合,PROMs FTCをラベル付けするためのキーワードベースのWSTCの可能性と限界を示した。
関連論文リスト
- Beyond Confusion: A Fine-grained Dialectical Examination of Human Activity Recognition Benchmark Datasets [4.249657064343807]
HAR(Human Activity Recognition)のための機械学習アルゴリズムの研究は、公開データセットで大きく進歩した。
トランスフォーマーのような最近のモデルは、ベンチマーク指標から限られた成功を収めたHARデータセットに適用されている。
本稿では,6つの人気のあるHARベンチマークデータセットのきめ細かい検査を行うことで,これらのオープンな問題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-12-12T07:53:17Z) - From Text to Treatment Effects: A Meta-Learning Approach to Handling Text-Based Confounding [7.5348062792]
本稿では,共起変数をテキストで表現する場合のメタラーナーの性能について検討する。
共同創設者の事前学習したテキスト表現を用いた学習者は,CATE推定精度の向上を図っている。
テキスト埋め込みの絡み合った性質のため、これらのモデルは、完全な共同創設者の知識を持つメタ学習者のパフォーマンスと完全には一致しない。
論文 参考訳(メタデータ) (2024-09-23T19:46:19Z) - Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method [108.56493934296687]
本研究では,乱数から発散する概念に触発された偏差に基づくキャリブレーション手法を導入し,プリトレーニングデータ検出のためのトークン確率のキャリブレーションを行う。
我々は,中国語テキスト上でのLLMの検出手法の性能を評価するために,中国語のベンチマークであるPatentMIAを開発した。
論文 参考訳(メタデータ) (2024-09-23T07:55:35Z) - Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.75567341513897]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。
Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文 参考訳(メタデータ) (2024-09-05T09:10:38Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - Evaluation of post-hoc interpretability methods in time-series classification [0.6249768559720122]
本稿では,既存のポストホック解釈可能性法の性能を評価するために,定量的な指標を用いたフレームワークを提案する。
文献で確認されたいくつかの欠点、すなわち、人間の判断、再訓練、サンプルを除外する際のデータ分布の変化に対処できることが示される。
提案手法と定量的なメトリクスを用いて,実践的な応用で得られた解釈可能性手法の信頼性を理解することができる。
論文 参考訳(メタデータ) (2022-02-11T14:55:56Z) - An Interpretable End-to-end Fine-tuning Approach for Long Clinical Text [72.62848911347466]
EHRにおける非構造化臨床テキストには、意思決定支援、トライアルマッチング、振り返り研究を含むアプリケーションにとって重要な情報が含まれている。
最近の研究は、これらのモデルが他のNLPドメインにおける最先端の性能を考慮し、BERTベースのモデルを臨床情報抽出およびテキスト分類に応用している。
本稿では,SnipBERTという新しい微調整手法を提案する。SnipBERTは全音符を使用する代わりに,重要なスニペットを識別し,階層的に切り刻まれたBERTベースのモデルに供給する。
論文 参考訳(メタデータ) (2020-11-12T17:14:32Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。