論文の概要: PVminer: A Domain-Specific Tool to Detect the Patient Voice in Patient Generated Data
- arxiv url: http://arxiv.org/abs/2602.21165v1
- Date: Tue, 24 Feb 2026 18:10:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.876301
- Title: PVminer: A Domain-Specific Tool to Detect the Patient Voice in Patient Generated Data
- Title(参考訳): PVminer:患者生成データ中の患者の声を検出するドメイン特化ツール
- Authors: Samah Fodeh, Linhai Ma, Yan Wang, Srivani Talakokkul, Ganesh Puthiaraju, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree,
- Abstract要約: 本稿では,患者音声をセキュアに構築するためのNLPフレームワークであるPVminerを紹介する。
PVminerは、患者固有のBERTエンコーダを統合するマルチラベル・マルチクラス予測タスクとしてPV検出を定式化する。
PVminerは階層的なタスクにまたがって強いパフォーマンスを達成し、バイオメディカルおよび臨床訓練済みのベースラインを上回ります。
- 参考スコア(独自算出の注目度): 2.6791290096531455
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patient-generated text such as secure messages, surveys, and interviews contains rich expressions of the patient voice (PV), reflecting communicative behaviors and social determinants of health (SDoH). Traditional qualitative coding frameworks are labor intensive and do not scale to large volumes of patient-authored messages across health systems. Existing machine learning (ML) and natural language processing (NLP) approaches provide partial solutions but often treat patient-centered communication (PCC) and SDoH as separate tasks or rely on models not well suited to patient-facing language. We introduce PVminer, a domain-adapted NLP framework for structuring patient voice in secure patient-provider communication. PVminer formulates PV detection as a multi-label, multi-class prediction task integrating patient-specific BERT encoders (PV-BERT-base and PV-BERT-large), unsupervised topic modeling for thematic augmentation (PV-Topic-BERT), and fine-tuned classifiers for Code, Subcode, and Combo-level labels. Topic representations are incorporated during fine-tuning and inference to enrich semantic inputs. PVminer achieves strong performance across hierarchical tasks and outperforms biomedical and clinical pre-trained baselines, achieving F1 scores of 82.25% (Code), 80.14% (Subcode), and up to 77.87% (Combo). An ablation study further shows that author identity and topic-based augmentation each contribute meaningful gains. Pre-trained models, source code, and documentation will be publicly released, with annotated datasets available upon request for research use.
- Abstract(参考訳): セキュアなメッセージ、調査、インタビューなどの患者生成テキストには、コミュニケーション行動や社会的健康決定因子(SDoH)を反映した、患者音声(PV)の豊かな表現が含まれている。
従来の定性的なコーディングフレームワークは労働集約的であり、医療システム全体で大量の患者認可メッセージにスケールしない。
既存の機械学習(ML)と自然言語処理(NLP)アプローチは部分解を提供するが、しばしば患者中心のコミュニケーション(PCC)とSDoHを個別のタスクとして扱う。
本稿では,患者音声をセキュアに構築するためのNLPフレームワークであるPVminerを紹介する。
PVminerは、患者固有のBERTエンコーダ(PV-BERT-baseとPV-BERT-large)、テーマ拡張のための教師なしトピックモデリング(PV-Topic-BERT)、コード、サブコード、コンボレベルのラベルのための微調整された分類器を組み込んだマルチラベル、マルチクラス予測タスクとしてPV検出を定式化している。
トピック表現は、微調整と推論の間に組み込まれ、セマンティックインプットを豊かにする。
PVminerは階層的なタスクにまたがって強いパフォーマンスを達成し、バイオメディカルおよび臨床訓練済みのベースラインを上回り、F1スコアは82.25%(コード)、80.14%(サブコード)、最大77.87%(コンボ)に達する。
アブレーション研究は、著者のアイデンティティとトピックベースの拡張がそれぞれ有意義な利益に寄与していることを示している。
事前トレーニングされたモデル、ソースコード、ドキュメントが公開され、研究使用の要求に応じて注釈付きデータセットが利用可能になる。
関連論文リスト
- Exploring AI-Augmented Sensemaking of Patient-Generated Health Data: A Mixed-Method Study with Healthcare Professionals in Cardiac Risk Reduction [10.518626161486548]
本稿では,患者生成健康データ(PGHD)の自動要約と自然言語データ探索によって,大規模言語モデル(LLM)がいかにして患者生成健康データ(PGHD)の認識を支援するかを示す。
発見によると、AIの要約は、探索を固定する素早い概要を提供し、会話の相互作用はフレキシブルな分析とブリッジされたデータリテラシーギャップを支持した。
論文 参考訳(メタデータ) (2026-02-05T14:11:34Z) - Comparing representations of long clinical texts for the task of patient note-identification [4.552065156611815]
患者ノートの識別には、匿名化された臨床ノートを対応する患者と正確に一致させ、関連するノートのセットで表現する。
BERTモデルを含む様々な埋め込み手法を探索し,中長期臨床テキストを効果的に処理する。
以上の結果から,BERTをベースとした埋め込みは従来型および階層型モデル,特に長期臨床ノートの処理において優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-03-31T12:31:44Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Multi-Site Clinical Federated Learning using Recursive and Attentive
Models and NVFlare [13.176351544342735]
本稿では、データプライバシと規制コンプライアンスの課題に対処する統合フレームワークを開発する。
これには、データのプライバシと規制コンプライアンスの課題に対処し、高い精度を維持し、提案されたアプローチの有効性を実証する統合フレームワークの開発が含まれている。
論文 参考訳(メタデータ) (2023-06-28T17:00:32Z) - Multi-Modal Perceiver Language Model for Outcome Prediction in Emergency
Department [0.03088120935391119]
主訴のテキスト情報とトリアージで記録されたバイタルサインに基づいて, 病院救急部門における結果予測と患者トリアージに関心がある。
我々は、いくつかのアプリケーションで有望な結果を示すモダリティに依存しないトランスフォーマーベースのモデルであるPerceiverを適応する。
実験では,テキストやバイタルサインのみを訓練したモデルと比較して,変異モダリティが予測性能を向上させることを示した。
論文 参考訳(メタデータ) (2023-04-03T06:32:00Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Summarizing Patients Problems from Hospital Progress Notes Using
Pre-trained Sequence-to-Sequence Models [9.879960506853145]
問題リストの要約には、臨床文書を理解し、抽象化し、生成するモデルが必要である。
当科では,入院時に提供者の進捗記録からの入力を用いて,患者の日常診療計画における問題点のリストを作成することを目的とした,新たなNLPタスクを提案する。
論文 参考訳(メタデータ) (2022-08-17T17:07:35Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。