論文の概要: SALP-CG: Standard-Aligned LLM Pipeline for Classifying and Grading Large Volumes of Online Conversational Health Data
- arxiv url: http://arxiv.org/abs/2601.09717v1
- Date: Thu, 25 Dec 2025 01:52:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.695312
- Title: SALP-CG: Standard-Aligned LLM Pipeline for Classifying and Grading Large Volumes of Online Conversational Health Data
- Title(参考訳): SALP-CG: オンライン会話健康データの大量分類とグラフ化のための標準対応LPMパイプライン
- Authors: Yiwei Yan, Hao Li, Hua He, Gong Kai, Zhengyi Yang, Guanfeng Liu,
- Abstract要約: 本研究では,大規模言語モデルに基づく抽出パイプラインSALP-CGを用いて,オンライン会話型健康データにおけるプライバシリスクの分類と評価を行う。
我々は、GB/T 39725-2020に従って、健康データ分類と格付け規則を締結した。
- 参考スコア(独自算出の注目度): 7.015777723337828
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online medical consultations generate large volumes of conversational health data that often embed protected health information, requiring robust methods to classify data categories and assign risk levels in line with policies and practice. However, existing approaches lack unified standards and reliable automated methods to fulfill sensitivity classification for such conversational health data. This study presents a large language model-based extraction pipeline, SALP-CG, for classifying and grading privacy risks in online conversational health data. We concluded health-data classification and grading rules in accordance with GB/T 39725-2020. Combining few-shot guidance, JSON Schema constrained decoding, and deterministic high-risk rules, the backend-agnostic extraction pipeline achieves strong category compliance and reliable sensitivity across diverse LLMs. On the MedDialog-CN benchmark, models yields robust entity counts, high schema compliance, and accurate sensitivity grading, while the strongest model attains micro-F1=0.900 for maximum-level prediction. The category landscape stratified by sensitivity shows that Level 2-3 items dominate, enabling re-identification when combined; Level 4-5 items are less frequent but carry outsize harm. SALP-CG reliably helps classify categories and grading sensitivity in online conversational health data across LLMs, offering a practical method for health data governance. Code is available at https://github.com/dommii1218/SALP-CG.
- Abstract(参考訳): オンライン医療コンサルテーションは、保護された健康情報を埋め込んだ大量の会話型健康データを生成し、データカテゴリを分類し、ポリシーやプラクティスに従ってリスクレベルを割り当てる堅牢な方法を必要とする。
しかし、既存のアプローチでは、このような会話型健康データに対する感度分類を実現するための統一標準や信頼性の高い自動化手法が欠如している。
本研究では,大規模言語モデルに基づく抽出パイプラインSALP-CGを用いて,オンライン会話型健康データにおけるプライバシリスクの分類と評価を行う。
我々は、GB/T 39725-2020に従って、健康データ分類と格付け規則を締結した。
数ショットのガイダンス、JSON Schemaの制約付きデコーディング、決定論的ハイリスクルールを組み合わせることで、バックエンドに依存しない抽出パイプラインは、さまざまなLLMに対して強力なカテゴリコンプライアンスと信頼性を実現する。
MedDialog-CNベンチマークでは、モデルが堅牢なエンティティカウント、高いスキーマコンプライアンス、正確な感度グレーディングを出力し、最強のモデルは最大レベルの予測のためにmicro-F1=0.900に達する。
感度によって階層化されたカテゴリーランドスケープは、レベル2-3アイテムが支配的であり、組み合わせると再識別が可能であり、レベル4-5アイテムは頻度が低いが、大きすぎる。
SALP-CGは、LLMをまたいだオンラインの会話型健康データにおいて、カテゴリの分類と感度の低下を確実に支援し、健康データガバナンスの実践的な方法を提供する。
コードはhttps://github.com/dommii1218/SALP-CGで入手できる。
関連論文リスト
- EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models [82.43729208063468]
医療用LVLM(Large Vision-Language Models)の最近のベンチマークでは、信頼性と安全性を見越して、リーダボードの精度を強調している。
ユーザが提供した情報を非批判的に反響させる傾向のモデルについて検討する。
医療用LVLMの梅毒を系統的に評価するベンチマークであるEchoBenchを紹介する。
論文 参考訳(メタデータ) (2025-09-24T14:09:55Z) - Scaling behavior of large language models in emotional safety classification across sizes and tasks [0.0]
本研究では,大言語モデル(LLM)の3次的感情安全分類と多ラベル分類という2つの重要な課題に対するスケーリング行動について検討する。
我々は、人間によって認可されたメンタルヘルスデータセットをマージして、新しいデータセットを構築する。
4つのLLaMAモデル (1B, 3B, 8B, 70B) をゼロショット, 少数ショット, 微調整設定で評価した。
論文 参考訳(メタデータ) (2025-09-02T20:53:03Z) - A Graph-Based Test-Harness for LLM Evaluation [0.8164433158925593]
我々は400以上の質問に対して、ダイナミックで体系的な医療ガイドラインのベンチマークのプロトタイプを初めて提示する。
我々はWHO IMCIハンドブックを200以上のノードを持つ有向グラフに変換し、年齢別シナリオを含む質問を生成する。
症状認識には優れたモデルがあるが,重症度,治療プロトコル,フォローアップケアに苦慮している。
論文 参考訳(メタデータ) (2025-08-28T14:10:59Z) - KDH-MLTC: Knowledge Distillation for Healthcare Multi-Label Text Classification [4.8342038441006805]
本研究は、医療用多ラベルテキスト分類(KDH-MLTC)における知識蒸留について述べる。
提案手法は,知識蒸留と逐次微調整を統合することで,従来の医療用マルチラベルテキスト分類の課題に対処する。
3つの医学文献データセットを用いて実験を行った結果、KDH-MLTCは既存の手法に比べて優れた性能を示した。
論文 参考訳(メタデータ) (2025-05-12T00:58:25Z) - BingoGuard: LLM Content Moderation Tools with Risk Levels [67.53167973090356]
大きな言語モデル(LLM)によって生成された悪意のあるコンテンツは、様々な程度に害を与える可能性がある。
本稿では,11の有害トピックに対するトピックごとの重度ルーブリックを導入し,LLMに基づくモデレーションシステムであるBingoGuardを構築する。
論文 参考訳(メタデータ) (2025-03-09T10:43:09Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - HealthQ: Unveiling Questioning Capabilities of LLM Chains in Healthcare Conversations [20.31796453890812]
HealthQは、医療会話における大規模言語モデル(LLM)の質問機能を評価するためのフレームワークである。
我々は LLM の判断を統合して, 具体性, 妥当性, 有用性など, 様々な指標を用いて, 生成した質問を評価する。
医療談話における質問機能評価のための最初の体系的枠組みを提示し、モデルに依存しない評価手法を確立し、高品質な質問をリンクして患者の情報引用を改善するための実証的証拠を提供する。
論文 参考訳(メタデータ) (2024-09-28T23:59:46Z) - Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement [10.611952462532908]
マルチモーダルECG表現学習(MERL)は、テキストプロンプトでゼロショットECG分類を行うことができる。
本稿では,外部の専門知識データベースを利用した臨床知識向上技術(CKEPE)アプローチを提案する。
MERLは、ゼロショット分類における平均75.2%のAUCスコアを(トレーニングデータなしで)達成し、10%の注釈付きトレーニングデータを持つ線形プローブeSSLメソッドよりも3.2%高い。
論文 参考訳(メタデータ) (2024-03-11T12:28:55Z) - A Review on Knowledge Graphs for Healthcare: Resources, Applications, and Promises [59.4999994297993]
この総合的なレビューは、医療知識グラフ(HKG)の現状の概要を提供することを目的としている。
我々は,既存のHKGに関する文献を網羅的に分析し,その構築方法,活用技術,応用について考察した。
このレビューは、HKGsが生物医学研究や臨床実践に大きな影響を与える可能性を強調している。
論文 参考訳(メタデータ) (2023-06-07T21:51:56Z) - Hierarchical Reinforcement Learning for Automatic Disease Diagnosis [52.111516253474285]
政策学習のための対話システムに2段階の階層的な政策構造を統合することを提案する。
提案した政策構造は,多くの疾患や症状を含む診断問題に対処することができる。
論文 参考訳(メタデータ) (2020-04-29T15:02:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。