論文の概要: Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance
- arxiv url: http://arxiv.org/abs/2603.08989v1
- Date: Mon, 09 Mar 2026 22:25:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.855605
- Title: Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance
- Title(参考訳): クリニカル定性的データの自動解析--全頻度で反復的コードブックリファインメント
- Authors: Seungjun Yi, Joakim Nguyen, Huimin Xu, Terence Lim, Joseph Skrovan, Mehak Beri, Hitakshi Modi, Andrew Well, Carlos M. Mery, Yan Zhang, Mia K. Markey, Ying Ding,
- Abstract要約: Thematic Analysis (TA) は、患者インタビューからパターンを抽出するために、健康研究で広く使われている。
既存のアプローチは、一般化可能性に限界があり、分析監査性に欠けるコードブックを生成する。
本稿では,反復的コードブック改良と完全実績追跡を組み合わせた自動TAフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.445696713895679
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Thematic analysis (TA) is widely used in health research to extract patterns from patient interviews, yet manual TA faces challenges in scalability and reproducibility. LLM-based automation can help, but existing approaches produce codebooks with limited generalizability and lack analytic auditability. We present an automated TA framework combining iterative codebook refinement with full provenance tracking. Evaluated on five corpora spanning clinical interviews, social media, and public transcripts, the framework achieves the highest composite quality score on four of five datasets compared to six baselines. Iterative refinement yields statistically significant improvements on four datasets with large effect sizes, driven by gains in code reusability and distributional consistency while preserving descriptive quality. On two clinical corpora (pediatric cardiology), generated themes align with expert-annotated themes.
- Abstract(参考訳): Thematic Analysis (TA)は、患者インタビューからパターンを抽出するために広く用いられているが、手動TAはスケーラビリティと再現性の課題に直面している。
LLMベースの自動化は役立つが、既存のアプローチは、一般化性に限界があり、分析監査性に欠けるコードブックを生成する。
本稿では,反復的コードブック改良と完全実績追跡を組み合わせた自動TAフレームワークを提案する。
臨床面接, ソーシャルメディア, 公文書を対象とする5つのコーパスで評価し, 6つのベースラインと比較すると, 5つのデータセットのうち4つで最高の合成品質のスコアが得られた。
反復的な改善は、コード再利用可能性の向上と、記述的品質を維持しながら分散一貫性の向上によって、大きな効果サイズを持つ4つのデータセットに対して統計的に有意な改善をもたらす。
2つの臨床コーパス(小児心臓学)では,専門家が注釈を付けたテーマと一致したテーマが生み出された。
関連論文リスト
- Unlocking Electronic Health Records: A Hybrid Graph RAG Approach to Safe Clinical AI for Patient QA [1.9615061725959186]
大規模言語モデルは、データ処理の変換可能性を提供するが、臨床環境では制限に直面している。
現在のソリューションは通常、構造化データ(Text2Cypher)や非構造化セマンティックサーチに焦点を当てた検索方法を分離するが、両方を同時に統合することができない。
この研究は、このギャップを埋める新しいハイブリッドグラフRAGシステムであるMediGRAFを提示する。
論文 参考訳(メタデータ) (2025-11-27T16:08:22Z) - AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文 参考訳(メタデータ) (2025-11-17T13:05:25Z) - Auto-TA: Towards Scalable Automated Thematic Analysis (TA) via Multi-Agent Large Language Models with Reinforcement Learning [3.3212706551453155]
先天性心疾患(CHD: Congenital heart disease)は、従来の臨床指標では示されていない、複雑で寿命の長い課題である。
本稿では,臨床物語のエンド・ツー・エンドのセマンティック分析を行う,完全自動大規模言語モデル(LLM)パイプラインを提案する。
論文 参考訳(メタデータ) (2025-06-30T16:02:28Z) - TAMA: A Human-AI Collaborative Thematic Analysis Framework Using Multi-Agent LLMs for Clinical Interviews [54.35097932763878]
Thematic Analysis (TA) は、構造化されていないテキストデータの潜在意味を明らかにするために広く使われている定性的手法である。
本稿では,多エージェントLEMを用いた人間とAIの協調的テーマ分析フレームワークTAMAを提案する。
TAMA は既存の LLM 支援TA アプローチよりも優れており,高い主題的ヒット率,カバレッジ,独特性を実現している。
論文 参考訳(メタデータ) (2025-03-26T15:58:16Z) - Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework [61.38174427966444]
大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、より広く使われている。
従来の研究では、強力なプロプライエタリモデルの評価と判断を再現するために、オープンソースのLLMを微調整しようと試みてきた。
本稿では,評価基準を適応的に定式化し,テキストベースとコード駆動分析の両方を合成する新しい評価フレームワークARJudgeを提案する。
論文 参考訳(メタデータ) (2025-02-26T06:31:45Z) - Knowledge Hierarchy Guided Biological-Medical Dataset Distillation for Domain LLM Training [10.701353329227722]
学術文献から高品質なテキストトレーニングデータの蒸留を自動化する枠組みを提案する。
われわれのアプローチは、バイオメディカル領域とより密接に一致した質問を自己評価し、生成する。
本手法は,生命科学領域の事前学習モデルと比較して,質問応答タスクを大幅に改善する。
論文 参考訳(メタデータ) (2025-01-25T07:20:44Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。