論文の概要: A Reproducible Framework for Neural Topic Modeling in Focus Group Analysis
- arxiv url: http://arxiv.org/abs/2511.18843v1
- Date: Mon, 24 Nov 2025 07:30:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:25.081998
- Title: A Reproducible Framework for Neural Topic Modeling in Focus Group Analysis
- Title(参考訳): 焦点群解析におけるニューラルトピックモデリングのための再現可能なフレームワーク
- Authors: Heger Arfaoui, Mohammed Iheb Hergli, Beya Benzina, Slimane BenMiled,
- Abstract要約: ニューラルトピックモデリングを適用してグループ転写に焦点を合わせるための、厳密で再現可能なフレームワークを提案する。
チュニジアにおけるHPVワクチンの認識を探索する10の焦点群(1,076発)にBERTopicを適用し,系統的評価を行った。
我々のフレームワークは、研究者が自身の質的な研究状況に適応できる実践的なガイドラインを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Focus group discussions generate rich qualitative data but their analysis traditionally relies on labor-intensive manual coding that limits scalability and reproducibility. We present a rigorous, reproducible computational framework for applying neural topic modeling to focus group transcripts, addressing fundamental methodological challenges: hyperparameter sensitivity, model stability, and validation of interpretability. Using BERTopic applied to ten focus groups exploring HPV vaccine perceptions in Tunisia (1,076 utterances), we conducted systematic evaluation across 27 hyperparameter configurations, assessed stability through bootstrap resampling with 30 replicates per configuration, and validated interpretability through formal human evaluation by three domain experts. Our analysis demonstrates substantial sensitivity to hyperparameter choices and reveals that metric selection for stability assessment must align with analytical goals. A hierarchical merging strategy (extracting fine-grained topics for stability then consolidating for interpretability) effectively navigates the stability-coherence tradeoff, achieving coherence of 0.558 compared to 0.539 for direct extraction. Human validation confirmed topic quality with very good inter-rater reliability (ICC = 0.79, weighted Cohen's kappa = 0.578). Our framework provides practical guidelines that researchers can adapt to their own qualitative research contexts. All code, data processing scripts, and evaluation protocols are publicly available to support reproduction and extension of this work.
- Abstract(参考訳): フォーカスグループの議論は、豊かな質的なデータを生成するが、伝統的にその分析は、スケーラビリティと再現性を制限する労働集約的な手動コーディングに依存している。
本稿では,高パラメータ感度,モデル安定性,解釈可能性の検証といった基本的な方法論的課題に対処し,グループ転写に神経トピックモデリングを適用するための厳密で再現可能な計算フレームワークを提案する。
BERTopicはチュニジアにおけるHPVワクチンの認識を探索する10の焦点群に適用し(1,076発)、27のハイパーパラメータ構成の体系的評価、ブートストラップリサンプリングによる安定性の評価、30個のレプリケーションによる安定性の評価、および3つのドメインの専門家による正式な人的評価による解釈可能性の評価を行った。
本分析により, パラメータ選択に対する感度が著しく向上し, 安定度評価のためのメートル法選択が解析目標と整合していることが明らかとなった。
階層的なマージ戦略(安定性のためのきめ細かいトピックを抽出し、解釈可能性のために統合)は、安定性コヒーレンストレードオフを効果的にナビゲートし、直接抽出の0.539に比べて0.558のコヒーレンスを達成する。
人間の検証は、非常に良好なラター間信頼性(ICC = 0.79、重み付きコーエンのカッパ = 0.578)でトピックの品質を確認した。
我々のフレームワークは、研究者が自身の質的な研究状況に適応できる実践的なガイドラインを提供する。
すべてのコード、データ処理スクリプト、評価プロトコルが公開されており、この作業の再現と拡張をサポートする。
関連論文リスト
- AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文 参考訳(メタデータ) (2025-11-17T13:05:25Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - An Uncertainty-Aware Dynamic Decision Framework for Progressive Multi-Omics Integration in Classification Tasks [6.736267874971369]
我々は、オミクスデータ分類のための不確実性を考慮したマルチビュー動的決定フレームワークを提案する。
ヘテロジニアスなモジュラリティを統合するために、Dempster-Shafer理論に基づく融合戦略を用いる。
3つのデータセットでは、50%以上のケースが、単一のオミクスモダリティを使用して正確に分類された。
論文 参考訳(メタデータ) (2025-06-20T13:44:14Z) - Contextual Embedding-based Clustering to Identify Topics for Healthcare Service Improvement [3.9726806016869936]
本研究では,米国ウィスコンシン州の医療システムから収集した439件のアンケート結果から,意味のあるトピックを抽出するための教師なし手法について検討した。
キーワードに基づくフィルタリング手法を,ドメイン固有辞書を用いた苦情関連フィードバックの分離に適用した。
データが不足していて、短文からなるコヒーレンスと解釈可能性を改善するため、kBERTを提案する。
論文 参考訳(メタデータ) (2025-04-18T20:38:24Z) - Conformal uncertainty quantification to evaluate predictive fairness of foundation AI model for skin lesion classes across patient demographics [8.692647930497936]
我々は、コンフォメーション解析を用いて、視覚変換器に基づく基礎モデルの予測不確かさを定量化する。
基礎モデルの特徴埋め込みの堅牢性を評価するために、公正度測定としてどのように使用できるかを示す。
論文 参考訳(メタデータ) (2025-03-31T08:06:00Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - An Operational Perspective to Fairness Interventions: Where and How to
Intervene [9.833760837977222]
フェアネス介入の評価と文脈化のための包括的枠組みを提案する。
予測パリティに関するケーススタディで、我々のフレームワークを実証する。
グループデータを使わずに予測パリティを実現することは困難である。
論文 参考訳(メタデータ) (2023-02-03T07:04:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。