論文の概要: A Reproducible Framework for Neural Topic Modeling in Focus Group Analysis
- arxiv url: http://arxiv.org/abs/2511.18843v2
- Date: Tue, 02 Dec 2025 16:48:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 14:50:32.034048
- Title: A Reproducible Framework for Neural Topic Modeling in Focus Group Analysis
- Title(参考訳): 焦点群解析におけるニューラルトピックモデリングのための再現可能なフレームワーク
- Authors: Heger Arfaoui, Mohammed Iheb Hergli, Beya Benzina, Slimane BenMiled,
- Abstract要約: チュニジアの10のフォーカスグループから得られたデータを用いて、BERTopicをグループテキストにフォーカスするための体系的なフレームワークを提案する。
ブートストラップ安定性解析、パフォーマンスメトリクス、LDAベースラインとの比較。
分析の結果,変換器をベースとしたトピックモデリングが,小さな焦点群転写コーパスから解釈可能なテーマを抽出できることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Focus group discussions generate rich qualitative data but their analysis traditionally relies on labor-intensive manual coding that limits scalability and reproducibility. We present a systematic framework for applying BERTopic to focus group transcripts using data from ten focus groups exploring HPV vaccine perceptions in Tunisia (1,075 utterances). We conducted comprehensive hyperparameter exploration across 27 configurations, evaluating each through bootstrap stability analysis, performance metrics, and comparison with LDA baseline. Bootstrap analysis revealed that stability metrics (NMI and ARI) exhibited strong disagreement (r = -0.691) and showed divergent relationships with coherence, demonstrating that stability is multifaceted rather than monolithic. Our multi-criteria selection framework yielded a 7-topic model achieving 18\% higher coherence than optimized LDA (0.573 vs. 0.486) with interpretable topics validated through independent human evaluation (ICC = 0.700, weighted Cohen's kappa = 0.678). These findings demonstrate that transformer-based topic modeling can extract interpretable themes from small focus group transcript corpora when systematically configured and validated, while revealing that quality metrics capture distinct, sometimes conflicting constructs requiring multi-criteria evaluation. We provide complete documentation and code to support reproducibility.
- Abstract(参考訳): フォーカスグループの議論は、豊かな質的なデータを生成するが、伝統的にその分析は、スケーラビリティと再現性を制限する労働集約的な手動コーディングに依存している。
チュニジアにおけるHPVワクチンの認識を探索する10の焦点群(1,075発)のデータを用いて,BERTopicを用いてグループ転写に焦点を合わせるための体系的枠組みを提案する。
ブートストラップ安定性解析,性能指標,LDAベースラインとの比較により,27構成の総合的ハイパーパラメータ探索を行った。
ブートストラップ解析により、安定性指標(NMIとARI)は強い不一致(r = -0.691)を示し、コヒーレンスと異なる関係を示し、安定性はモノリシックではなく多面的であることを示した。
提案手法は,LDA(0.573 vs. 0.486)よりも88%高いコヒーレンスを達成し,独立評価(ICC=0.700,重み付きコーエンカッパ=0.678)により解釈可能なトピックを抽出した。
これらの結果から,トランスフォーマーをベースとしたトピックモデリングは,多基準評価を必要とするコンストラクタと矛盾するコンストラクタを区別しつつ,システム構成や検証を行う際に,小さなフォーカスグループ転写コーパスから解釈可能なテーマを抽出できることが示唆された。
再現性をサポートするための完全なドキュメンテーションとコードを提供します。
関連論文リスト
- AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文 参考訳(メタデータ) (2025-11-17T13:05:25Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - An Uncertainty-Aware Dynamic Decision Framework for Progressive Multi-Omics Integration in Classification Tasks [6.736267874971369]
我々は、オミクスデータ分類のための不確実性を考慮したマルチビュー動的決定フレームワークを提案する。
ヘテロジニアスなモジュラリティを統合するために、Dempster-Shafer理論に基づく融合戦略を用いる。
3つのデータセットでは、50%以上のケースが、単一のオミクスモダリティを使用して正確に分類された。
論文 参考訳(メタデータ) (2025-06-20T13:44:14Z) - Contextual Embedding-based Clustering to Identify Topics for Healthcare Service Improvement [3.9726806016869936]
本研究では,米国ウィスコンシン州の医療システムから収集した439件のアンケート結果から,意味のあるトピックを抽出するための教師なし手法について検討した。
キーワードに基づくフィルタリング手法を,ドメイン固有辞書を用いた苦情関連フィードバックの分離に適用した。
データが不足していて、短文からなるコヒーレンスと解釈可能性を改善するため、kBERTを提案する。
論文 参考訳(メタデータ) (2025-04-18T20:38:24Z) - Conformal uncertainty quantification to evaluate predictive fairness of foundation AI model for skin lesion classes across patient demographics [8.692647930497936]
我々は、コンフォメーション解析を用いて、視覚変換器に基づく基礎モデルの予測不確かさを定量化する。
基礎モデルの特徴埋め込みの堅牢性を評価するために、公正度測定としてどのように使用できるかを示す。
論文 参考訳(メタデータ) (2025-03-31T08:06:00Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - An Operational Perspective to Fairness Interventions: Where and How to
Intervene [9.833760837977222]
フェアネス介入の評価と文脈化のための包括的枠組みを提案する。
予測パリティに関するケーススタディで、我々のフレームワークを実証する。
グループデータを使わずに予測パリティを実現することは困難である。
論文 参考訳(メタデータ) (2023-02-03T07:04:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。