論文の概要: Finetuning Large Language Models for Automated Depression Screening in Nigerian Pidgin English: GENSCORE Pilot Study
- arxiv url: http://arxiv.org/abs/2601.00004v1
- Date: Fri, 28 Nov 2025 19:13:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.466603
- Title: Finetuning Large Language Models for Automated Depression Screening in Nigerian Pidgin English: GENSCORE Pilot Study
- Title(参考訳): ナイジェリアのピジン英語における自動抑うつスクリーニングのための大規模言語モデル:GENSCOREパイロットスタディ
- Authors: Isaac Iyinoluwa Olufadewa, Miracle Ayomikun Adesina, Ezekiel Ayodeji Oladejo, Uthman Babatunde Usman, Owen Kolade Adeniyi, Matthew Tolulope Olawoyin,
- Abstract要約: うつ病はナイジェリアのメンタルヘルスの重荷に大きく貢献している。
高所得国で患者健康質問紙9(PHQ-9)のような伝統的なツールが検証された。
本研究では,対話型ナイジェリア語ピジンに適応した細調整大言語モデル(LLM)を用いた自動スクリーニング手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Depression is a major contributor to the mental-health burden in Nigeria, yet screening coverage remains limited due to low access to clinicians, stigma, and language barriers. Traditional tools like the Patient Health Questionnaire-9 (PHQ-9) were validated in high-income countries but may be linguistically or culturally inaccessible for low- and middle-income countries and communities such as Nigeria where people communicate in Nigerian Pidgin and more than 520 local languages. This study presents a novel approach to automated depression screening using fine-tuned large language models (LLMs) adapted for conversational Nigerian Pidgin. We collected a dataset of 432 Pidgin-language audio responses from Nigerian young adults aged 18-40 to prompts assessing psychological experiences aligned with PHQ-9 items, performed transcription, rigorous preprocessing and annotation, including semantic labeling, slang and idiom interpretation, and PHQ-9 severity scoring. Three LLMs - Phi-3-mini-4k-instruct, Gemma-3-4B-it, and GPT-4.1 - were fine-tuned on this annotated dataset, and their performance was evaluated quantitatively (accuracy, precision and semantic alignment) and qualitatively (clarity, relevance, and cultural appropriateness). GPT-4.1 achieved the highest quantitative performance, with 94.5% accuracy in PHQ-9 severity scoring prediction, outperforming Gemma-3-4B-it and Phi-3-mini-4k-instruct. Qualitatively, GPT-4.1 also produced the most culturally appropriate, clear, and contextually relevant responses. AI-mediated depression screening for underserved Nigerian communities. This work provides a foundation for deploying conversational mental-health tools in linguistically diverse, resource-constrained environments.
- Abstract(参考訳): 抑うつはナイジェリアのメンタルヘルスの重荷に大きく貢献するが、臨床医、スティグマ、言語障壁へのアクセスが低いため、検査範囲は限られている。
患者健康アンケート9(PHQ-9)のような伝統的なツールが高所得国で検証されたが、低所得国や中所得国やナイジェリアなどの地域社会では言語的にも文化的にもアクセスできない。
本研究では,ナイジェリア語ピジン語に適応した微調整大言語モデル(LLM)を用いた自動抑うつスクリーニング手法を提案する。
ナイジェリアの18~40歳の若者の432人のピジン語音声応答のデータセットを収集し、PHQ-9項目に沿った心理的体験の評価、転写、厳密な前処理、アノテーションの実行、セマンティックラベリング、スラング、イディオムの解釈、PHQ-9の重症度評価を行った。
3つのLCM(Phi-3-mini-4k-instruct, Gemma-3-4B-it, GPT-4.1)をこの注釈付きデータセットに微調整し、その性能を定量的に(精度、精度、セマンティックアライメント)、質的に(明確性、妥当性、文化的適切性)評価した。
GPT-4.1はPHQ-9の精度94.5%、Gemma-3-4B-itとPhi-3-mini-4k-instructを上回った。
質的にも、GPT-4.1は最も文化的に適切で、明確で、文脈的に関係のある応答を生み出した。
ナイジェリアの過少な地域社会に対するAIによる抑うつスクリーニング
この研究は、言語的に多様でリソースに制約のある環境で、会話型のメンタルヘルスツールをデプロイするための基盤を提供する。
関連論文リスト
- Ibom NLP: A Step Toward Inclusive Natural Language Processing for Nigeria's Minority Languages [5.5078606217036965]
ナイジェリアはアフリカで最も人口の多い国であり、人口は2億人を超えている。
ナイジェリアでは500以上の言語が話されており、世界で最も言語的に多様である。
それにもかかわらず、自然言語処理(NLP)の研究は主に、Hausa、Igbo、ナイジェリア・ピジン、Yorubaの4つの言語に焦点を当てている。
論文 参考訳(メタデータ) (2025-11-09T20:33:39Z) - Development and Evaluation of HopeBot: an LLM-based chatbot for structured and interactive PHQ-9 depression screening [48.355615275247786]
HopeBotは、PHQ-9(Patent Health Questionnaire-9)を検索強化世代とリアルタイムの明確化を用いて管理する。
内部調査では、英国と中国の132人の成人が、自己管理版とチャットボット版の両方を完成させた。
全体の87.1%は、ホープボットの再利用や推奨を表明している。
論文 参考訳(メタデータ) (2025-07-08T13:41:22Z) - A Comprehensive Evaluation of Large Language Models on Mental Illnesses in Arabic Context [0.9074663948713616]
メンタルヘルス障害はアラブ世界で公衆衛生の懸念が高まっている。
本研究は,多様なメンタルヘルスデータセットに基づいて,8つの大言語モデル(LLM)を包括的に評価する。
論文 参考訳(メタデータ) (2025-01-12T16:17:25Z) - Evaluating the Effectiveness of the Foundational Models for Q&A Classification in Mental Health care [0.18416014644193068]
プレトレーニング言語モデル(PLM)は、メンタルヘルスを変革する可能性がある。
本研究は,精神保健領域における質問紙と回答紙の分類におけるPLMの有効性を評価するものである。
論文 参考訳(メタデータ) (2024-06-23T00:11:07Z) - Rapidly Developing High-quality Instruction Data and Evaluation
Benchmark for Large Language Models with Minimal Human Effort: A Case Study
on Japanese [36.3163608701382]
GPT-4に基づく効率的な自己指示法を提案する。
まず、少量の英語の指示を日本語に翻訳し、それを後編集して、ネイティブレベルの品質を得る。
GPT-4はそれらをデモとして利用し、日本語の命令データを自動的に生成する。
論文 参考訳(メタデータ) (2024-03-06T13:17:07Z) - "Knowing When You Don't Know": A Multilingual Relevance Assessment Dataset for Robust Retrieval-Augmented Generation [90.09260023184932]
Retrieval-Augmented Generation (RAG) は、外部の知識源を活用して、事実の幻覚を減らすことで、Large Language Model (LLM) を出力する。
NoMIRACLは18言語にまたがるRAGにおけるLDM堅牢性を評価するための人為的アノテーション付きデータセットである。
本研究は,<i>Halucination rate</i>,<i>Halucination rate</i>,<i>Halucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sr。
論文 参考訳(メタデータ) (2023-12-18T17:18:04Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - Large Language Models Leverage External Knowledge to Extend Clinical
Insight Beyond Language Boundaries [48.48630043740588]
ChatGPTやMed-PaLMのような大規模言語モデル(LLM)は、様々な質問応答タスクに優れています。
我々は,その性能を高めるために,新しい文脈内学習フレームワークを開発した。
論文 参考訳(メタデータ) (2023-05-17T12:31:26Z) - Towards End-to-End Training of Automatic Speech Recognition for Nigerian Pidgin [1.099532646524593]
本稿ではナイジェリアのピジン英語向けにカスタマイズされたエンドツーエンド音声認識システムの開発に焦点をあてる。
我々は,新しいデータセットを用いて,事前訓練された最先端アーキテクチャについて検討・評価を行った。
このアーキテクチャをデータセットで表現されたニュアンスに適応することにより、エラーを59.84%削減する。
論文 参考訳(メタデータ) (2020-10-21T16:32:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。