論文の概要: INESC-ID @ eRisk 2025: Exploring Fine-Tuned, Similarity-Based, and Prompt-Based Approaches to Depression Symptom Identification
- arxiv url: http://arxiv.org/abs/2506.02924v1
- Date: Tue, 03 Jun 2025 14:25:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.79006
- Title: INESC-ID @ eRisk 2025: Exploring Fine-Tuned, Similarity-Based, and Prompt-Based Approaches to Depression Symptom Identification
- Title(参考訳): INESC-ID @ eRisk 2025: Depression Symptom Identificationのための微調整された類似性に基づくプロンプトに基づくアプローチ
- Authors: Diogo A. P. Nunes, Eugénio Ribeiro,
- Abstract要約: 本稿では,eRiskの2025 Task 1: Search for Symptoms of Depressionについて述べる。
一連の文章が与えられた後、参加者はうつ病の症状に対して最大1000の文章を提出する任務を負った。
訓練データは、ある文章が関連があるか否かというラベル付き文から成っていた。
本研究では,基礎モデルの微調整,文類似性,Large Language Model(LLM)プロンプト,アンサンブル技術について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this work, we describe our team's approach to eRisk's 2025 Task 1: Search for Symptoms of Depression. Given a set of sentences and the Beck's Depression Inventory - II (BDI) questionnaire, participants were tasked with submitting up to 1,000 sentences per depression symptom in the BDI, sorted by relevance. Participant submissions were evaluated according to standard Information Retrieval (IR) metrics, including Average Precision (AP) and R-Precision (R-PREC). The provided training data, however, consisted of sentences labeled as to whether a given sentence was relevant or not w.r.t. one of BDI's symptoms. Due to this labeling limitation, we framed our development as a binary classification task for each BDI symptom, and evaluated accordingly. To that end, we split the available labeled data into training and validation sets, and explored foundation model fine-tuning, sentence similarity, Large Language Model (LLM) prompting, and ensemble techniques. The validation results revealed that fine-tuning foundation models yielded the best performance, particularly when enhanced with synthetic data to mitigate class imbalance. We also observed that the optimal approach varied by symptom. Based on these insights, we devised five independent test runs, two of which used ensemble methods. These runs achieved the highest scores in the official IR evaluation, outperforming submissions from 16 other teams.
- Abstract(参考訳): 本稿では,eRiskの2025 Task 1: Search for Symptoms of Depressionについて述べる。
一連の文章とBeck's Depression Inventory - II (BDI) のアンケートにより、参加者はBDIのうつ病症状に対して最大1000文を提出し、関連性によって分類した。
参加者は、平均精度(AP)やR-PREC(R-PREC)など、標準情報検索(IR)指標に基づいて評価した。
しかし、提供された訓練データは、ある文章がBDIの症状の1つに関連があるかどうかというラベル付き文から成っていた。
このラベリング制限のため,各BDI症状のバイナリ分類タスクとして開発を行い,それに応じて評価を行った。
そのために、利用可能なラベル付きデータをトレーニングと検証セットに分割し、基礎モデルの微調整、文の類似性、大規模言語モデル(LLM)のプロンプト、アンサンブル技術について検討した。
その結果, 微調整基礎モデルが最も優れた性能を示した。
また,症状によって最適なアプローチが変化することが確認された。
これらの知見に基づいて、5つの独立したテスト実行を考案し、そのうち2つはアンサンブルメソッドを使用しました。
これらの試合は公式IR評価で最高点を獲得し、他の16チームよりも成績が高かった。
関連論文リスト
- LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Sentiment Informed Sentence BERT-Ensemble Algorithm for Depression Detection [0.0]
WHOによると、世界で約2億8000万人がうつ病に苦しんでいる。
本稿では,2つのベンチマークソーシャルメディアデータセットを用いた早期抑うつ検出のためのMLアルゴリズムの性能について検討した。
論文 参考訳(メタデータ) (2024-09-07T07:47:55Z) - Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.18828236350544]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文 参考訳(メタデータ) (2024-07-20T12:42:24Z) - DepreSym: A Depression Symptom Annotated Corpus and the Role of LLMs as
Assessors of Psychological Markers [3.5511184956329727]
DepreSym データセットは Beck Depression Inventory-II 症状に関連する21580 文からなる。
このデータセットは、臨床症状などのうつ病マーカーを組み込んだモデルの開発を進めるための貴重なリソースとなる。
論文 参考訳(メタデータ) (2023-08-21T14:44:31Z) - Utilizing ChatGPT Generated Data to Retrieve Depression Symptoms from
Social Media [7.868449549351487]
抑うつ症状の検索におけるeRisk LabタスクにおけるBLUEチームの貢献について述べる。
このタスクは、BDI-IIアンケートからうつ病の症状を伝えるRedditのソーシャルメディア文の検索とランキングから成り立っている。
その結果,意味探索用に設計されたモデルからの文の埋め込みは,メンタルヘルスデータに基づいて事前学習したモデルからの埋め込みよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-07-05T14:15:15Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Depression Symptoms Modelling from Social Media Text: An Active Learning
Approach [1.513693945164213]
初期教師付き学習モデルを用いたアクティブラーニングフレームワークについて述べる。
我々は、大規模な自己計算された抑うつツイートリポジトリからうつ症状に関するサンプルを採取する。
我々は、その種類の中で最大である最終データセットを作成できることを示します。
論文 参考訳(メタデータ) (2022-09-06T18:41:57Z) - Estimating and Improving Fairness with Adversarial Learning [65.99330614802388]
本研究では,深層学習に基づく医療画像解析システムにおけるバイアスの同時緩和と検出を目的としたマルチタスク・トレーニング戦略を提案する。
具体的には,バイアスに対する識別モジュールと,ベース分類モデルにおける不公平性を予測するクリティカルモジュールを追加することを提案する。
大規模で利用可能な皮膚病変データセットのフレームワークを評価します。
論文 参考訳(メタデータ) (2021-03-07T03:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。