論文の概要: Utilizing ChatGPT Generated Data to Retrieve Depression Symptoms from
Social Media
- arxiv url: http://arxiv.org/abs/2307.02313v1
- Date: Wed, 5 Jul 2023 14:15:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 13:24:43.639400
- Title: Utilizing ChatGPT Generated Data to Retrieve Depression Symptoms from
Social Media
- Title(参考訳): ChatGPT生成データを用いたソーシャルメディアからの抑うつ症状の検索
- Authors: Ana-Maria Bucur
- Abstract要約: 抑うつ症状の検索におけるeRisk LabタスクにおけるBLUEチームの貢献について述べる。
このタスクは、BDI-IIアンケートからうつ病の症状を伝えるRedditのソーシャルメディア文の検索とランキングから成り立っている。
- 参考スコア(独自算出の注目度): 7.868449549351487
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this work, we present the contribution of the BLUE team in the eRisk Lab
task on searching for symptoms of depression. The task consists of retrieving
and ranking Reddit social media sentences that convey symptoms of depression
from the BDI-II questionnaire. Given that synthetic data provided by LLMs have
been proven to be a reliable method for augmenting data and fine-tuning
downstream models, we chose to generate synthetic data using ChatGPT for each
of the symptoms of the BDI-II questionnaire. We designed a prompt such that the
generated data contains more richness and semantic diversity than the BDI-II
responses for each question and, at the same time, contains emotional and
anecdotal experiences that are specific to the more intimate way of sharing
experiences on Reddit. We perform semantic search and rank the sentences'
relevance to the BDI-II symptoms by cosine similarity. We used two
state-of-the-art transformer-based models for embedding the social media posts,
the original and generated responses of the BDI-II, MentalRoBERTa and a variant
of MPNet. Our results show that an approach using for sentence embeddings a
model that is designed for semantic search outperforms the model pre-trained on
mental health data. Furthermore, the generated synthetic data were proved too
specific for this task, the approach simply relying on the BDI-II responses had
the best performance.
- Abstract(参考訳): 本稿では,抑うつ症状の検索におけるeRisk LabタスクにおけるBLUEチームの貢献について述べる。
このタスクは、BDI-IIアンケートからうつ病の症状を伝えるRedditのソーシャルメディア文の検索とランキングから成り立っている。
llmsが提供した合成データがデータ拡張と下流モデルの微調整の信頼できる方法であることが証明されていることから,bdi-iiアンケートの症状ごとにchatgptを用いて合成データを生成する方法を選択した。
生成したデータは各質問に対するBDI-II応答よりもリッチでセマンティックな多様性を含み、同時にReddit上でのより親密な体験共有に特有な感情的・逸話的体験を含むようにプロンプトを設計した。
意味探索を行い,コサイン類似性により文のBDI-II症状との関連をランク付けする。
BDI-II, MentalRoBERTa, MPNetの2種類のトランスフォーマーモデルを用いて,ソーシャルメディア投稿の埋め込み, BDI-II, MentalRoBERTaのオリジナルおよび生成された応答, およびMPNetの変種について検討した。
本研究は, 意味探索のためのモデルとして, 文章埋め込みを用いた手法が, 精神保健データに基づいて事前学習されたモデルより優れていることを示す。
さらに、生成した合成データは、このタスクにあまり具体的でないことが証明され、bdi-ii応答に依存するアプローチが最良の性能を示した。
関連論文リスト
- Sentiment Informed Sentence BERT-Ensemble Algorithm for Depression Detection [0.0]
WHOによると、世界で約2億8000万人がうつ病に苦しんでいる。
本稿では,2つのベンチマークソーシャルメディアデータセットを用いた早期抑うつ検出のためのMLアルゴリズムの性能について検討した。
論文 参考訳(メタデータ) (2024-09-07T07:47:55Z) - Enhancing Depressive Post Detection in Bangla: A Comparative Study of TF-IDF, BERT and FastText Embeddings [0.0]
本研究は,バングラにおける抑うつ的なソーシャルメディア投稿を識別する手法を提案する。
ドメインの専門家によって注釈付けされたこの研究で使用されるデータセットには、抑うつ的ポストと非抑うつ的ポストの両方が含まれている。
クラス不均衡の問題に対処するために,マイノリティクラスに対するランダムなオーバーサンプリングを利用した。
論文 参考訳(メタデータ) (2024-07-12T11:40:17Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - On Synthetic Data for Back Translation [66.6342561585953]
逆翻訳(BT)はNTT研究分野において最も重要な技術の一つである。
バックトランスレーションNMTの性能を制御する合成データには,品質と重要性の2つの重要な要素を同定する。
そこで本研究では,BTの性能向上のために,両因子のトレードオフを改善するため,合成データを生成するための簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-10-20T17:24:12Z) - KESDT: knowledge enhanced shallow and deep Transformer for detecting
adverse drug reactions [14.095117843726511]
本稿では,ADR検出のための知識強調シャロー・ディープトランスフォーマ(KESDT)モデルを提案する。
最初の問題に対処するため、浅い融合方式でトランスフォーマーモデルにドメインキーワードを組み込む。
低アノテートデータを克服するため、深層融合方式でトランスフォーマーモデルに同義集合を統合する。
論文 参考訳(メタデータ) (2023-08-18T06:10:11Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Synthetic Misinformers: Generating and Combating Multimodal
Misinformation [11.696058634552147]
マルチモーダル誤情報検出(MMD)は、画像と付随するテキストの組み合わせが誤読や誤字を検知する。
提案したCLIPベースの名前付きエンティティスワッピングは,マルチモーダル精度で他のOOCやNEIミスコンバータを上回り,MDDモデルに繋がることを示す。
論文 参考訳(メタデータ) (2023-03-02T12:59:01Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Depression Symptoms Modelling from Social Media Text: An Active Learning
Approach [1.513693945164213]
初期教師付き学習モデルを用いたアクティブラーニングフレームワークについて述べる。
我々は、大規模な自己計算された抑うつツイートリポジトリからうつ症状に関するサンプルを採取する。
我々は、その種類の中で最大である最終データセットを作成できることを示します。
論文 参考訳(メタデータ) (2022-09-06T18:41:57Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。