Fugu-MT 論文翻訳(概要): Evaluating the Efficacy of Supervised Learning vs Large Language Models for Identifying Cognitive Distortions and Suicidal Risks in Chinese Social Media

論文の概要: Evaluating the Efficacy of Supervised Learning vs Large Language Models for Identifying Cognitive Distortions and Suicidal Risks in Chinese Social Media

arxiv url: http://arxiv.org/abs/2309.03564v1
Date: Thu, 7 Sep 2023 08:50:46 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-08 13:49:47.093549
Title: Evaluating the Efficacy of Supervised Learning vs Large Language Models for Identifying Cognitive Distortions and Suicidal Risks in Chinese Social Media
Title（参考訳）: 中国のソーシャルメディアにおける認知的歪みと自殺リスクの同定における教師付き学習と大言語モデルの効果評価
Authors: Hongzhi Qi, Qing Zhao, Changwei Song, Wei Zhai, Dan Luo, Shuo Liu, Yi Jing Yu, Fan Wang, Huijing Zou, Bing Xiang Yang, Jianqiang Li and Guanghui Fu
Abstract要約: 教師付き学習をベースラインとして,ゼロショット,少数ショット,微調整という3つの戦略を用いて,大規模言語モデルの有効性を検証・比較した。その結果,大規模言語モデルと従来の教師あり学習手法との違いが明らかとなった。本研究は,心理学分野における大規模言語モデルの利用の前方的および変容的含意について述べる。
参考スコア（独自算出の注目度）: 24.130206803192635
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models, particularly those akin to the rapidly progressing GPT series, are gaining traction for their expansive influence. While there is keen interest in their applicability within medical domains such as psychology, tangible explorations on real-world data remain scant. Concurrently, users on social media platforms are increasingly vocalizing personal sentiments; under specific thematic umbrellas, these sentiments often manifest as negative emotions, sometimes escalating to suicidal inclinations. Timely discernment of such cognitive distortions and suicidal risks is crucial to effectively intervene and potentially avert dire circumstances. Our study ventured into this realm by experimenting on two pivotal tasks: suicidal risk and cognitive distortion identification on Chinese social media platforms. Using supervised learning as a baseline, we examined and contrasted the efficacy of large language models via three distinct strategies: zero-shot, few-shot, and fine-tuning. Our findings revealed a discernible performance gap between the large language models and traditional supervised learning approaches, primarily attributed to the models' inability to fully grasp subtle categories. Notably, while GPT-4 outperforms its counterparts in multiple scenarios, GPT-3.5 shows significant enhancement in suicide risk classification after fine-tuning. To our knowledge, this investigation stands as the maiden attempt at gauging large language models on Chinese social media tasks. This study underscores the forward-looking and transformative implications of using large language models in the field of psychology. It lays the groundwork for future applications in psychological research and practice.
Abstract（参考訳）: 大規模言語モデル、特に急速に進歩しているGPTシリーズに類似したモデルは、その拡大した影響で勢いを増している。心理学のような医学領域での利用性には強い関心があるが、実世界のデータに関する具体的な調査はまだ少ない。特定のテーマの傘の下では、これらの感情はしばしば否定的な感情として現れ、時には自殺的な傾向へとエスカレートする。このような認知的歪みや自殺リスクのタイムリーな識別は、効果的に介入し、危険な状況を避けるために重要である。本研究は,中国のソーシャルメディアプラットフォーム上での自殺リスクと認知歪みの識別という,2つの重要な課題を実験することによって,この領域を開拓した。教師付き学習をベースラインとして,ゼロショット,少数ショット,微調整の3つの戦略を用いて,大規模言語モデルの有効性を検討した。以上の結果から,大規模言語モデルと従来の教師付き学習手法では,微妙なカテゴリーを完全に把握できないため,明確な性能差が認められた。特に、GPT-4は複数のシナリオで比較した場合、GPT-3.5は微調整後の自殺リスク分類の大幅な向上を示す。私たちの知る限りでは、この調査は中国のソーシャルメディアタスクで大規模な言語モデルを調べる最初の試みだ。本研究は,心理学分野における大規模言語モデルの利用の前方的および変容的含意を明らかにする。心理学研究と実践における将来の応用の土台となる。

関連論文リスト

A Gold Standard Dataset and Evaluation Framework for Depression Detection and Explanation in Social Media using LLMs [0.0]
オンラインソーシャルメディア投稿からうつ病の早期発見は、タイムリーなメンタルヘルス介入を提供するという約束を掲げている。抑うつ的スパンをラベル付けした1017のソーシャルメディア投稿を,12の抑うつ症状カテゴリにマッピングし,高品質で専門家による注釈付きデータセットを提示する。
論文参考訳（メタデータ） (2025-07-26T10:01:55Z)
Beyond Scale: Small Language Models are Comparable to GPT-4 in Mental Health Understanding [12.703061322251093]
Small Language Models (SLM) は、Large Language Models (LLM) のプライバシ保護代替品である。本稿では,現在SLMのメンタルヘルス理解能力について,分類タスクの体系的評価を通じて検討する。我々の研究は、メンタルヘルス理解におけるSLMの可能性を強調し、センシティブなオンラインテキストデータを分析するための効果的なプライバシー保護ツールであることを示す。
論文参考訳（メタデータ） (2025-07-09T02:40:02Z)
If an LLM Were a Character, Would It Know Its Own Story? Evaluating Lifelong Learning in LLMs [55.8331366739144]
大規模言語モデル(LLM)における生涯学習評価のためのベンチマークであるLIFESTATE-BENCHを紹介する。我々の事実チェック評価は、パラメトリックと非パラメトリックの両方のアプローチで、モデルの自己認識、エピソードメモリ検索、関係追跡を探索する。
論文参考訳（メタデータ） (2025-03-30T16:50:57Z)
Extremely Simple Out-of-distribution Detection for Audio-visual Generalized Zero-shot Learning [84.02184773383732]
ゼロショット学習は、補助カテゴリー情報を探ることで、見知らぬクラスから見つからないクラスへの知識伝達を可能にする。本稿では,AV-GZSL法(EZ-AVOOD)を応用し,バイアス問題を緩和する極めて単純なアウト・オブ・ディストリビューション(OOD)検出手法を提案する。既存の最先端手法と比較して、我々のモデルは3つのオーディオ視覚データセット上でのZSLとGZSLの性能に優れていた。
論文参考訳（メタデータ） (2025-03-28T07:28:56Z)
Erasing Without Remembering: Implicit Knowledge Forgetting in Large Language Models [70.78205685001168]
我々は,その一般化に着目して,大規模言語モデルにおける知識の忘れについて検討する。 UGBenchは、スコープ内暗黙の知識の未学習を評価するために特別に設計された最初のベンチマークである。確率に基づく新しいアンラーニングパラダイムであるPerMUを提案する。
論文参考訳（メタデータ） (2025-02-27T11:03:33Z)
Human Cognitive Benchmarks Reveal Foundational Visual Gaps in MLLMs [65.93003087656754]
VisFactorは、よく確立された認知心理学評価から20の視覚中心のサブテストをデジタル化するベンチマークである。 GPT、Gemini、Claude、LLaMA、Qwen、SEEDファミリーから20のフロンティアマルチモーダル言語モデル(MLLM)を評価する。最高のパフォーマンスモデルは100点中25.19点のスコアしか得られず、精神的な回転、空間的関係推論、図形の識別といったタスクに一貫して失敗する。
論文参考訳（メタデータ） (2025-02-23T04:21:32Z)
Decoupling the Class Label and the Target Concept in Machine Unlearning [81.69857244976123]
機械学習の目的は、トレーニングデータの一部を除外した再トレーニングされたモデルを近似するために、トレーニングされたモデルを調整することだ。過去の研究では、クラスワイド・アンラーニングが対象クラスの知識を忘れることに成功していることが示された。我々は、TARget-aware Forgetting (TARF) という一般的なフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-12T14:53:30Z)
ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。 BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文参考訳（メタデータ） (2024-04-30T17:06:20Z)
SOS-1K: A Fine-grained Suicide Risk Classification Dataset for Chinese Social Media Analysis [22.709733830774788]
本研究では,自殺リスクの詳細な分類を目的とした,中国のソーシャルメディアデータセットを提案する。事前訓練した7つのモデルについて, 自殺リスクが高い, 自殺リスクが少ない, 自殺リスクの細かい分類が0～10の2つのタスクで評価された。ディープラーニングモデルは高い自殺リスクと低い自殺リスクを区別する上で優れた性能を示し、最良のモデルはF1スコア88.39%である。
論文参考訳（メタデータ） (2024-04-19T06:58:51Z)
AI-Enhanced Cognitive Behavioral Therapy: Deep Learning and Large Language Models for Extracting Cognitive Pathways from Social Media Texts [27.240795549935463]
ソーシャルメディアからデータを収集し,認知経路抽出の課題を確立した。我々は、精神療法士が重要な情報を素早く把握できるよう、テキスト要約タスクを構築した。本研究では,ディープラーニングモデルと大規模言語モデルの性能評価を行った。
論文参考訳（メタデータ） (2024-04-17T14:55:27Z)
Enhancing Uncertainty-Based Hallucination Detection with Stronger Focus [99.33091772494751]
大規模言語モデル(LLM)は、様々な分野にわたる印象的なパフォーマンスで大きな人気を集めている。 LLMは、ユーザの期待を満たさない非現実的あるいは非感覚的なアウトプットを幻覚させる傾向がある。 LLMにおける幻覚を検出するための新しい基準のない不確実性に基づく手法を提案する。
論文参考訳（メタデータ） (2023-11-22T08:39:17Z)
Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。 CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文参考訳（メタデータ） (2023-06-01T12:53:10Z)
Evaluation of ChatGPT for NLP-based Mental Health Applications [0.0]
大規模言語モデル(LLM)は、いくつかの自然言語理解タスクで成功している。本研究では,3つのテキストベースのメンタルヘルス分類タスクにおけるLCMベースのChatGPTの性能について報告する。
論文参考訳（メタデータ） (2023-03-28T04:47:43Z)
A Quantitative and Qualitative Analysis of Suicide Ideation Detection using Deep Learning [5.192118773220605]
本稿では,競合するソーシャルメディアによる自殺検知・予測モデルを再現した。複数のデータセットと異なる最先端ディープラーニングモデルを用いて自殺思考の検出の可能性を検討した。
論文参考訳（メタデータ） (2022-06-17T10:23:37Z)
Detecting Potentially Harmful and Protective Suicide-related Content on Twitter: A Machine Learning Approach [0.1582078748632554]
我々は大量のTwitterデータを自動ラベル付けするために機械学習手法を適用した。 2つのディープラーニングモデルが2つの分類タスクで最高のパフォーマンスを達成した。本研究は, 各種ソーシャルメディアコンテンツが自殺率, ヘルプ・サーキング行動に与える影響について, 今後の大規模調査を可能にするものである。
論文参考訳（メタデータ） (2021-12-09T09:35:48Z)
LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。この技術的レポートは、課題のハイライトを要約している。
論文参考訳（メタデータ） (2020-10-17T13:06:12Z)
Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文参考訳（メタデータ） (2020-08-08T03:02:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。