Fugu-MT 論文翻訳(概要): Mental Disorder Classification via Temporal Representation of Text

論文の概要: Mental Disorder Classification via Temporal Representation of Text

arxiv url: http://arxiv.org/abs/2406.15470v2
Date: Sun, 06 Oct 2024 06:27:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 08:34:07.988889
Title: Mental Disorder Classification via Temporal Representation of Text
Title（参考訳）: テキストの時間表現による精神障害分類
Authors: Raja Kumar, Kishan Maharaj, Ashita Saxena, Pushpak Bhattacharyya,
Abstract要約: ソーシャルメディア投稿からの精神障害予測は、逐次テキストデータの複雑さのために困難である。本稿では,時系列に順序付けられたソーシャルメディア投稿を一連の数に圧縮する新しいフレームワークを提案する。我々は、現在のSOTAを3つの異なる精神条件で上回ることで、フレームワークの一般化能力を実証する。
参考スコア（独自算出の注目度）: 33.47304614659701
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Mental disorders pose a global challenge, aggravated by the shortage of qualified mental health professionals. Mental disorder prediction from social media posts by current LLMs is challenging due to the complexities of sequential text data and the limited context length of language models. Current language model-based approaches split a single data instance into multiple chunks to compensate for limited context size. The predictive model is then applied to each chunk individually, and the most voted output is selected as the final prediction. This results in the loss of inter-post dependencies and important time variant information, leading to poor performance. We propose a novel framework which first compresses the large sequence of chronologically ordered social media posts into a series of numbers. We then use this time variant representation for mental disorder classification. We demonstrate the generalization capabilities of our framework by outperforming the current SOTA in three different mental conditions: depression, self-harm, and anorexia, with an absolute improvement of 5% in the F1 score. We investigate the situation where current data instances fall within the context length of language models and present empirical results highlighting the importance of temporal properties of textual data. Furthermore, we utilize the proposed framework for a cross-domain study, exploring commonalities across disorders and the possibility of inter-domain data usage.
Abstract（参考訳）: メンタル障害は、資格のあるメンタルヘルス専門家の不足によって増大する、世界的な課題を引き起こす。現在のLCMによるソーシャルメディア投稿からの精神障害予測は、逐次テキストデータの複雑さと言語モデルの限られた文脈長のために困難である。現在の言語モデルベースのアプローチでは、単一のデータインスタンスを複数のチャンクに分割し、限られたコンテキストサイズを補う。次に、予測モデルを各チャンクに個別に適用し、最も投票率の高い出力を最終予測として選択する。これにより、ポスト間の依存関係が失われ、重要な時間変更情報が失われ、パフォーマンスが低下する。本稿では,時系列に順序付けられたソーシャルメディア投稿を一連の数に圧縮する新しいフレームワークを提案する。次に、この時間変化表現を精神障害分類に使用します。我々は,うつ病,自傷病,食欲不振の3つの精神状態において,現在のSOTAよりも優れ,F1スコアの5%を絶対的に向上させることで,フレームワークの一般化能力を実証した。本研究では,現在のデータインスタンスが言語モデルの文脈長内に収まる状況について検討し,テキストデータの時間的特性の重要性を明らかにする実験結果を示す。さらに、提案したフレームワークをドメイン横断研究に利用し、障害間の共通点とドメイン間データ利用の可能性を探る。

関連論文リスト

TopiCLEAR: Topic extraction by CLustering Embeddings with Adaptive dimensional Reduction [0.0]
TopiCLEAR: 適応次元還元による埋め込みのクラスタリングによるトピック抽出について述べる。我々は、20News、AgNewsTitle、Reddit、TweetTopicの4つの多様なデータセットに対するアプローチを評価した。本手法はより解釈可能なトピックを生成し,ソーシャルメディアデータやWebコンテンツ分析への応用の可能性を強調した。
論文参考訳（メタデータ） (2025-12-07T07:01:28Z)
MindSET: Advancing Mental Health Benchmarking through Large-Scale Social Media Data [29.110680511845327]
Reddit から収集した新たなベンチマークデータセット textbfMindSET について報告する。注釈付きデータセットには、以前のベンチマークの2倍以上の大きさの7つのメンタルヘルス条件にわたる textbf13M アノテーション付きポストが含まれている。
論文参考訳（メタデータ） (2025-11-14T16:06:04Z)
Early Detection of Mental Health Issues Using Social Media Posts [0.0]
Redditのようなソーシャルメディアプラットフォームは、ユーザー生成コンテンツの豊富なソースを表している。メンタルヘルス危機の早期発見に言語的特徴と時間的特徴を統合したマルチモーダルディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-06T23:08:08Z)
Dementia Insights: A Context-Based MultiModal Approach [0.3749861135832073]
早期発見は、病気の進行を遅らせる可能性のあるタイムリーな介入に不可欠である。テキストと音声のための大規模事前学習モデル(LPM)は、認知障害の識別において有望であることを示している。本研究は,テキストデータと音声データを最高の性能のLPMを用いて統合する,コンテキストベースのマルチモーダル手法を提案する。
論文参考訳（メタデータ） (2025-03-03T06:46:26Z)
PICASO: Permutation-Invariant Context Composition with State Space Models [98.91198288025117]
State Space Models (SSM) は、コンテキストのデータベースを固定次元の状態にマッピング可能にすることで、有望なソリューションを提供する。本研究では,SSM力学から導かれる単純な数学的関係を,生のコンテキストトークンの連結効果を効率的に近似する複数の状態に構成する。我々は,WikiText と MSMARCO をゼロショットと微調整の両方で評価し,平均5.4倍のスピードアップを楽しみながら最強の演奏ベースラインと一致できることを示す。
論文参考訳（メタデータ） (2025-02-24T19:48:00Z)
Unlocking Multimodal Integration in EHRs: A Prompt Learning Framework for Language and Time Series Fusion [27.70300880284899]
大規模言語モデル(LLM)は、視覚言語タスクにおいて顕著な性能を示してきたが、医療分野におけるそれらの応用はいまだ研究されていない。 ProMedTSは、データ型を統一するために、プロンプト誘導学習を利用する、新しい自己教師型マルチモーダルフレームワークである。実世界のデータセットを用いた診断タスクにおけるProMedTSの評価を行い,本手法が常に最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2025-02-19T07:56:48Z)
A BERT-Based Summarization approach for depression detection [1.7363112470483526]
うつ病は世界中で流行する精神疾患であり、対処されないと深刻な反感を引き起こす可能性がある。機械学習と人工知能は、さまざまなデータソースからのうつ病指標を自律的に検出することができる。本研究では,入力テキストの長さと複雑さを低減させる前処理手法として,テキスト要約を提案する。
論文参考訳（メタデータ） (2024-09-13T02:14:34Z)
Improving Sampling Methods for Fine-tuning SentenceBERT in Text Streams [49.3179290313959]
本研究では,選択的な微調整言語モデルの設計した7つのテキストサンプリング手法の有効性について検討した。これらの手法がSBERTモデルの微調整に与える影響を, 4つの異なる損失関数を用いて正確に評価する。その結果,テキストストリームの分類にはソフトマックスの損失とバッチ・オール・トリプレットの損失が特に有効であることが示唆された。
論文参考訳（メタデータ） (2024-03-18T23:41:52Z)
Multi-class Categorization of Reasons behind Mental Disturbance in Long Texts [0.0]
我々はLongformerを用いて、自己報告されたテキストで精神疾患の背景にある因果指標を見つける問題に対処する。実験によると、Longformerは62%のF1スコアを持つ公開データセットであるM-CAMSで、最先端の新たな結果を達成している。我々の研究は、うつ病や自殺リスクの因果分析をソーシャルメディアデータ上で促進し、他の精神状態に適用する可能性を示していると信じている。
論文参考訳（メタデータ） (2023-04-08T22:44:32Z)
Semantic Coherence Markers for the Early Diagnosis of the Alzheimer Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文参考訳（メタデータ） (2023-02-02T11:40:16Z)
Learning to Exploit Temporal Structure for Biomedical Vision-Language Processing [53.89917396428747]
視覚言語処理における自己教師あり学習は、画像とテキストのモダリティのセマンティックアライメントを利用する。トレーニングと微調整の両方で利用できる場合、事前のイメージとレポートを明示的に説明します。我々のアプローチはBioViL-Tと呼ばれ、テキストモデルと共同で訓練されたCNN-Transformerハイブリッドマルチイメージエンコーダを使用する。
論文参考訳（メタデータ） (2023-01-11T16:35:33Z)
Practical Challenges in Differentially-Private Federated Survival Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。 DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文参考訳（メタデータ） (2022-02-08T10:03:24Z)
Selecting the suitable resampling strategy for imbalanced data classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文参考訳（メタデータ） (2021-12-15T18:56:39Z)
Interpretable Time-series Representation Learning With Multi-Level Disentanglement [56.38489708031278]
Disentangle Time Series (DTS)は、シーケンシャルデータのための新しいDisentanglement Enhanceingフレームワークである。 DTSは時系列の解釈可能な表現として階層的意味概念を生成する。 DTSは、セマンティック概念の解釈性が高く、下流アプリケーションで優れたパフォーマンスを実現します。
論文参考訳（メタデータ） (2021-05-17T22:02:24Z)
Neural Topic Models with Survival Supervision: Jointly Predicting Time-to-Event Outcomes and Learning How Clinical Features Relate [10.709447977149532]
本稿では,生存予測モデル学習のためのニューラルネットワークフレームワークを提案する。特に、各主題を「トピック」の分布としてモデル化する。トピックの存在は、特定の臨床特徴が被験者に現れる可能性が高くなることを意味する。
論文参考訳（メタデータ） (2020-07-15T16:20:04Z)
Neural Data-to-Text Generation via Jointly Learning the Segmentation and Correspondence [48.765579605145454]
対象のテキストを断片単位に明示的に分割し,それらのデータ対応と整合させることを提案する。結果として生じるアーキテクチャは、ニューラルアテンションモデルと同じ表現力を維持している。 E2EとWebNLGのベンチマークでは、提案モデルがニューラルアテンションよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2020-05-03T14:28:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。