論文の概要: Figurative-cum-Commonsense Knowledge Infusion for Multimodal Mental Health Meme Classification
- arxiv url: http://arxiv.org/abs/2501.15321v1
- Date: Sat, 25 Jan 2025 20:36:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:55:44.960860
- Title: Figurative-cum-Commonsense Knowledge Infusion for Multimodal Mental Health Meme Classification
- Title(参考訳): マルチモーダルメンタルヘルス・ミーム分類のためのフィギュラティブ・クム・コモンセンス知識注入法
- Authors: Abdullah Mazhar, Zuhair hasan shaik, Aseem Srivastava, Polly Ruhnke, Lavanya Vaddavalli, Sri Keshav Katragadda, Shweta Yadav, Md Shad Akhtar,
- Abstract要約: 我々は,ミームを6つのきめ細かい不安症状に分類する新しいデータセットAxiOMを紹介した。
次に、図形言語と常識知識を解釈する能力を高めるために、コモンセンスとドメイン富化フレームワークM3Hを提案する。
総合的な目標は、まず最初に理解し、それからミームで表されるメンタルヘルスの症状を分類することである。
- 参考スコア(独自算出の注目度): 12.953830867972885
- License:
- Abstract: The expression of mental health symptoms through non-traditional means, such as memes, has gained remarkable attention over the past few years, with users often highlighting their mental health struggles through figurative intricacies within memes. While humans rely on commonsense knowledge to interpret these complex expressions, current Multimodal Language Models (MLMs) struggle to capture these figurative aspects inherent in memes. To address this gap, we introduce a novel dataset, AxiOM, derived from the GAD anxiety questionnaire, which categorizes memes into six fine-grained anxiety symptoms. Next, we propose a commonsense and domain-enriched framework, M3H, to enhance MLMs' ability to interpret figurative language and commonsense knowledge. The overarching goal remains to first understand and then classify the mental health symptoms expressed in memes. We benchmark M3H against 6 competitive baselines (with 20 variations), demonstrating improvements in both quantitative and qualitative metrics, including a detailed human evaluation. We observe a clear improvement of 4.20% and 4.66% on weighted-F1 metric. To assess the generalizability, we perform extensive experiments on a public dataset, RESTORE, for depressive symptom identification, presenting an extensive ablation study that highlights the contribution of each module in both datasets. Our findings reveal limitations in existing models and the advantage of employing commonsense to enhance figurative understanding.
- Abstract(参考訳): ミームのような非伝統的な手段によるメンタルヘルスの症状の表現は、ここ数年で顕著な注目を集めており、ユーザーはミーム内の具体的複雑化を通じて、メンタルヘルスの苦難を強調していることが多い。
人間はこれらの複雑な表現を解釈するために常識的な知識に頼るが、現在のマルチモーダル言語モデル(MLM)はミームに固有のこれらの図形的側面を捉えるのに苦労している。
このギャップに対処するために,GAD不安アンケートから得られた新しいデータセットであるAxiOMを導入し,ミームを6つのきめ細かい不安症状に分類した。
次に、図形言語と常識知識を解釈するMLMの能力を高めるために、コモンセンスとドメイン富化フレームワークM3Hを提案する。
総合的な目標は、まず最初に理解し、それからミームで表されるメンタルヘルスの症状を分類することである。
我々は、M3Hを6つの競合ベースライン(20種類のバリエーション)に対してベンチマークし、人間の詳細な評価を含む量的および質的な指標の改善を実証した。
重み付きF1測定では4.20%と4.66%の明確な改善が観察された。
一般化可能性を評価するため、両データセットにおける各モジュールの寄与を強調した広範囲にわたるアブレーション研究を提示し、うつ症状の同定のための公開データセットRESTOREで広範な実験を行った。
本研究は,既存のモデルにおける限界と,図形的理解を高めるためにCommonsenseを活用する利点を明らかにする。
関連論文リスト
- Detecting anxiety and depression in dialogues: a multi-label and explainable approach [5.635300481123079]
不安と抑うつは世界中で最も一般的なメンタルヘルスの問題であり、人口の非無視的な部分に影響を及ぼす。
本研究では、不安と抑うつの多ラベル分類のための全く新しいシステムを提案する。
論文 参考訳(メタデータ) (2024-12-23T15:29:46Z) - MemeMQA: Multimodal Question Answering for Memes via Rationale-Based Inferencing [53.30190591805432]
構造化された質問に対する正確な応答を求めるマルチモーダルな質問応答フレームワークであるMemeMQAを紹介する。
また,MemeMQAに対処する新しい2段階マルチモーダルフレームワークであるARSENALを提案する。
論文 参考訳(メタデータ) (2024-05-18T07:44:41Z) - Zero-shot Explainable Mental Health Analysis on Social Media by Incorporating Mental Scales [23.94585145560042]
MAIMS(Incorporating Mental Scales)による精神分析は、精神状態を評価するために尺度を使用する心理的アセスメントの実践に着想を得たものである。
第一に、患者はメンタルスケールを完了し、第二に、心理学者は収集した情報をメンタルスケールから解釈し、情報的決定を行う。
論文 参考訳(メタデータ) (2024-02-09T09:44:06Z) - DepressionEmo: A novel dataset for multilabel classification of
depression emotions [6.26397257917403]
DepressionEmoは、Redditの長いユーザー投稿の6037例によって、うつ病に関連する8つの感情を検出するために設計されたデータセットである。
このデータセットは、事前訓練されたモデルのゼロショット分類による入力に対する多数決によって作成された。
本稿では,SVM,XGBoost,Light GBMなどの機械学習手法と,BERT,GAN-BERT,BARTなどのディープラーニング手法の2つのグループに分類されるテキスト分類手法を提案する。
論文 参考訳(メタデータ) (2024-01-09T16:25:31Z) - Towards Mitigating Hallucination in Large Language Models via
Self-Reflection [63.2543947174318]
大規模言語モデル(LLM)は、質問応答(QA)タスクを含む生成的および知識集約的なタスクを約束している。
本稿では,広範に採用されているLCMとデータセットを用いた医療再生QAシステムにおける幻覚現象を解析する。
論文 参考訳(メタデータ) (2023-10-10T03:05:44Z) - WellXplain: Wellness Concept Extraction and Classification in Reddit
Posts for Mental Health Analysis [8.430481660019451]
伝統的なセラピーセッションでは、専門家は、基礎となる精神的な課題の起源と成果を手動で特定する。
本稿では、Redditコンテンツ中のウェルネス次元の同定を、ウェルネス概念抽出とカテゴリー化の課題として考慮し、この複雑なメンタルヘルス分析へのアプローチを紹介する。
WELLXPLAINという名前のユニークなデータセットは、3,092のエントリと72,813のワードで構成されています。
論文 参考訳(メタデータ) (2023-08-25T23:50:05Z) - Probing Brain Context-Sensitivity with Masked-Attention Generation [87.31930367845125]
我々は、GPT-2変換器を用いて、一定量の文脈情報をキャプチャする単語埋め込みを生成する。
そして、自然主義的なテキストを聴く人間のfMRI脳活動を予測することができるかどうかを検証した。
論文 参考訳(メタデータ) (2023-05-23T09:36:21Z) - Navigating the Grey Area: How Expressions of Uncertainty and
Overconfidence Affect Language Models [74.07684768317705]
LMはプロンプトにおける確実性のマーカーに非常に敏感であり、アクーは80%以上変化している。
その結果,高い確実性の表現は低い表現に比べて精度が低下し,事実動詞が性能を損なうのに対して,明らかな表現はパフォーマンスに寄与することがわかった。
これらの関連性は、LMが真に不確実性を反映するのではなく、観察された言語の使用に基づいていることを示唆している。
論文 参考訳(メタデータ) (2023-02-26T23:46:29Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Mine yOur owN Anatomy: Revisiting Medical Image Segmentation with Extremely Limited Labels [54.58539616385138]
我々は、Mine yOur owN Anatomy (MONA) と呼ばれる、新しい半教師付き2次元医用画像セグメンテーションフレームワークを紹介する。
まず、先行研究では、すべてのピクセルがモデルトレーニングに等しく重要であると論じており、我々はこの1つだけで意味のある解剖学的特徴を定義できないことを経験的に観察している。
第2に,医療画像を解剖学的特徴の集合に分解できるモデルを構築する。
論文 参考訳(メタデータ) (2022-09-27T15:50:31Z) - Exercise? I thought you said 'Extra Fries': Leveraging Sentence
Demarcations and Multi-hop Attention for Meme Affect Analysis [18.23523076710257]
MHA-MEMEと呼ばれるマルチホップアテンションベースのディープニューラルネットワークフレームワークを提案する。
その主な目的は、視覚モダリティ(画像)と様々なテキストセグメント間の空間領域対応を利用して、分類のためのきめ細かい特徴表現を抽出することである。
MHA-MEMEを3つのサブタスク(感情分類、影響分類、クラス定量化)すべてに対して'Memotion Analysis'データセット上で評価する。
論文 参考訳(メタデータ) (2021-03-23T08:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。