論文の概要: Machine Unlearning for Speaker-Agnostic Detection of Gender-Based Violence Condition in Speech
- arxiv url: http://arxiv.org/abs/2411.18177v2
- Date: Fri, 26 Sep 2025 09:32:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 14:23:57.192785
- Title: Machine Unlearning for Speaker-Agnostic Detection of Gender-Based Violence Condition in Speech
- Title(参考訳): 音声におけるジェンダーベースビオレンス条件の話者非依存検出のための機械学習
- Authors: Emma Reyner-Fuentes, Esther Rituerto-Gonzalez, Carmen Pelaez-Moreno,
- Abstract要約: ジェンダーベースの暴力は、女性のメンタルヘルスに深刻な影響を及ぼす公衆衛生上の問題である。
本研究は、性別による暴力被害者を音声から検出するための話者非依存的アプローチを提案する。
- 参考スコア(独自算出の注目度): 0.5352699766206809
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Gender-based violence is a pervasive public health issue that severely impacts women's mental health, often leading to conditions such as in anxiety, depression, post-traumatic stress disorder, and substance abuse. Identifying the combination of these various mental health conditions could then point to someone who is a victim of gender-based violence. And while speech-based artificial intelligence tools show as a promising solution for mental health screening, their performance often deteriorates when encountering speech from previously unseen speakers, a sign that speaker traits may be confounding factors. This study introduces a speaker-agnostic approach to detecting the gender-based violence victim condition from speech, aiming to develop robust artificial intelligence models capable of generalizing across speakers. By employing domain-adversarial training, we reduce the influence of speaker identity on model predictions, we achieve a 26.95% relative reduction in speaker identification accuracy while improving gender-based violence victim condition classification accuracy by 6.37% (relative). These results suggest that our models effectively capture paralinguistic biomarkers linked to the gender-based violence victim condition, rather than speaker-specific traits. Additionally, the model's predictions show moderate correlation with pre-clinical post-traumatic stress disorder symptoms, supporting the relevance of speech as a non-invasive tool for mental health monitoring. This work lays the foundation for ethical, privacy-preserving artificial intelligence systems to support clinical screening of gender-based violence survivors.
- Abstract(参考訳): ジェンダーベースの暴力は、女性のメンタルヘルスに深刻な影響を与え、不安、抑うつ、外傷後のストレス障害、薬物乱用などの状態につながる。
様々な精神状態が組み合わさったことを特定すれば、性的な暴力の被害者となる人を指す可能性がある。
音声ベースの人工知能ツールは、メンタルヘルススクリーニングのための有望なソリューションであることを示しているが、そのパフォーマンスは、これまで目に見えない話者からのスピーチに遭遇するときに、しばしば悪化する。
本研究は,ジェンダーベースの暴力被害者を音声から検出するための話者非依存のアプローチを導入し,話者間の一般化が可能な堅牢な人工知能モデルを開発することを目的とした。
モデル予測に対する話者同一性の影響を減らし,性別による暴力被害者の分類精度を6.37%向上させながら,26.95%の話者識別精度の向上を実現した。
以上の結果から,本モデルは,話者特有の特徴ではなく,性別による暴力被害者の症状に関連するパラ言語的バイオマーカーを効果的に捉えていることが示唆された。
さらに、このモデルの予測は、心的健康モニタリングのための非侵襲的なツールとしての音声の関連性を支持する、心的外傷後ストレス障害の症状と適度な相関を示す。
この研究は、ジェンダーベースの暴力の生存者の臨床的スクリーニングを支援する倫理的、プライバシー保護の人工知能システムの基礎を築いた。
関連論文リスト
- Domain Adversarial Training for Mitigating Gender Bias in Speech-based Mental Health Detection [9.82676920954754]
本稿では,音声による抑うつとPTSD検出において,性差を明確に考慮するドメイン逆行訓練手法を提案する。
その結果,F1スコアはベースラインに比べて最大13.29ポイント向上することがわかった。
論文 参考訳(メタデータ) (2025-05-06T09:29:14Z) - Towards Privacy-aware Mental Health AI Models: Advances, Challenges, and Opportunities [61.633126163190724]
精神病は、社会的、個人的コストがかなり高い広範囲で不安定な状態である。
近年の人工知能(AI)の進歩は、うつ病、不安障害、双極性障害、統合失調症、外傷後ストレス障害などの病態を認識し、対処するための大きな可能性を秘めている。
データセットやトレーニング済みモデルからの機密データ漏洩のリスクを含むプライバシー上の懸念は、これらのAIシステムを実際の臨床環境にデプロイする上で、依然として重要な障壁である。
論文 参考訳(メタデータ) (2025-02-01T15:10:02Z) - CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy [67.23830698947637]
認知行動療法(CBT)支援の体系的評価のための新しいベンチマークであるCBT-BENCHを提案する。
我々は, CBT-BENCHにおける3段階の課題を含む: I: 基本的CBT知識獲得, 複数選択質問のタスク; II: 認知的モデル理解, 認知的歪み分類, 主根的信念分類, きめ細かい中核信念分類のタスク; III: 治療的応答生成, CBTセラピーセッションにおける患者音声に対する応答生成のタスク。
実験結果から,LLMはCBT知識のリサイティングに優れるが,複雑な実世界のシナリオでは不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-10-17T04:52:57Z) - AI-Driven Early Mental Health Screening with Limited Data: Analyzing Selfies of Pregnant Women [32.514036618021244]
うつ病や不安障害は世界中で何百万もの人に影響を与え、精神疾患の重荷に大きく貢献する。
早期スクリーニングは、精神疾患のタイムリーな同定が治療成績を大幅に改善するので、効果的な介入に不可欠である。
本研究は、顔中心の自撮りを与えられたユビキタスな抑うつ不安スクリーニングのためのAIモデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-10-07T19:34:25Z) - The Pitfalls and Promise of Conformal Inference Under Adversarial Attacks [90.52808174102157]
医療画像や自律運転などの安全クリティカルな応用においては、高い敵の堅牢性を維持し、潜在的敵の攻撃から保護することが不可欠である。
敵対的に訓練されたモデルに固有の不確実性に関して、注目すべき知識ギャップが残っている。
本研究では,共形予測(CP)の性能を標準対向攻撃の文脈で検証することにより,ディープラーニングモデルの不確実性について検討する。
論文 参考訳(メタデータ) (2024-05-14T18:05:19Z) - Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - Empowering Psychotherapy with Large Language Models: Cognitive
Distortion Detection through Diagnosis of Thought Prompting [82.64015366154884]
本研究では,認知的歪み検出の課題について検討し,思考の早期発見(DoT)を提案する。
DoTは、事実と思考を分離するための主観的評価、思考と矛盾する推論プロセスを引き出すための対照的な推論、認知スキーマを要約するスキーマ分析という3つの段階を通して、患者のスピーチの診断を行う。
実験により、DoTは認知的歪み検出のためのChatGPTよりも大幅に改善され、一方で人間の専門家が承認した高品質な合理性を生成することが示された。
論文 参考訳(メタデータ) (2023-10-11T02:47:21Z) - Beyond Neural-on-Neural Approaches to Speaker Gender Protection [2.741893145546753]
音声特徴に基づく性別推定攻撃の検査の重要性を示す。
研究者らは音声の特徴を利用して、保護的な修正が音声信号をどのように変化させるかを理解するべきだと論じている。
論文 参考訳(メタデータ) (2023-06-30T14:26:49Z) - Harnessing the Power of Hugging Face Transformers for Predicting Mental
Health Disorders in Social Networks [0.0]
本研究では、ユーザ生成データを用いて精神疾患の症状を予測する方法について検討する。
本研究は,Hugging Faceの4種類のBERTモデルと標準的な機械学習技術を比較した。
新しいモデルは、最大97%の精度で以前のアプローチより優れている。
論文 参考訳(メタデータ) (2023-06-29T12:25:19Z) - DEPAC: a Corpus for Depression and Anxiety Detection from Speech [3.2154432166999465]
本稿では、うつ病と不安スクリーニングツールの確立したしきい値に基づいてラベル付けされた、心的苦痛分析オーディオデータセットDEPACを紹介する。
この大きなデータセットは、個人ごとの複数の音声タスクと、関連する人口統計情報から構成される。
人間の音声における精神疾患の徴候の同定に有効な,手作業による音響的特徴と言語的特徴からなる特徴セットを提案する。
論文 参考訳(メタデータ) (2023-06-20T12:21:06Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Bias Reducing Multitask Learning on Mental Health Prediction [18.32551434711739]
メンタルヘルスの検出や予測のための機械学習モデルの開発では、研究が増加している。
本研究では,マルチタスク学習に基づくバイアス緩和手法を不安予測モデルに適用し,公平性分析を行うことを目的とする。
分析の結果、我々の不安予測ベースモデルでは、年齢、収入、民族性、そして参加者が米国で生まれたかどうかに偏りが生じていた。
論文 参考訳(メタデータ) (2022-08-07T02:28:32Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。