論文の概要: Dynamic Stress Detection: A Study of Temporal Progression Modelling of Stress in Speech
- arxiv url: http://arxiv.org/abs/2510.08586v1
- Date: Thu, 02 Oct 2025 06:30:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 05:23:07.119566
- Title: Dynamic Stress Detection: A Study of Temporal Progression Modelling of Stress in Speech
- Title(参考訳): 動的ストレス検出:音声におけるストレスの時間的進行モデルの検討
- Authors: Vishakha Lall, Yisi Liu,
- Abstract要約: 我々はストレスを、歴史的感情状態の影響を受けながら、時間的に進化する現象としてモデル化する。
感情的ラベルからきめ細かな応力アノテーションを抽出する動的ラベル付け手法を提案する。
提案手法は既存のベースラインよりも, MuSE と StressID に顕著な精度向上を実現している。
- 参考スコア(独自算出の注目度): 1.3320917259299652
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Detecting psychological stress from speech is critical in high-pressure settings. While prior work has leveraged acoustic features for stress detection, most treat stress as a static label. In this work, we model stress as a temporally evolving phenomenon influenced by historical emotional state. We propose a dynamic labelling strategy that derives fine-grained stress annotations from emotional labels and introduce cross-attention-based sequential models, a Unidirectional LSTM and a Transformer Encoder, to capture temporal stress progression. Our approach achieves notable accuracy gains on MuSE (+5%) and StressID (+18%) over existing baselines, and generalises well to a custom real-world dataset. These results highlight the value of modelling stress as a dynamic construct in speech.
- Abstract(参考訳): 高圧環境では,音声からの心理的ストレスの検出が重要である。
以前の研究では、音響的特徴をストレス検出に利用していたが、ほとんどの場合、ストレスを静的なラベルとして扱う。
本研究では,ストレスを歴史的情緒状態の影響を受け,時間的に変化する現象としてモデル化する。
本研究では,感情ラベルからきめ細かな応力アノテーションを導出する動的ラベル付け手法を提案し,一方向LSTMとトランスフォーマーエンコーダを交叉アテンションベースシーケンシャルモデルとして導入し,時間的ストレスの進行を捉える。
提案手法は,既存のベースラインに対する MuSE (+5%) と StressID (+18%) の顕著な精度向上を実現し,実世界のカスタムデータセットによく適応する。
これらの結果は,音声の動的構造としてのモデリングストレスの価値を強調した。
関連論文リスト
- StressTest: Can YOUR Speech LM Handle the Stress? [30.973919141559644]
センセントストレス(Sentence stress)とは、アイデアを強調または対比するために、発声中の単語に重点を置くことを指す。
ストレスパターンに基づく音声の意味を識別するモデルの能力を評価するためのベンチマークであるScressTestを紹介する。
本研究では,新しいデータ生成パイプラインを提案し,ストレス変動によって示唆される意味の変化をシミュレートするトレーニングセットであるScress-17kを作成する。
論文 参考訳(メタデータ) (2025-05-28T18:32:56Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - MISE: Meta-knowledge Inheritance for Social Media-Based Stressor Estimation [20.284960134507543]
本研究では,ソーシャルメディア上でのユーザの投稿を通じて,より具体的なストレスを推定することを目的とした新しいタスクを提案する。
メタ知識継承機構によって強化された,メタ学習に基づく新しいストレス要因推定フレームワークを提案する。
我々は、人間の幸福を促進するために人工知能モデルを訓練するのに役立つソーシャルメディアベースのストレスクレーサ推定データセットを構築した。
論文 参考訳(メタデータ) (2025-05-03T18:12:36Z) - Robust and Transferable Backdoor Attacks Against Deep Image Compression With Selective Frequency Prior [118.92747171905727]
本稿では,学習画像の圧縮モデルに複数のトリガを付加したバックドアアタックを起動するための新しい周波数ベースのトリガインジェクションモデルを提案する。
1) 圧縮品質をビットレートと再現精度で劣化させる,2) 顔認識やセマンティックセグメンテーションといったタスク駆動型対策を目標とする,様々なシナリオに適した攻撃目標を設計する。
実験の結果, トリガーインジェクションモデルと, エンコーダパラメータの微調整を組み合わせることで, 複数のバックドアとトリガーを1つの圧縮モデルに注入することができた。
論文 参考訳(メタデータ) (2024-12-02T15:58:40Z) - Learning Frame-Wise Emotion Intensity for Audio-Driven Talking-Head Generation [59.81482518924723]
そこで本研究では,発話頭生成のための微妙なシフトを捕捉し,生成する手法を提案する。
我々は,強度レベルを正確に制御し,様々な感情を生成できる話頭フレームワークを開発した。
提案手法の有効性を実験・解析により検証した。
論文 参考訳(メタデータ) (2024-09-29T01:02:01Z) - Stressor Type Matters! -- Exploring Factors Influencing Cross-Dataset Generalizability of Physiological Stress Detection [5.304745246313982]
本研究では,2次応力検出のためのHRV機能に基づいて学習した機械学習モデルの一般化可能性について検討する。
以上の結果から,モデル一般化可能性に重要な因子であるストレスタイプが示唆された。
我々は、新しい環境にHRVベースのストレスモデルを展開する際に、ストレスタイプをマッチングすることを推奨する。
論文 参考訳(メタデータ) (2024-05-06T14:47:48Z) - Investigating the Generalizability of Physiological Characteristics of Anxiety [3.4036712573981607]
不安やストレスと高覚醒感情との関連が示された生理的特徴の一般化可能性を評価する。
この研究は、心電図やEDA信号からストレスと覚醒を横断する最初のクロスコーパス評価であり、ストレス検出の一般化性に関する新たな発見に寄与した。
論文 参考訳(メタデータ) (2024-01-23T16:49:54Z) - Personalization of Stress Mobile Sensing using Self-Supervised Learning [1.7598252755538808]
ストレスは様々な健康問題への主要な貢献者として広く認められている。
リアルタイムのストレス予測は、デジタル介入がストレスの開始時に即座に反応し、心臓のリズム不規則性のような多くの心理的、生理的症状を避けるのに役立つ。
しかし、機械学習を用いたストレス予測の主な課題は、ラベルの主観性とスパース性、大きな特徴空間、比較的少ないラベル、特徴と結果の間の複雑な非線形および主観的関係である。
論文 参考訳(メタデータ) (2023-08-04T22:26:33Z) - Stabilizing Transformer Training by Preventing Attention Entropy
Collapse [56.45313891694746]
本研究は,トランスフォーマーのトレーニングダイナミクスについて,注目層の進化について検討する。
我々は、$sigma$Reparamが注意層におけるエントロピー崩壊を防ぎ、より安定したトレーニングを促進することを示す。
画像分類、画像自己教師型学習、機械翻訳、音声認識、言語モデリングタスクについて、$sigma$Reparamで実験を行った。
論文 参考訳(メタデータ) (2023-03-11T03:30:47Z) - Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。
任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。
本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文 参考訳(メタデータ) (2021-05-31T17:01:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。