論文の概要: TMASC: Transmasculine Attitude and Speech Corpus
- arxiv url: http://arxiv.org/abs/2606.16351v1
- Date: Mon, 15 Jun 2026 07:50:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.160594
- Title: TMASC: Transmasculine Attitude and Speech Corpus
- Title(参考訳): TMASC:超人的態度と音声コーパス
- Authors: Sidney Wong,
- Abstract要約: われわれは,196人の男性個人からなる多モーダルコーパスであるTransmasculine Attitudes and Speech Corpus (TMASC)を紹介した。
質問票には、男性児の声の健康を調査する項目が含まれている。
音声録音には、うずみと喉の洗浄サンプル、読み出しパス、セッション固有の質問が含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the Transmasculine Attitudes and Speech Corpus (TMASC), a multimodal corpus of 196 transmasculine individuals, including questionnaire responses and 66 audio recordings. The questionnaire includes items exploring the vocal health of transmasculine individuals. The audio recordings include cough and throat-clearing samples, a reading passage, and additional session-specific questions. This paper outlines the development of this corpus and the data collection procedures. To illustrate the utility of this corpus, we present three case studies demonstrating how this crowd-sourced multimodal corpus can be used to support transmasculine individuals. These include the integration of perceptual and acoustic data, the identification of group-level characteristics, and the calibration of acoustic measurements.
- Abstract(参考訳): 質問紙回答や66件の音声記録を含む196名からなる多モーダルコーパスであるTransmasculine Attitudes and Speech Corpus (TMASC)を紹介した。
質問票には、男性児の声の健康を調査する項目が含まれている。
音声録音には、うずみと喉の洗浄サンプル、読み出しパス、セッション固有の質問が含まれる。
本稿では,このコーパスの開発とデータ収集手順について概説する。
本コーパスの有用性を説明するために, このクラウドソース型マルチモーダルコーパスを, トランス男性個人を支援するためにどのように使用できるかを示す3つのケーススタディを提案する。
これには知覚データと音響データの統合、グループレベルの特性の同定、音響測定の校正が含まれる。
関連論文リスト
- Identifying Speaker Information in Feed-Forward Layers of Self-Supervised Speech Transformers [50.9040167152168]
我々は,k-meansの自己監督的特徴とi-vectorに関連するニューロンを解析した。
分析の結果,これらのクラスタは幅広い音韻クラスとジェンダークラスに対応していることがわかった。
これらのニューロンをプルーニング中に保護することにより、話者関連タスクの性能を著しく維持することができる。
論文 参考訳(メタデータ) (2025-06-26T18:54:26Z) - A Novel Labeled Human Voice Signal Dataset for Misbehavior Detection [0.7223352886780369]
本研究は,音声認識のための自動学習システムにおける音声トーンと配信の重要性を強調した。
これは、人間の行動が音声信号の知覚と分類に与える影響を解明することにより、音声信号解析の幅広い分野に寄与する。
論文 参考訳(メタデータ) (2024-06-28T18:55:07Z) - NeuroVoz: a Castillian Spanish corpus of parkinsonian speech [34.916222066004465]
この写本は、58人の健康的なコントロールと54人のPDを含む112人のカスティーリャ・スペイン語話者からなるNeuroVoz corpusを提示している。
また、このデータセットは、GRBAS尺度に従って専門家が行う音声品質の主観評価と補完される。
このデータセットはすでにいくつかの研究を支持しており、PDのスクリーニングのベンチマーク精度は89%に達した。
論文 参考訳(メタデータ) (2024-03-04T16:17:39Z) - Speech motion anomaly detection via cross-modal translation of 4D motion
fields from tagged MRI [12.515470808059666]
本研究は, 音声の動作異常を検出するための枠組みを, 対応する音声と組み合わせて開発することを目的とする。
これは、健康な個人のみのデータに基づいて訓練された深いクロスモーダルトランスレータを使用することによって達成される。
一級のSVMは、健康な個人の分光図と患者の分光図を区別するために使用される。
論文 参考訳(メタデータ) (2024-02-10T16:16:24Z) - What You Hear Is What You See: Audio Quality Metrics From Image Quality
Metrics [44.659718609385315]
そこで本研究では,音声信号の評価に最先端画像知覚メトリクスを応用し,スペクトログラムとして表現することの実現可能性について検討する。
我々は、音響信号の特異性を考慮するために、精神音響学的に妥当なアーキテクチャを持つメトリクスの1つをカスタマイズする。
提案手法の有効性を音楽データセットを用いて評価した。
論文 参考訳(メタデータ) (2023-05-19T10:43:57Z) - The MuSe 2023 Multimodal Sentiment Analysis Challenge: Mimicked
Emotions, Cross-Cultural Humour, and Personalisation [69.13075715686622]
MuSe 2023は、現代の3つの異なるマルチモーダル感情と感情分析の問題に対処する共有タスクの集合である。
MuSe 2023は、さまざまな研究コミュニティから幅広いオーディエンスを集めようとしている。
論文 参考訳(メタデータ) (2023-05-05T08:53:57Z) - Self-supervised speech unit discovery from articulatory and acoustic
features using VQ-VAE [2.771610203951056]
本研究では,自己教師型環境下での音声単位の発見に,調音情報をどのように利用できるかを検討する。
我々はベクトル量子化変分オートエンコーダ(VQ-VAE)を用いて音声・音声データから離散表現を学習した。
実験は英語とフランス語の3つの異なるコーパスで行われた。
論文 参考訳(メタデータ) (2022-06-17T14:04:24Z) - Speech Resynthesis from Discrete Disentangled Self-Supervised
Representations [49.48053138928408]
音声合成作業に自己教師付き離散表現を用いることを提案する。
音声コンテンツ、韻律情報、話者識別のための低ビット表現を抽出する。
得られた表現を使用することで、ベースラインメソッドよりも優れた音声品質を提供しながら、毎秒365ビットのレートが得られる。
論文 参考訳(メタデータ) (2021-04-01T09:20:33Z) - Speaker Diarization with Lexical Information [59.983797884955]
本研究では,音声認識による語彙情報を活用した話者ダイアリゼーション手法を提案する。
本稿では,話者クラスタリングプロセスに単語レベルの話者回転確率を組み込んだ話者ダイアリゼーションシステムを提案し,全体的なダイアリゼーション精度を向上させる。
論文 参考訳(メタデータ) (2020-04-13T17:16:56Z) - Continuous speech separation: dataset and analysis [52.10378896407332]
自然な会話では、音声信号は連続的であり、重複成分と重複成分の両方を含む。
本稿では,連続音声分離アルゴリズムを評価するためのデータセットとプロトコルについて述べる。
論文 参考訳(メタデータ) (2020-01-30T18:01:31Z) - On the Mutual Information between Source and Filter Contributions for
Voice Pathology Detection [11.481208551940998]
本稿では,音声信号から直接音声の病状を自動的に検出する問題に対処する。
音声や声帯信号に関連があるか,韻律に関連があるかによって,3つの特徴セットが提案される。
論文 参考訳(メタデータ) (2020-01-02T10:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。