論文の概要: Evolution of Voices in French Audiovisual Media Across Genders and Age in a Diachronic Perspective
- arxiv url: http://arxiv.org/abs/2404.16104v1
- Date: Wed, 24 Apr 2024 18:00:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-26 18:12:20.943568
- Title: Evolution of Voices in French Audiovisual Media Across Genders and Age in a Diachronic Perspective
- Title(参考訳): 日仏音声メディアにおけるジェンダーと年齢間の音声の進化 : ダイアクロニック・パースペクティブ
- Authors: Albert Rilliard, David Doukhan, Rémi Uro, Simon Devauchelle,
- Abstract要約: 本稿では,フランスのメディアアーカイブから1023人の話者の声のダイアクロニック音響解析を行った。
話者は、4つの期間(1955/56年、1975/76年、1995/96年、2015/16年)、4つの年齢グループ(20-35年、36-50年、51-65年、65年)と2つの性別に基づいて32のカテゴリーに分散している。
- 参考スコア(独自算出の注目度): 0.9449650062296824
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a diachronic acoustic analysis of the voice of 1023 speakers from French media archives. The speakers are spread across 32 categories based on four periods (years 1955/56, 1975/76, 1995/96, 2015/16), four age groups (20-35; 36-50; 51-65, >65), and two genders. The fundamental frequency ($F_0$) and the first four formants (F1-4) were estimated. Procedures used to ensure the quality of these estimations on heterogeneous data are described. From each speaker's $F_0$ distribution, the base-$F_0$ value was calculated to estimate the register. Average vocal tract length was estimated from formant frequencies. Base-$F_0$ and vocal tract length were fit by linear mixed models to evaluate how they may have changed across time periods and genders, corrected for age effects. Results show an effect of the period with a tendency to lower voices, independently of gender. A lowering of pitch is observed with age for female but not male speakers.
- Abstract(参考訳): 本稿では,フランスのメディアアーカイブから1023人の話者の声のダイアクロニック音響解析を行った。
話者は、4つの期間(1955/56年、1975/76年、1995/96年、2015/16年)、4つの年齢グループ(20-35年、36-50年、51-65年、65年)と2つの性別に基づいて32のカテゴリーに分散している。
基本周波数(F_0$)と第14フォルマント(F1-4)を推定した。
不均一なデータに対するこれらの推定の質を保証するために用いられる手順について述べる。
各話者の$F_0$分布から、ベース-$F_0$値を計算してレジスタを推定した。
ホルマント周波数から平均声道長を推定した。
Base-$F_0$と声道長を線形混合モデルに適合させ,年齢効果を補正した。
その結果,性別によらず,低声化傾向にある期間の影響が示唆された。
ピッチの低下は女性の年齢とともに観察されるが、男性話者は観察されない。
関連論文リスト
- Will the Prince Get True Love's Kiss? On the Model Sensitivity to Gender
Perturbation over Fairytale Texts [87.62403265382734]
近年の研究では、伝統的な妖精は有害な性バイアスを伴っていることが示されている。
本研究は,ジェンダーの摂動に対する頑健さを評価することによって,言語モデルの学習バイアスを評価することを目的とする。
論文 参考訳(メタデータ) (2023-10-16T22:25:09Z) - No Pitch Left Behind: Addressing Gender Unbalance in Automatic Speech
Recognition through Pitch Manipulation [20.731375136671605]
本稿では,基本周波数(f0)とホルマントを操作するデータ拡張手法を提案する。
この手法は、表現不足の女性話者の声をシミュレートすることにより、性別間のデータ不均衡を低減する。
自発性英語音声の実験では,女性話者の発話に対して,WERの相対的な改善が9.87%に達することが示された。
論文 参考訳(メタデータ) (2023-10-10T12:55:22Z) - The Gender-GAP Pipeline: A Gender-Aware Polyglot Pipeline for Gender
Characterisation in 55 Languages [51.2321117760104]
本稿では,55言語を対象とした大規模データセットにおけるジェンダー表現を特徴付ける自動パイプラインであるGender-GAP Pipelineについて述べる。
このパイプラインは、性別付き人称名詞の多言語語彙を用いて、テキスト中の性別表現を定量化する。
本稿では、WMTのトレーニングデータとNewsタスクの開発データにジェンダー表現を報告し、現在のデータが男性表現にスキューされていることを確認する。
論文 参考訳(メタデータ) (2023-08-31T17:20:50Z) - Elucidate Gender Fairness in Singing Voice Transcription [5.434559527051845]
歌唱音声書き起こし(SVT)における性差が性差につながるかどうかを考察する。
ジェンダーデータの不均衡ではなく、ピッチの分布が異なることが、この格差に寄与している。
この問題に対処するために、属性予測器を用いて性別ラベルを予測し、SVTシステムを逆さまに訓練し、音響表現の性差を強制する手法を提案する。
論文 参考訳(メタデータ) (2023-08-05T15:15:01Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - Auditing Gender Presentation Differences in Text-to-Image Models [54.16959473093973]
我々は、テキスト・ツー・イメージ・モデルにおいて、ジェンダーがどのように異なる形で提示されるかを研究する。
入力テキスト中の性指標を探索することにより、プレゼンテーション中心属性の周波数差を定量化する。
このような違いを推定する自動手法を提案する。
論文 参考訳(メタデータ) (2023-02-07T18:52:22Z) - Generating Multilingual Gender-Ambiguous Text-to-Speech Voices [4.005334718121374]
本研究は,マルチスピーカ・マルチリンガル・セッティングにおいて,男女あいまいなTTS音声を新たに生成する作業に対処する。
我々の知る限り、これは、様々な性別のあいまいな声を確実に生成できる、体系的で検証された最初のアプローチである。
論文 参考訳(メタデータ) (2022-11-01T10:40:24Z) - Towards Understanding Gender-Seniority Compound Bias in Natural Language
Generation [64.65911758042914]
本研究では,事前学習したニューラルジェネレーションモデルにおける性別バイアスの程度に,高齢者がどのような影響を及ぼすかを検討する。
以上の結果から, GPT-2は, 両領域において, 女性を中年, 男性を中年として考えることにより, 偏見を増幅することが示された。
以上の結果から, GPT-2を用いて構築したNLPアプリケーションは, プロの能力において女性に害を与える可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:05:02Z) - Estimation of speaker age and height from speech signal using bi-encoder
transformer mixture model [3.1447111126464997]
話者年齢と高さ推定のためのバイエンコーダ変圧器混合モデルを提案する。
男女の音声特性の広さを考慮し、2つの異なるトランスフォーマーエンコーダを提案する。
年齢推定における現在の最先端の成績を著しく上回る結果を得た。
論文 参考訳(メタデータ) (2022-03-22T14:39:56Z) - VoxCeleb Enrichment for Age and Gender Recognition [12.520037579004883]
我々は、VoxCelebデータセットに話者年齢ラベルと(代替)話者性別アノテーションを提供する。
年齢と性別の認識モデルを構築することで,このメタデータの利用を実証する。
また、オリジナルVoxCelebの性別ラベルと当社のラベルを比較して、オリジナルVoxCelebのデータに誤ラベルされている可能性のあるレコードを特定します。
論文 参考訳(メタデータ) (2021-09-28T06:18:57Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。