論文の概要: Predicting gender and age categories in English conversations using
lexical, non-lexical, and turn-taking features
- arxiv url: http://arxiv.org/abs/2102.13355v1
- Date: Fri, 26 Feb 2021 08:23:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-01 13:54:31.822968
- Title: Predicting gender and age categories in English conversations using
lexical, non-lexical, and turn-taking features
- Title(参考訳): 語彙、非語彙、ターンテイク機能を用いた英語会話における性別と年齢のカテゴリの予測
- Authors: Andreas Liesenfeld, G\'abor Parti, Yu-Yin Hsu, Chu-Ren Huang
- Abstract要約: SpokenBNCの性別と年齢のカテゴリにラベル付けされた話者間の行動の違いを調べます。
男性スピーカーのターンはタイプ・トークン比が高いが、女性スピーカーのターンは徐々に長くなる傾向にある。
例えば、年齢層全体では、言葉を誓い、笑うことは若い話者の話しを特徴づけるが、古い話者はより散らかった言葉を生成する傾向がある。
- 参考スコア(独自算出の注目度): 3.2766169283137385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper examines gender and age salience and (stereo)typicality in British
English talk with the aim to predict gender and age categories based on
lexical, phrasal and turn-taking features. We examine the SpokenBNC, a corpus
of around 11.4 million words of British English conversations and identify
behavioural differences between speakers that are labelled for gender and age
categories. We explore differences in language use and turn-taking dynamics and
identify a range of characteristics that set the categories apart. We find that
female speakers tend to produce more and slightly longer turns, while turns by
male speakers feature a higher type-token ratio and a distinct range of minimal
particles such as "eh", "uh" and "em". Across age groups, we observe, for
instance, that swear words and laughter characterize young speakers' talk,
while old speakers tend to produce more truncated words. We then use the
observed characteristics to predict gender and age labels of speakers per
conversation and per turn as a classification task, showing that non-lexical
utterances such as minimal particles that are usually left out of dialog data
can contribute to setting the categories apart.
- Abstract(参考訳): 本稿では,英英会話における性別と年齢のサリエンスと(ステレオ)典型性について検討し,語彙,フレーズ,ターンテイクの特徴に基づいて性別と年齢のカテゴリーを予測することを目的とした。
英英会話の約1億4400万語のコーパスであるspeakbncを調べ、性別と年齢のカテゴリーでラベル付けされた話者間の行動的差異を同定した。
言語使用とターンテイクのダイナミクスの違いについて検討し、カテゴリを分けたさまざまな特徴を同定する。
男性スピーカーのターンはタイプトークン比が高く、「eh」、「uh」、「em」などの最小粒子の明確な範囲が特徴である一方、女性スピーカーはますます長いターンを生成する傾向があります。
例えば、年齢層全体では、言葉を誓い、笑うことは若い話者の話しを特徴づけるが、古い話者はより散らかった言葉を生成する傾向がある。
次に,会話ごとの話者の性別や年齢を予測し,その特徴を分類タスクとして用いて,ダイアログデータから取り除かれた最小粒子のような非語彙的発話が,カテゴリの分類に寄与することを示す。
関連論文リスト
- What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Twists, Humps, and Pebbles: Multilingual Speech Recognition Models Exhibit Gender Performance Gaps [25.95711246919163]
現在の自動音声認識(ASR)モデルは、多くの言語やタスクでかなりの変更を加えることなく使用できるように設計されている。
本研究では,3つのデータセット上で広く使用されている2つの多言語ASRモデルの性能を体系的に評価する。
以上の結果から,言語やモデルによって異なる傾向がみられた。
論文 参考訳(メタデータ) (2024-02-28T00:24:29Z) - The Causal Influence of Grammatical Gender on Distributional Semantics [87.8027818528463]
言語間のジェンダー割り当てがどの程度意味を持つかは、言語学と認知科学における研究の活発な領域である。
我々は、名詞の文法的性別、意味、形容詞選択の間の相互作用を共同で表現する、新しい因果的グラフィカルモデルを提供する。
名詞の意味を制御した場合、文法的性別と形容詞的選択の関係は、ほぼゼロであり、無意味である。
論文 参考訳(メタデータ) (2023-11-30T13:58:13Z) - How To Build Competitive Multi-gender Speech Translation Models For
Controlling Speaker Gender Translation [21.125217707038356]
発音性言語から文法性言語に翻訳する場合、生成された翻訳は、話者を参照する者を含む様々な単語に対して、明確なジェンダー代入を必要とする。
このような偏見や包括的行動を避けるために、話者の性別に関する外部から提供されたメタデータによって、話者関連表現の性別割当を導出すべきである。
本稿では、話者のジェンダーメタデータを単一の「マルチジェンダー」ニューラルSTモデルに統合し、維持しやすくすることで、同じ結果を達成することを目的とする。
論文 参考訳(メタデータ) (2023-10-23T17:21:32Z) - Cross-Lingual Cross-Age Group Adaptation for Low-Resource Elderly Speech
Emotion Recognition [48.29355616574199]
我々は、英語、中国語、カントン語という3つの異なる言語における感情認識の伝達可能性を分析する。
本研究は,異なる言語群と年齢群が特定の音声特徴を必要とすることを結論し,言語間推論を不適切な方法とする。
論文 参考訳(メタデータ) (2023-06-26T08:48:08Z) - Analysis of Male and Female Speakers' Word Choices in Public Speeches [0.0]
TED講義等の公的な住所における男女のプレゼンターの語選択について比較した。
以上の結果から, 男性話者は, 言語, 心理的, 認知的, 社会的な言葉を, 女性話者よりもはるかに多く使用していることが判明した。
論文 参考訳(メタデータ) (2022-11-11T17:30:28Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Under the Morphosyntactic Lens: A Multifaceted Evaluation of Gender Bias
in Speech Translation [20.39599469927542]
ジェンダーバイアスは言語技術に影響を及ぼす問題として広く認識されている。
現代の評価慣行のほとんどは、合成条件下での職業名詞の狭いセットに単語レベルの焦点をあてている。
このようなプロトコルは、性合意のモルフォシンタクティック連鎖を特徴とする文法性言語の重要な特徴を見落としている。
論文 参考訳(メタデータ) (2022-03-18T11:14:16Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Pick a Fight or Bite your Tongue: Investigation of Gender Differences in
Idiomatic Language Usage [9.892162266128306]
我々は、話者の性別に注釈を付けた、新しくて大きくて多様な自発言語生成コーパスをコンパイルする。
本研究は,男性と女性におけるテクスト表現言語の使用における区別に関する大規模な実証的研究である。
論文 参考訳(メタデータ) (2020-10-31T18:44:07Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。