論文の概要: Exploring How Generative Adversarial Networks Learn Phonological
Representations
- arxiv url: http://arxiv.org/abs/2305.12501v1
- Date: Sun, 21 May 2023 16:37:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 20:06:27.928874
- Title: Exploring How Generative Adversarial Networks Learn Phonological
Representations
- Title(参考訳): 生成的敵対ネットワークが音韻表現の学習方法を探る
- Authors: Jingyi Chen and Micha Elsner
- Abstract要約: GAN(Generative Adversarial Networks)は、音韻現象の表現を学習する。
我々は、フランス語と英語の母音において、GANがコントラスト的および非コントラスト的鼻音をエンコードする方法を分析する。
- 参考スコア(独自算出の注目度): 6.119392435448723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores how Generative Adversarial Networks (GANs) learn
representations of phonological phenomena. We analyze how GANs encode
contrastive and non-contrastive nasality in French and English vowels by
applying the ciwGAN architecture (Begus 2021a). Begus claims that ciwGAN
encodes linguistically meaningful representations with categorical variables in
its latent space and manipulating the latent variables shows an almost one to
one corresponding control of the phonological features in ciwGAN's generated
outputs. However, our results show an interactive effect of latent variables on
the features in the generated outputs, which suggests the learned
representations in neural networks are different from the phonological
representations proposed by linguists. On the other hand, ciwGAN is able to
distinguish contrastive and noncontrastive features in English and French by
encoding them differently. Comparing the performance of GANs learning from
different languages results in a better understanding of what language specific
features contribute to developing language specific phonological
representations. We also discuss the role of training data frequencies in
phonological feature learning.
- Abstract(参考訳): 本稿では,GAN(Generative Adversarial Networks)が音韻現象の表現をどのように学習するかを考察する。
我々は, ciwGANアーキテクチャ(Begus 2021a)を適用して, フランス語と英語の母音のコントラスト的・非コントラスト的鼻音のエンコード方法を分析する(Begus 2021a)。
Begusは、ciwGANは言語的に意味のある表現を潜在空間のカテゴリー変数でエンコードし、潜在変数を操作することは、ciwGANが生成した出力の音韻学的特徴のほぼ1対1の制御を示すと主張している。
しかし, この結果から, ニューラルネットワークにおける学習表現は, 言語学者が提案した音声表現とは異なることが示唆された。
一方、ciwGANは、異なるエンコーディングによって、英語とフランス語のコントラスト的特徴と非コントラスト的特徴を区別することができる。
異なる言語から学習するganのパフォーマンスを比較することで、言語固有の特徴が言語固有の音韻表現の発展にどのように寄与するかをより理解することができる。
また,音韻特徴学習におけるデータ周波数の訓練について述べる。
関連論文リスト
- Encoding of lexical tone in self-supervised models of spoken language [3.7270979204213446]
本稿では,音声言語モデル(SLM)のトーン符号化機能の解析を目的とした。
SLMは、非音節言語からのデータに基づいて訓練された場合でも、語彙のトーンをかなりの程度にエンコードすることを示す。
SLMは音色や子音の知覚研究において、母国人や非母国人と同様に振る舞う。
論文 参考訳(メタデータ) (2024-03-25T15:28:38Z) - Deep Neural Convolutive Matrix Factorization for Articulatory
Representation Decomposition [48.56414496900755]
この研究は、コンボリューティブスパース行列分解のニューラル実装を用いて、調音データを解釈可能なジェスチャーとジェスチャースコアに分解する。
音素認識実験も実施され、ジェスチャースコアが実際に音韻情報のコード化に成功していることが示された。
論文 参考訳(メタデータ) (2022-04-01T14:25:19Z) - How Familiar Does That Sound? Cross-Lingual Representational Similarity
Analysis of Acoustic Word Embeddings [12.788276426899312]
本稿では、音響単語の埋め込み(AWE)を分析するために、表現類似性分析(RSA)に基づく新しい設計を提案する。
まず,類型的類似度の異なる7つのインド・ヨーロッパ語で単言語AWEモデルを訓練する。
次に、AWEを用いてネイティブおよび非ネイティブ音声単語処理をシミュレートし、言語間類似性を定量化するためにRSAを用いる。
論文 参考訳(メタデータ) (2021-09-21T13:51:39Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Low-Dimensional Structure in the Space of Language Representations is
Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。
この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。
これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T22:59:12Z) - Local and non-local dependency learning and emergence of rule-like
representations in speech data by Deep Convolutional Generative Adversarial
Networks [0.0]
本稿では、音声データにおける局所的および非局所的依存関係に対するGANのトレーニングは、ディープニューラルネットワークが連続データをどのように識別するかについての洞察を与える。
論文 参考訳(メタデータ) (2020-09-27T00:02:34Z) - Generative Adversarial Phonology: Modeling unsupervised phonetic and
phonological learning with neural networks [0.0]
音声データにおけるよく理解された依存関係に基づくディープニューラルネットワークのトレーニングは、内部表現の学習方法に関する新たな洞察を提供することができる。
本稿では, 音声の獲得を, 生成適応型ネットワークアーキテクチャにおけるランダム空間と生成した音声データ間の依存性としてモデル化することができることを論じる。
本稿では,音韻的・音韻的特性に対応するネットワークの内部表現を明らかにする手法を提案する。
論文 参考訳(メタデータ) (2020-06-06T20:31:23Z) - Linguistic Typology Features from Text: Inferring the Sparse Features of
World Atlas of Language Structures [73.06435180872293]
我々は、バイト埋め込みと畳み込み層に基づく繰り返しニューラルネットワーク予測器を構築する。
様々な言語型の特徴を確実に予測できることを示す。
論文 参考訳(メタデータ) (2020-04-30T21:00:53Z) - Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。
実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文 参考訳(メタデータ) (2020-04-29T03:34:53Z) - Probing Linguistic Features of Sentence-Level Representations in Neural
Relation Extraction [80.38130122127882]
ニューラルリレーション抽出(RE)に関連する言語特性を対象とした14の探索タスクを導入する。
私たちは、40以上の異なるエンコーダアーキテクチャと2つのデータセットでトレーニングされた言語的特徴の組み合わせによって学習された表現を研究するためにそれらを使用します。
アーキテクチャによって引き起こされるバイアスと言語的特徴の含意は、探索タスクのパフォーマンスにおいて明らかに表現されている。
論文 参考訳(メタデータ) (2020-04-17T09:17:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。