Fugu-MT 論文翻訳(概要): Spoken Word2Vec: A Perspective And Some Techniques

論文の概要: Spoken Word2Vec: A Perspective And Some Techniques

arxiv url: http://arxiv.org/abs/2311.09319v1
Date: Wed, 15 Nov 2023 19:25:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-17 17:54:22.847191
Title: Spoken Word2Vec: A Perspective And Some Techniques
Title（参考訳）: Spoken Word2Vec: パースペクティブといくつかのテクニック
Authors: Mohammad Amaan Sayeed and Hanan Aldarmaki
Abstract要約: 分散意味的特徴を符号化するテキストワード埋め込みは、頻繁に発生する単語の文脈的類似性をモデル化することによって機能する。一方、音響単語の埋め込みは、典型的には低レベル音韻類似性を符号化する。入力単位が音響的に相関している場合、Word2Vecアルゴリズムが分布意味論を符号化できないことを示す。
参考スコア（独自算出の注目度）: 1.0515439489916731
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Text word embeddings that encode distributional semantic features work by modeling contextual similarities of frequently occurring words. Acoustic word embeddings, on the other hand, typically encode low-level phonetic similarities. Semantic embeddings for spoken words have been previously explored using similar algorithms to Word2Vec, but the resulting vectors still mainly encoded phonetic rather than semantic features. In this paper, we examine the assumptions and architectures used in previous works and show experimentally how Word2Vec algorithms fail to encode distributional semantics when the input units are acoustically correlated. In addition, previous works relied on the simplifying assumptions of perfect word segmentation and clustering by word type. Given these conditions, a trivial solution identical to text-based embeddings has been overlooked. We follow this simpler path using automatic word type clustering and examine the effects on the resulting embeddings, highlighting the true challenges in this task.
Abstract（参考訳）: 分布的意味特徴をエンコードするテキスト単語埋め込みは、頻繁に発生する単語の文脈的類似性をモデル化することで機能する。一方、音響単語の埋め込みは通常低レベル音韻類似性を符号化する。音声単語のセマンティック埋め込みは、これまでWord2Vecと同様のアルゴリズムを用いて検討されてきたが、結果として得られるベクターは主に意味的特徴ではなく音声に符号化されている。本稿では,先行研究における仮定とアーキテクチャを考察し,入力単位が音響的相関関係にある場合,word2vecアルゴリズムが分布的意味論をいかにエンコードしなかったかを実験的に示す。さらに,従来の研究は,単語タイプによる単語分割とクラスタリングの簡易化に頼っていた。これらの条件から、テキストベースの埋め込みと同一の自明な解決法が見過ごされている。自動単語型クラスタリングを用いてこの簡単な経路を辿り、その結果の埋め込みへの影響を調べ、このタスクの真の課題を強調します。

関連論文リスト

Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文参考訳（メタデータ） (2025-05-26T07:21:20Z)
Sub-Sentence Encoder: Contrastive Learning of Propositional Semantic Representations [102.05351905494277]
サブ文エンコーダ(Sub-sentence encoder)は、テキストの微細な意味表現のためのコンテクスト埋め込みモデルである。文エンコーダと比較して,サブ文エンコーダは推論コストと空間複雑さのレベルが同じであることを示す。
論文参考訳（メタデータ） (2023-11-07T20:38:30Z)
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations [80.45474362071236]
文の合成意味論が埋め込み空間における構成操作として直接反映できるかどうかは不明である。文埋め込み学習のためのエンドツーエンドフレームワークであるInterSentを提案する。
論文参考訳（メタデータ） (2023-05-24T00:44:49Z)
Lexical semantics enhanced neural word embeddings [4.040491121427623]
階層的適合は、IS-A階層に本質的に格納されている意味的類似性ニュアンスをモデル化するための新しいアプローチである。その結果、後期核融合における意味的関係を持つ神経埋め込みを専門とする階層化の有効性が示された。
論文参考訳（メタデータ） (2022-10-03T08:10:23Z)
Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文参考訳（メタデータ） (2022-05-26T13:26:03Z)
Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文参考訳（メタデータ） (2021-10-04T03:59:15Z)
Phonetic Word Embeddings [1.2192936362342826]
本稿では,人間の音知覚からモチベーションを受ける単語間の音声的類似性を計算するための新しい手法を提案する。この計量は、類似の発声語をまとめる連続ベクトル埋め込み空間を学ぶために用いられる。本手法の有効性を2つの異なる言語(ヒンディー語、ヒンディー語)で示し、過去の報告よりも高い性能を示した。
論文参考訳（メタデータ） (2021-09-30T01:46:01Z)
A comprehensive empirical analysis on cross-domain semantic enrichment for detection of depressive language [0.9749560288448115]
まず、大規模な汎用データセットから事前トレーニングされたリッチな単語の埋め込みから始め、シンプルな非線形マッピングメカニズムを通じて、はるかに小さく、より特定のドメインデータセットから学んだ埋め込みで拡張します。単語の埋め込み表現は,高品質なデータセットに適用した場合に,他よりもはるかに優れたF1スコアが得られることを示す。
論文参考訳（メタデータ） (2021-06-24T07:15:09Z)
SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。 SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文参考訳（メタデータ） (2020-12-02T23:56:34Z)
A Comparative Study on Structural and Semantic Properties of Sentence Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文参考訳（メタデータ） (2020-09-23T15:45:32Z)
Comparative Analysis of Word Embeddings for Capturing Word Similarities [0.0]
分散言語表現は、様々な自然言語処理タスクにおいて、言語表現において最も広く使われている技術となっている。ディープラーニング技術に基づく自然言語処理モデルのほとんどは、単語埋め込みと呼ばれる、すでに訓練済みの分散単語表現を使用している。適切な単語の埋め込みを選択することは複雑な作業ですなぜなら、投影された埋め込み空間は人間にとって直感的ではないからです
論文参考訳（メタデータ） (2020-05-08T01:16:03Z)
Analyzing autoencoder-based acoustic word embeddings [37.78342106714364]
音響単語埋め込み(AWEs)は、その音響的特徴を符号化した単語の表現である。本研究では,6言語でシーケンス・ツー・シーケンス・エンコーダ・デコーダモデルにより学習したAWE空間の基本特性を解析する。 AWEは、人間の音声処理と語彙アクセスに関する様々な研究で報告されたパターンと同様、単語の発症バイアスを示す。
論文参考訳（メタデータ） (2020-04-03T16:11:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。