論文の概要: Neural text normalization leveraging similarities of strings and sounds
- arxiv url: http://arxiv.org/abs/2011.02173v1
- Date: Wed, 4 Nov 2020 08:24:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 22:04:38.204556
- Title: Neural text normalization leveraging similarities of strings and sounds
- Title(参考訳): 弦と音の類似性を利用したニューラルテキスト正規化
- Authors: Riku Kawamura, Tatsuya Aoki, Hidetaka Kamigaito, Hiroya Takamura and
Manabu Okumura
- Abstract要約: 単語文字列と音の類似性を考慮してテキストを正規化できるニューラルモデルを提案する。
本研究では,単語文字列と音の類似性を考慮したモデルと,類似性のないモデルをベースラインとして比較した。
- 参考スコア(独自算出の注目度): 39.56653477936092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose neural models that can normalize text by considering the
similarities of word strings and sounds. We experimentally compared a model
that considers the similarities of both word strings and sounds, a model that
considers only the similarity of word strings or of sounds, and a model without
the similarities as a baseline. Results showed that leveraging the word string
similarity succeeded in dealing with misspellings and abbreviations, and taking
into account the sound similarity succeeded in dealing with phonetic
substitutions and emphasized characters. So that the proposed models achieved
higher F$_1$ scores than the baseline.
- Abstract(参考訳): 単語列と音声の類似性を考慮してテキストを正規化できるニューラルモデルを提案する。
本研究では,単語文字列と音の類似性を考慮したモデルと,単語文字列と音の類似性のみを考慮したモデルと,類似性のないモデルをベースラインとして比較した。
その結果,文字列の類似性は誤発音や略語を扱うことに成功し,音声の類似性を考慮すると音韻置換や強調文字の扱いに成功していることがわかった。
提案モデルがベースラインよりも高いf$_1$スコアを達成した。
関連論文リスト
- Rethinking Word Similarity: Semantic Similarity through Classification Confusion [31.12253159483973]
本稿では,特徴に基づく分類の混乱という観点から意味的類似性を再編成する,類似性の新たな尺度,Word Confusionを提案する。
提案手法は,複数のデータセットにまたがる人間の類似性判定におけるコサイン類似性に匹敵するものである。
フランスの「革命」という言葉の18世紀における変化に関する仮説を検証するために、我々のモデルが動的特徴を活用できることを実証する。
論文 参考訳(メタデータ) (2025-02-08T21:55:38Z) - Gumbel Counterfactual Generation From Language Models [64.55296662926919]
対実的推論が介入と概念的に異なることを示す。
そこで本研究では,真の文字列反事実を生成するためのフレームワークを提案する。
提案手法は,従来の介入手法が望ましくない副作用を有意に生み出しているのに対し,本手法は有意義な反事実を生じさせることを示す。
論文 参考訳(メタデータ) (2024-11-11T17:57:30Z) - Conjuring Semantic Similarity [59.18714889874088]
2つのテキスト表現間の意味的類似性は、潜伏者の「意味」の間の距離を測定する
テキスト表現間の意味的類似性は、他の表現を言い換えるのではなく、それらが引き起こすイメージに基づいている、という新しいアプローチを提案する。
提案手法は,人間の注釈付きスコアに適合するだけでなく,テキスト条件付き生成モデル評価のための新たな道を開く意味的類似性に関する新たな視点を提供する。
論文 参考訳(メタデータ) (2024-10-21T18:51:34Z) - Spoken Word2Vec: Learning Skipgram Embeddings from Speech [0.8901073744693314]
本研究では,入力単位が音響的に相関している場合に,スワップスキップグラムのようなアルゴリズムが分布意味論を符号化できないことを示す。
そこで本研究では,モデルのエンド・ツー・エンドの代替案の可能性を説明し,その結果の埋め込みへの影響について検討する。
論文 参考訳(メタデータ) (2023-11-15T19:25:29Z) - Description-Based Text Similarity [59.552704474862004]
我々は、その内容の抽象的な記述に基づいて、テキストを検索する必要性を特定する。
そこで本研究では,近隣の標準探索で使用する場合の精度を大幅に向上する代替モデルを提案する。
論文 参考訳(メタデータ) (2023-05-21T17:14:31Z) - SimRelUz: Similarity and Relatedness scores as a Semantic Evaluation
dataset for Uzbek language [0.0]
セマンティックモデル評価データセットSimRelUzを提案する。
データセットは、その形態的特徴に基づいて慎重に選択された1000組以上の単語から構成される。
また,まれな単語や語彙外単語を扱うという問題にも注意を払っている。
論文 参考訳(メタデータ) (2022-05-12T13:11:28Z) - Comparing in context: Improving cosine similarity measures with a metric
tensor [0.0]
コサイン類似性は、言語モデリングの目標に基づいて訓練された事前訓練された単語埋め込みの関連性の尺度として広く用いられている。
そこで我々は,そのタスクの性能向上のために,拡張されたコサイン類似度尺度を用いることを提案する。
我々は、文脈化メトリクスを学習し、標準コサイン類似度尺度を用いて得られた基準値と比較し、常に改善を示す。
また、SimLex-999 と WordSim-353 のコンテキスト化類似度尺度をトレーニングし、結果と対応するベースラインを比較し、これらのデータセットを学習した全コンテキスト類似度尺度の独立したテストセットとして使用する。
論文 参考訳(メタデータ) (2022-03-28T18:04:26Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - Using multiple reference audios and style embedding constraints for
speech synthesis [68.62945852651383]
提案モデルでは,複数の参照音声を用いて音声の自然さとコンテンツ品質を向上させることができる。
モデルは、スタイル類似性のABX選好テストにおいてベースラインモデルよりも優れている。
論文 参考訳(メタデータ) (2021-10-09T04:24:29Z) - Patterns of Lexical Ambiguity in Contextualised Language Models [9.747449805791092]
本稿では,単語感覚の類似度と共述度を拡張した,人間による注釈付きデータセットを提案する。
どちらの人間の判断も、多文解釈の類似性は意味の同一性とホモニミーの連続性にあることを示している。
我々のデータセットは、語彙的曖昧性の複雑さの大部分を捉えており、文脈的埋め込みのための現実的なテストベッドを提供することができる。
論文 参考訳(メタデータ) (2021-09-27T13:11:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。