論文の概要: Neural text normalization leveraging similarities of strings and sounds
- arxiv url: http://arxiv.org/abs/2011.02173v1
- Date: Wed, 4 Nov 2020 08:24:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 22:04:38.204556
- Title: Neural text normalization leveraging similarities of strings and sounds
- Title(参考訳): 弦と音の類似性を利用したニューラルテキスト正規化
- Authors: Riku Kawamura, Tatsuya Aoki, Hidetaka Kamigaito, Hiroya Takamura and
Manabu Okumura
- Abstract要約: 単語文字列と音の類似性を考慮してテキストを正規化できるニューラルモデルを提案する。
本研究では,単語文字列と音の類似性を考慮したモデルと,類似性のないモデルをベースラインとして比較した。
- 参考スコア(独自算出の注目度): 39.56653477936092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose neural models that can normalize text by considering the
similarities of word strings and sounds. We experimentally compared a model
that considers the similarities of both word strings and sounds, a model that
considers only the similarity of word strings or of sounds, and a model without
the similarities as a baseline. Results showed that leveraging the word string
similarity succeeded in dealing with misspellings and abbreviations, and taking
into account the sound similarity succeeded in dealing with phonetic
substitutions and emphasized characters. So that the proposed models achieved
higher F$_1$ scores than the baseline.
- Abstract(参考訳): 単語列と音声の類似性を考慮してテキストを正規化できるニューラルモデルを提案する。
本研究では,単語文字列と音の類似性を考慮したモデルと,単語文字列と音の類似性のみを考慮したモデルと,類似性のないモデルをベースラインとして比較した。
その結果,文字列の類似性は誤発音や略語を扱うことに成功し,音声の類似性を考慮すると音韻置換や強調文字の扱いに成功していることがわかった。
提案モデルがベースラインよりも高いf$_1$スコアを達成した。
関連論文リスト
- Conjuring Semantic Similarity [59.18714889874088]
2つのテキスト表現間の意味的類似性は、潜伏者の「意味」の間の距離を測定する
テキスト表現間の意味的類似性は、他の表現を言い換えるのではなく、それらが引き起こすイメージに基づいている、という新しいアプローチを提案する。
提案手法は,人間の注釈付きスコアに適合するだけでなく,テキスト条件付き生成モデル評価のための新たな道を開く意味的類似性に関する新たな視点を提供する。
論文 参考訳(メタデータ) (2024-10-21T18:51:34Z) - Spoken Word2Vec: Learning Skipgram Embeddings from Speech [0.8901073744693314]
本研究では,入力単位が音響的に相関している場合に,スワップスキップグラムのようなアルゴリズムが分布意味論を符号化できないことを示す。
そこで本研究では,モデルのエンド・ツー・エンドの代替案の可能性を説明し,その結果の埋め込みへの影響について検討する。
論文 参考訳(メタデータ) (2023-11-15T19:25:29Z) - Description-Based Text Similarity [59.552704474862004]
我々は、その内容の抽象的な記述に基づいて、テキストを検索する必要性を特定する。
そこで本研究では,近隣の標準探索で使用する場合の精度を大幅に向上する代替モデルを提案する。
論文 参考訳(メタデータ) (2023-05-21T17:14:31Z) - Counting Like Human: Anthropoid Crowd Counting on Modeling the
Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は 密度マップを補強して 計数結果を得るために統合する。
これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-02T07:00:53Z) - SimRelUz: Similarity and Relatedness scores as a Semantic Evaluation
dataset for Uzbek language [0.0]
セマンティックモデル評価データセットSimRelUzを提案する。
データセットは、その形態的特徴に基づいて慎重に選択された1000組以上の単語から構成される。
また,まれな単語や語彙外単語を扱うという問題にも注意を払っている。
論文 参考訳(メタデータ) (2022-05-12T13:11:28Z) - Comparing in context: Improving cosine similarity measures with a metric
tensor [0.0]
コサイン類似性は、言語モデリングの目標に基づいて訓練された事前訓練された単語埋め込みの関連性の尺度として広く用いられている。
そこで我々は,そのタスクの性能向上のために,拡張されたコサイン類似度尺度を用いることを提案する。
我々は、文脈化メトリクスを学習し、標準コサイン類似度尺度を用いて得られた基準値と比較し、常に改善を示す。
また、SimLex-999 と WordSim-353 のコンテキスト化類似度尺度をトレーニングし、結果と対応するベースラインを比較し、これらのデータセットを学習した全コンテキスト類似度尺度の独立したテストセットとして使用する。
論文 参考訳(メタデータ) (2022-03-28T18:04:26Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - MNet-Sim: A Multi-layered Semantic Similarity Network to Evaluate
Sentence Similarity [0.0]
類似性(英: similarity)は、それが考慮される領域によって異なる比較目的測度である。
本稿では,複数の類似度に基づく多層意味類似性ネットワークモデルを提案する。
その結果, 文類似性の評価において, 性能スコアが向上していることが判明した。
論文 参考訳(メタデータ) (2021-11-09T20:43:18Z) - Using multiple reference audios and style embedding constraints for
speech synthesis [68.62945852651383]
提案モデルでは,複数の参照音声を用いて音声の自然さとコンテンツ品質を向上させることができる。
モデルは、スタイル類似性のABX選好テストにおいてベースラインモデルよりも優れている。
論文 参考訳(メタデータ) (2021-10-09T04:24:29Z) - Patterns of Lexical Ambiguity in Contextualised Language Models [9.747449805791092]
本稿では,単語感覚の類似度と共述度を拡張した,人間による注釈付きデータセットを提案する。
どちらの人間の判断も、多文解釈の類似性は意味の同一性とホモニミーの連続性にあることを示している。
我々のデータセットは、語彙的曖昧性の複雑さの大部分を捉えており、文脈的埋め込みのための現実的なテストベッドを提供することができる。
論文 参考訳(メタデータ) (2021-09-27T13:11:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。