Fugu-MT 論文翻訳(概要): Neural text normalization leveraging similarities of strings and sounds

論文の概要: Neural text normalization leveraging similarities of strings and sounds

arxiv url: http://arxiv.org/abs/2011.02173v1
Date: Wed, 4 Nov 2020 08:24:05 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-29 22:04:38.204556
Title: Neural text normalization leveraging similarities of strings and sounds
Title（参考訳）: 弦と音の類似性を利用したニューラルテキスト正規化
Authors: Riku Kawamura, Tatsuya Aoki, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura
Abstract要約: 単語文字列と音の類似性を考慮してテキストを正規化できるニューラルモデルを提案する。本研究では,単語文字列と音の類似性を考慮したモデルと,類似性のないモデルをベースラインとして比較した。
参考スコア（独自算出の注目度）: 39.56653477936092
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose neural models that can normalize text by considering the similarities of word strings and sounds. We experimentally compared a model that considers the similarities of both word strings and sounds, a model that considers only the similarity of word strings or of sounds, and a model without the similarities as a baseline. Results showed that leveraging the word string similarity succeeded in dealing with misspellings and abbreviations, and taking into account the sound similarity succeeded in dealing with phonetic substitutions and emphasized characters. So that the proposed models achieved higher F$_1$ scores than the baseline.
Abstract（参考訳）: 単語列と音声の類似性を考慮してテキストを正規化できるニューラルモデルを提案する。本研究では,単語文字列と音の類似性を考慮したモデルと,単語文字列と音の類似性のみを考慮したモデルと,類似性のないモデルをベースラインとして比較した。その結果,文字列の類似性は誤発音や略語を扱うことに成功し,音声の類似性を考慮すると音韻置換や強調文字の扱いに成功していることがわかった。提案モデルがベースラインよりも高いf$_1$スコアを達成した。

関連論文リスト

Rethinking Word Similarity: Semantic Similarity through Classification Confusion [31.12253159483973]
本稿では,特徴に基づく分類の混乱という観点から意味的類似性を再編成する,類似性の新たな尺度,Word Confusionを提案する。提案手法は,複数のデータセットにまたがる人間の類似性判定におけるコサイン類似性に匹敵するものである。フランスの「革命」という言葉の18世紀における変化に関する仮説を検証するために、我々のモデルが動的特徴を活用できることを実証する。
論文参考訳（メタデータ） (2025-02-08T21:55:38Z)
Conjuring Semantic Similarity [59.18714889874088]
2つのテキスト表現間の意味的類似性は、潜伏者の「意味」の間の距離を測定するテキスト表現間の意味的類似性は、他の表現を言い換えるのではなく、それらが引き起こすイメージに基づいている、という新しいアプローチを提案する。提案手法は,人間の注釈付きスコアに適合するだけでなく,テキスト条件付き生成モデル評価のための新たな道を開く意味的類似性に関する新たな視点を提供する。
論文参考訳（メタデータ） (2024-10-21T18:51:34Z)
Spoken Word2Vec: Learning Skipgram Embeddings from Speech [0.8901073744693314]
本研究では,入力単位が音響的に相関している場合に,スワップスキップグラムのようなアルゴリズムが分布意味論を符号化できないことを示す。そこで本研究では,モデルのエンド・ツー・エンドの代替案の可能性を説明し,その結果の埋め込みへの影響について検討する。
論文参考訳（メタデータ） (2023-11-15T19:25:29Z)
Description-Based Text Similarity [59.552704474862004]
我々は、その内容の抽象的な記述に基づいて、テキストを検索する必要性を特定する。そこで本研究では,近隣の標準探索で使用する場合の精度を大幅に向上する代替モデルを提案する。
論文参考訳（メタデータ） (2023-05-21T17:14:31Z)
Counting Like Human: Anthropoid Crowd Counting on Modeling the Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は密度マップを補強して計数結果を得るために統合する。これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文参考訳（メタデータ） (2022-12-02T07:00:53Z)
SimRelUz: Similarity and Relatedness scores as a Semantic Evaluation dataset for Uzbek language [0.0]
セマンティックモデル評価データセットSimRelUzを提案する。データセットは、その形態的特徴に基づいて慎重に選択された1000組以上の単語から構成される。また,まれな単語や語彙外単語を扱うという問題にも注意を払っている。
論文参考訳（メタデータ） (2022-05-12T13:11:28Z)
Comparing in context: Improving cosine similarity measures with a metric tensor [0.0]
コサイン類似性は、言語モデリングの目標に基づいて訓練された事前訓練された単語埋め込みの関連性の尺度として広く用いられている。そこで我々は,そのタスクの性能向上のために,拡張されたコサイン類似度尺度を用いることを提案する。我々は、文脈化メトリクスを学習し、標準コサイン類似度尺度を用いて得られた基準値と比較し、常に改善を示す。また、SimLex-999 と WordSim-353 のコンテキスト化類似度尺度をトレーニングし、結果と対応するベースラインを比較し、これらのデータセットを学習した全コンテキスト類似度尺度の独立したテストセットとして使用する。
論文参考訳（メタデータ） (2022-03-28T18:04:26Z)
Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。 CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文参考訳（メタデータ） (2022-03-28T17:35:31Z)
MNet-Sim: A Multi-layered Semantic Similarity Network to Evaluate Sentence Similarity [0.0]
類似性(英: similarity)は、それが考慮される領域によって異なる比較目的測度である。本稿では,複数の類似度に基づく多層意味類似性ネットワークモデルを提案する。その結果, 文類似性の評価において, 性能スコアが向上していることが判明した。
論文参考訳（メタデータ） (2021-11-09T20:43:18Z)
Using multiple reference audios and style embedding constraints for speech synthesis [68.62945852651383]
提案モデルでは,複数の参照音声を用いて音声の自然さとコンテンツ品質を向上させることができる。モデルは、スタイル類似性のABX選好テストにおいてベースラインモデルよりも優れている。
論文参考訳（メタデータ） (2021-10-09T04:24:29Z)
Patterns of Lexical Ambiguity in Contextualised Language Models [9.747449805791092]
本稿では,単語感覚の類似度と共述度を拡張した,人間による注釈付きデータセットを提案する。どちらの人間の判断も、多文解釈の類似性は意味の同一性とホモニミーの連続性にあることを示している。我々のデータセットは、語彙的曖昧性の複雑さの大部分を捉えており、文脈的埋め込みのための現実的なテストベッドを提供することができる。
論文参考訳（メタデータ） (2021-09-27T13:11:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。