論文の概要: How Does That Sound? Multi-Language SpokenName2Vec Algorithm Using
Speech Generation and Deep Learning
- arxiv url: http://arxiv.org/abs/2005.11838v2
- Date: Tue, 21 Jul 2020 18:20:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 13:40:58.527574
- Title: How Does That Sound? Multi-Language SpokenName2Vec Algorithm Using
Speech Generation and Deep Learning
- Title(参考訳): どう聞こえるか?
音声生成と深層学習を用いた多言語 SpokenName2Vec アルゴリズム
- Authors: Aviad Elyashar, Rami Puzis, Michael Fire
- Abstract要約: SpokenName2Vecは、同様の名前提案問題に対処する、新しくて汎用的なアプローチである。
提案手法は25万のフォアネームからなる大規模データセット上で実証された。
提案手法の性能は,本研究で評価した他の10種類のアルゴリズムよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 4.769747792846004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Searching for information about a specific person is an online activity
frequently performed by many users. In most cases, users are aided by queries
containing a name and sending back to the web search engines for finding their
will. Typically, Web search engines provide just a few accurate results
associated with a name-containing query. Currently, most solutions for
suggesting synonyms in online search are based on pattern matching and phonetic
encoding, however very often, the performance of such solutions is less than
optimal. In this paper, we propose SpokenName2Vec, a novel and generic approach
which addresses the similar name suggestion problem by utilizing automated
speech generation, and deep learning to produce spoken name embeddings. This
sophisticated and innovative embeddings captures the way people pronounce names
in any language and accent. Utilizing the name pronunciation can be helpful for
both differentiating and detecting names that sound alike, but are written
differently. The proposed approach was demonstrated on a large-scale dataset
consisting of 250,000 forenames and evaluated using a machine learning
classifier and 7,399 names with their verified synonyms. The performance of the
proposed approach was found to be superior to 10 other algorithms evaluated in
this study, including well used phonetic and string similarity algorithms, and
two recently proposed algorithms. The results obtained suggest that the
proposed approach could serve as a useful and valuable tool for solving the
similar name suggestion problem.
- Abstract(参考訳): 特定の人物に関する情報を探すことは、多くのユーザーが頻繁に行うオンライン活動である。
ほとんどの場合、ユーザは名前を含むクエリに助けられ、自分の意志を見つけるためにWeb検索エンジンに送信される。
通常、Web検索エンジンは、名前を含むクエリに関連するいくつかの正確な結果を提供する。
現在、オンライン検索における同義語を提案するソリューションのほとんどはパターンマッチングと音声エンコーディングに基づいているが、そのようなソリューションのパフォーマンスは最適ではないことが多い。
本稿では,音声の自動生成による類似名提案問題に対処する新規で汎用的なアプローチである SpokenName2Vec と,音声名埋め込みの深層学習を提案する。
この洗練された革新的な埋め込みは、人々がどんな言語でも名前やアクセントを発音する方法を捉えている。
名前の発音を利用すると、似た名前の区別と検出の両方に役立ちますが、異なる書き方をします。
提案手法は,25万のフォアネームからなる大規模データセットを用いて,機械学習分類器と7,399名の同義語を用いた評価を行った。
提案手法の性能は,よく使われている音素・文字列の類似性アルゴリズムや最近提案された2つのアルゴリズムなど,他の10のアルゴリズムよりも優れていることが判明した。
その結果,提案手法は類似名提案問題の解決に有用かつ有用なツールである可能性が示唆された。
関連論文リスト
- VacancySBERT: the approach for representation of titles and skills for
semantic similarity search in the recruitment domain [0.0]
本稿では、HRドメインに適用されたディープラーニングセマンティックサーチアルゴリズムに焦点を当てた。
この記事の目的は、求人広告で言及されているスキルとタイトルを結びつけるために、シームズネットワークをトレーニングする新しいアプローチを開発することである。
論文 参考訳(メタデータ) (2023-07-31T13:21:15Z) - SpellMapper: A non-autoregressive neural spellchecker for ASR
customization with candidate retrieval based on n-gram mappings [76.87664008338317]
文脈スペル補正モデルは、音声認識を改善するために浅い融合に代わるものである。
ミススペルn-gramマッピングに基づく候補探索のための新しいアルゴリズムを提案する。
Spoken Wikipediaの実験では、ベースラインのASRシステムに比べて21.4%のワードエラー率の改善が見られた。
論文 参考訳(メタデータ) (2023-06-04T10:00:12Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Unified Functional Hashing in Automatic Machine Learning [58.77232199682271]
高速に統一された関数型ハッシュを用いることで,大きな効率向上が得られることを示す。
私たちのハッシュは"機能的"であり、表現やコードが異なる場合でも同等の候補を識別します。
ニューラルアーキテクチャ検索やアルゴリズム発見など、複数のAutoMLドメインで劇的な改善がなされている。
論文 参考訳(メタデータ) (2023-02-10T18:50:37Z) - Keyword Embeddings for Query Suggestion [3.7900158137749322]
本稿では,科学文献に基づいて学習したキーワード提案タスクのための2つの新しいモデルを提案する。
我々の手法はWord2VecとFastTextのアーキテクチャに適応し、文書のキーワード共起を利用してキーワード埋め込みを生成する。
我々は,タスクのベースラインよりも大幅に改善された,最先端の単語と文の埋め込みモデルに対する提案を評価した。
論文 参考訳(メタデータ) (2023-01-19T11:13:04Z) - On the Efficiency of Integrating Self-supervised Learning and
Meta-learning for User-defined Few-shot Keyword Spotting [51.41426141283203]
ユーザ定義キーワードスポッティングは、ユーザが定義する新しい音声用語を検出するタスクである。
これまでの研究は、自己教師付き学習モデルを取り入れたり、メタ学習アルゴリズムを適用しようとするものだった。
この結果から,HuBERTとMatching Networkを組み合わせることで,最適な結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-04-01T10:59:39Z) - Algorithm Selection on a Meta Level [58.720142291102135]
本稿では,与えられたアルゴリズムセレクタの組み合わせに最適な方法を求めるメタアルゴリズム選択の問題を紹介する。
本稿では,メタアルゴリズム選択のための一般的な方法論フレームワークと,このフレームワークのインスタンス化として具体的な学習手法を提案する。
論文 参考訳(メタデータ) (2021-07-20T11:23:21Z) - Towards Meta-Algorithm Selection [78.13985819417974]
インスタンス固有のアルゴリズム選択(AS)は、固定された候補集合からのアルゴリズムの自動選択を扱う。
メタアルゴリズムの選択は、いくつかのケースで有益であることを示す。
論文 参考訳(メタデータ) (2020-11-17T17:27:33Z) - Class LM and word mapping for contextual biasing in End-to-End ASR [4.989480853499918]
近年、オールニューラル・エンド・ツー・エンド(E2E)ASRシステムは音声認識コミュニティに急速に関心を寄せている。
本稿では,コンテキスト認識型E2Eモデルの学習アルゴリズムを提案する。
E2Eモデルは発音辞書を必要としないが、既存の発音知識を利用して精度を向上させることは興味深い。
論文 参考訳(メタデータ) (2020-07-10T20:58:44Z) - Research on Annotation Rules and Recognition Algorithm Based on Phrase
Window [4.334276223622026]
フレーズウィンドウに基づくラベリングルールを提案し,それに対応するフレーズ認識アルゴリズムを設計する。
ラベル付けルールでは、フレーズを最小単位とし、文を7種類のネスト可能なフレーズタイプに分割し、フレーズ間の文法的依存関係を示す。
対応するアルゴリズムは、画像中の対象領域を識別するアイデアに基づいて、文中の様々なフレーズの開始位置と終了位置を見つけることができる。
論文 参考訳(メタデータ) (2020-07-07T00:19:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。