論文の概要: Speech perception: a model of word recognition
- arxiv url: http://arxiv.org/abs/2410.18590v1
- Date: Thu, 24 Oct 2024 09:41:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:49:30.596950
- Title: Speech perception: a model of word recognition
- Title(参考訳): 音声認識 : 単語認識モデル
- Authors: Jean-Marc Luck, Anita Mehta,
- Abstract要約: 本稿では,音の相関効果を考慮した音声認識モデルを提案する。
このモデルの単語は、好適に選択された降下ダイナミクスの引力に対応する。
誤聴の有無で短い単語と長い単語を復号する方法について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We present a model of speech perception which takes into account effects of correlations between sounds. Words in this model correspond to the attractors of a suitably chosen descent dynamics. The resulting lexicon is rich in short words, and much less so in longer ones, as befits a reasonable word length distribution. We separately examine the decryption of short and long words in the presence of mishearings. In the regime of short words, the algorithm either quickly retrieves a word, or proposes another valid word. In the regime of longer words, the behaviour is markedly different. While the successful decryption of words continues to be relatively fast, there is a finite probability of getting lost permanently, as the algorithm wanders round the landscape of suitable words without ever settling on one.
- Abstract(参考訳): 本稿では,音の相関効果を考慮した音声認識モデルを提案する。
このモデルの単語は、好適に選択された降下ダイナミクスの引力に対応する。
結果として得られる語彙は短い単語に富み、より長い単語は、合理的な単語長の分布に適合するため、はるかに少ない。
誤聴の有無で短い単語と長い単語の復号を別々に検討する。
短い単語の体系では、アルゴリズムは素早く単語を検索するか、別の有効な単語を提案する。
長い言葉の体制では、その行動は著しく異なる。
単語の復号化が成功する確率は比較的速いが、アルゴリズムが適切な単語のランドスケープをさまよって1つに落ち着くことなく、永久に失われる確率は有限である。
関連論文リスト
- The Impact of Word Splitting on the Semantic Content of Contextualized
Word Representations [3.4668147567693453]
分割される単語の表現の質は、しばしば、必ずしも、既知の単語の埋め込みの質よりも悪いとは限らない。
分析の結果, 単語の表現の質は, 単語の埋め込みよりも必ずしも悪くはないことが明らかとなった。
論文 参考訳(メタデータ) (2024-02-22T15:04:24Z) - Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - Disambiguatory Signals are Stronger in Word-initial Positions [48.18148856974974]
単語の初期と後期のセグメントの情報を比較するための既存の手法の相違点を指摘する。
何百もの言語にまたがって、言葉で情報を読み込むという言語横断的な傾向があるという証拠が見つかりました。
論文 参考訳(メタデータ) (2021-02-03T18:19:16Z) - SubICap: Towards Subword-informed Image Captioning [37.42085521950802]
単語をより小さな構成単位「サブワード」に分解し、字幕を単語の代わりにサブワードの列として表現する。
本システムでは,学習語彙サイズをベースラインより約90%小さくすることで,様々な測定値を改善する。
論文 参考訳(メタデータ) (2020-12-24T06:10:36Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Hearings and mishearings: decrypting the spoken word [0.0]
本研究では,誤聴の有無を考慮した個々の単語の音声知覚モデルを提案する。
例えば、単語長がしきい値以下である場合には、音声知覚が容易であることを示し、静的な遷移で識別する。
我々はこれを単語認識の力学に拡張し、個別の孤立した誤聴と連続した誤聴のクラスタの区別を強調する直感的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-01T13:58:51Z) - Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。
OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。
本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文 参考訳(メタデータ) (2020-03-19T21:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。