論文の概要: Low-Level Physiological Implications of End-to-End Learning of Speech
Recognition
- arxiv url: http://arxiv.org/abs/2208.11700v1
- Date: Mon, 22 Aug 2022 13:10:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-26 13:54:19.346309
- Title: Low-Level Physiological Implications of End-to-End Learning of Speech
Recognition
- Title(参考訳): 音声認識のエンドツーエンド学習における低レベル生理学的意義
- Authors: Louise Coppieters de Gibson, Philip N. Garner
- Abstract要約: 現在の音声認識アーキテクチャは、機械学習の観点から非常によく機能している。
我々は,この推論が生物学的システムに対する洞察を与えるために逆転できるかどうかを考察する。
我々は、このプロセスをニューラルネットワークでエミュレートできるように、標準的な機械学習アーキテクチャを変更する必要があることを示す。
- 参考スコア(独自算出の注目度): 14.567354306568296
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Current speech recognition architectures perform very well from the point of
view of machine learning, hence user interaction. This suggests that they are
emulating the human biological system well. We investigate whether the
inference can be inverted to provide insights into that biological system; in
particular the hearing mechanism. Using SincNet, we confirm that end-to-end
systems do learn well known filterbank structures. However, we also show that
wider band-width filters are important in the learned structure. Whilst some
benefits can be gained by initialising both narrow and wide-band filters,
physiological constraints suggest that such filters arise in mid-brain rather
than the cochlea. We show that standard machine learning architectures must be
modified to allow this process to be emulated neurally.
- Abstract(参考訳): 現在の音声認識アーキテクチャは、機械学習の観点から非常によく機能するので、ユーザーとのインタラクションが可能です。
これは、人間の生体システムをうまくエミュレートしていることを示している。
本研究は,その生物学的システム,特に聴覚機構に関する洞察を提供するために,逆推定が可能かどうかを検討する。
SincNetを用いて、エンド・ツー・エンドのシステムがよく知られたフィルタバンク構造を学習できることを確認する。
しかし,より広い帯域幅のフィルタが学習構造において重要であることを示す。
狭帯域フィルタと広帯域フィルタの両方を初期化することでいくつかの利点を得ることができるが、生理的制約は、そのようなフィルターが人工内耳ではなく中脳で発生することを示唆している。
我々は、このプロセスを神経的にエミュレートできるように、標準的な機械学習アーキテクチャを変更する必要があることを示します。
関連論文リスト
- Architecture of a Cortex Inspired Hierarchical Event Recaller [0.0]
本稿では、複雑なパターンの教師なし連続文脈依存学習に焦点を当てた機械学習(ML)に対する新しいアプローチを提案する。
複雑な時間系列を同定し、予測できる合成構造を定義し、実験的に検証する。
概念実証として, 提案システムでは, 事前知識を伴わずに, 人間の発話のような極めて複雑な時系列を学習し, 識別し, 予測できることが示されている。
論文 参考訳(メタデータ) (2024-05-03T09:36:16Z) - Probing the Information Encoded in Neural-based Acoustic Models of
Automatic Speech Recognition Systems [7.207019635697126]
本稿では,自動音声認識音響モデル(AM)における情報の位置と位置を決定することを目的とする。
話者検証,音響環境分類,性別分類,テンポ歪検出システム,音声感情・感情識別について実験を行った。
分析の結果、ニューラルベースAMは驚くほど音素認識と無関係に思える異種情報を持っていることがわかった。
論文 参考訳(メタデータ) (2024-02-29T18:43:53Z) - Brain-Inspired Machine Intelligence: A Survey of
Neurobiologically-Plausible Credit Assignment [65.268245109828]
本稿では,神経生物学にインスパイアされた,あるいは動機付けられた人工ニューラルネットワークにおける信用割当を行うアルゴリズムについて検討する。
我々は、脳にインスパイアされた学習スキームを6つの一般的なファミリーにまとめ、これらを誤りのバックプロパゲーションの文脈で検討する。
本研究の成果は,神経ミメティックシステムとその構成的学習プロセスの今後の発展を促進することを目的としている。
論文 参考訳(メタデータ) (2023-12-01T05:20:57Z) - Adaptive Topological Feature via Persistent Homology: Filtration
Learning for Point Clouds [13.098609653951893]
ニューラルネットワークを用いてフィルタを適応的に学習するフレームワークを提案する。
フィルタ関数の有限次元近似に関する理論的結果を示し,提案したネットワークアーキテクチャを正当化する。
論文 参考訳(メタデータ) (2023-07-18T13:43:53Z) - The Predictive Forward-Forward Algorithm [79.07468367923619]
本稿では,ニューラルネットワークにおける信頼割当を行うための予測フォワード(PFF)アルゴリズムを提案する。
我々は,有向生成回路と表現回路を同時に同時に学習する,新しい動的リカレントニューラルネットワークを設計する。
PFFは効率よく学習し、学習信号を伝達し、フォワードパスのみでシナプスを更新する。
論文 参考訳(メタデータ) (2023-01-04T05:34:48Z) - Dynamic Inference with Neural Interpreters [72.90231306252007]
本稿では,モジュールシステムとしての自己アテンションネットワークにおける推論を分解するアーキテクチャであるNeural Interpretersを提案する。
モデルへの入力は、エンドツーエンドの学習方法で一連の関数を通してルーティングされる。
ニューラル・インタープリタは、より少ないパラメータを用いて視覚変換器と同等に動作し、サンプル効率で新しいタスクに転送可能であることを示す。
論文 参考訳(メタデータ) (2021-10-12T23:22:45Z) - Learning Versatile Convolution Filters for Efficient Visual Recognition [125.34595948003745]
本稿では,効率的な畳み込みニューラルネットワーク構築のための多目的フィルタを提案する。
本稿では,ネットワークの複雑性に関する理論的解析を行い,効率的な畳み込み手法を提案する。
ベンチマークデータセットとニューラルネットワークの実験結果は、我々の汎用フィルタが元のフィルタと同等の精度を達成できることを実証している。
論文 参考訳(メタデータ) (2021-09-20T06:07:14Z) - Ten Quick Tips for Deep Learning in Biology [116.78436313026478]
機械学習は、データのパターンを認識し、予測モデリングに使用するアルゴリズムの開発と応用に関係している。
ディープラーニングは、独自の機械学習のサブフィールドになっている。
生物学的研究の文脈において、ディープラーニングは高次元の生物学的データから新しい洞察を導き出すためにますます使われてきた。
論文 参考訳(メタデータ) (2021-05-29T21:02:44Z) - PyTorch-Hebbian: facilitating local learning in a deep learning
framework [67.67299394613426]
ヘビーンの局所学習は、バックプロパゲーションの代替の訓練メカニズムとしての可能性を示している。
本稿では,既存のディープラーニングパイプラインにおける局所学習ルールの網羅的かつ体系的な評価のための枠組みを提案する。
このフレームワークは、Krotov-Hopfield学習規則を精度を犠牲にすることなく標準の畳み込みニューラルネットワークに拡張するために使用される。
論文 参考訳(メタデータ) (2021-01-31T10:53:08Z) - End-to-End Auditory Object Recognition via Inception Nucleus [7.22898229765707]
生波形入力を音響クラスラベルにマッピングする,新しいエンドツーエンドのディープニューラルネットワークを提案する。
私たちのネットワークには、ハエの畳み込みフィルタのサイズを最適化する「開始核」が含まれています。
論文 参考訳(メタデータ) (2020-05-25T16:08:41Z) - Boolean learning under noise-perturbations in hardware neural networks [0.0]
ノイズは収束中にシステムの経路を強く変更し,最終的な読み出し重量行列を驚くほど完全にデコレーションすることがわかった。
これは、相互作用するプレイヤーとしてのアーキテクチャ、ノイズ、学習アルゴリズムを理解することの重要性を強調している。
論文 参考訳(メタデータ) (2020-03-27T10:36:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。