論文の概要: A convolutional neural-network model of human cochlear mechanics and
filter tuning for real-time applications
- arxiv url: http://arxiv.org/abs/2004.14832v4
- Date: Fri, 4 Dec 2020 20:08:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 05:43:49.269372
- Title: A convolutional neural-network model of human cochlear mechanics and
filter tuning for real-time applications
- Title(参考訳): リアルタイム応用のためのヒト人工内耳力学の畳み込みニューラルネットワークモデルとフィルタチューニング
- Authors: Deepak Baby, Arthur Van Den Broucke, Sarah Verhulst
- Abstract要約: 本稿では,畳み込みニューラルネットワークと計算神経科学を組み合わせるハイブリッドアプローチを提案する。
CoNNearモデルは、ヒトの人工内耳周波数選択率とその音響強度依存性を正確にシミュレートする。
これらのユニークなCNNear機能は、次世代のヒューマンライクな機械学習アプリケーションを可能にする。
- 参考スコア(独自算出の注目度): 11.086440815804226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Auditory models are commonly used as feature extractors for automatic
speech-recognition systems or as front-ends for robotics, machine-hearing and
hearing-aid applications. Although auditory models can capture the biophysical
and nonlinear properties of human hearing in great detail, these biophysical
models are computationally expensive and cannot be used in real-time
applications. We present a hybrid approach where convolutional neural networks
are combined with computational neuroscience to yield a real-time end-to-end
model for human cochlear mechanics, including level-dependent filter tuning
(CoNNear). The CoNNear model was trained on acoustic speech material and its
performance and applicability were evaluated using (unseen) sound stimuli
commonly employed in cochlear mechanics research. The CoNNear model accurately
simulates human cochlear frequency selectivity and its dependence on sound
intensity, an essential quality for robust speech intelligibility at negative
speech-to-background-noise ratios. The CoNNear architecture is based on
parallel and differentiable computations and has the power to achieve real-time
human performance. These unique CoNNear features will enable the next
generation of human-like machine-hearing applications.
- Abstract(参考訳): 聴覚モデルは、自動音声認識システムのための特徴抽出器や、ロボット工学、機械聴取、補聴器のフロントエンドとして一般的に用いられている。
聴覚モデルは人間の聴覚の生体物理学的および非線形的特性を非常に詳細に捉えることができるが、これらの生体物理学モデルは計算コストが高く、リアルタイム応用には使用できない。
本稿では,畳み込みニューラルネットワークと計算神経科学を組み合わせることによって,レベル依存フィルタチューニング(connear)を含む人工内耳力学のリアルタイムエンドツーエンドモデルを実現するハイブリッドアプローチを提案する。
CoNNear モデルは音響音声材料で訓練され、その性能と適用性はコクラー力学研究でよく用いられる(見えない)音刺激を用いて評価された。
connearモデルは、人間の人工内耳周波数選択率と、その音響強度依存性を正確にシミュレートする。
CoNNearアーキテクチャは並列で微分可能な計算に基づいており、リアルタイムな人間のパフォーマンスを実現する能力を持っている。
これらのユニークなCNNear機能は、次世代のヒューマンライクな機械学習アプリケーションを可能にする。
関連論文リスト
- DeepSpeech models show Human-like Performance and Processing of Cochlear Implant Inputs [12.234206036041218]
我々は、ディープニューラルネットワーク(DNN)のDeepSpeech2をパラダイムとして、自然入力と人工内耳ベースの入力が時間の経過とともにどのように処理されるかを調べる。
音声文から自然言語および人工内耳のような入力を生成し、モデル性能と人的性能の類似性を検証した。
各レイヤにおける時間的ダイナミクスは、コンテキストや入力タイプの影響を受けます。
論文 参考訳(メタデータ) (2024-07-30T04:32:27Z) - Validation of artificial neural networks to model the acoustic behaviour
of induction motors [0.0]
本研究は、誘導電動機の心理音響パラメータを同時に予測するモデリング手法として、マルチタスク人工ニューラルネットワークの使用を評価することである。
誘導電動機の音響特性を評価するために, 等価音圧, 音量, 粗さ, 鋭さを出力として2種類の人工ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-01-27T10:49:33Z) - Individualized Dosing Dynamics via Neural Eigen Decomposition [51.62933814971523]
ニューラル固有微分方程式アルゴリズム(NESDE)を導入する。
NESDEは個別化モデリング、新しい治療ポリシーへの調整可能な一般化、高速で連続的でクローズドな予測を提供する。
本研究は, 総合的・現実的な医療問題におけるNESDEの堅牢性を実証し, 学習力学を用いて, 模擬医療体育環境の公開を行う。
論文 参考訳(メタデータ) (2023-06-24T17:01:51Z) - Analysing the Impact of Audio Quality on the Use of Naturalistic
Long-Form Recordings for Infant-Directed Speech Research [62.997667081978825]
早期言語習得のモデリングは、幼児が言語スキルをブートストラップする方法を理解することを目的としている。
近年の進歩により、より自然主義的なトレーニングデータを計算モデルに利用できるようになった。
音質がこれらのデータに対する分析やモデリング実験にどう影響するかは、現時点では不明である。
論文 参考訳(メタデータ) (2023-05-03T08:25:37Z) - Rigid-Body Sound Synthesis with Differentiable Modal Resonators [6.680437329908454]
本稿では,深層ニューラルネットワークを訓練し,与えられた2次元形状と材料に対するモーダル共振器を生成するための,新しいエンドツーエンドフレームワークを提案する。
合成対象のデータセット上で本手法を実証するが,音声領域の目的を用いてモデルを訓練する。
論文 参考訳(メタデータ) (2022-10-27T10:34:38Z) - Canonical Cortical Graph Neural Networks and its Application for Speech
Enhancement in Future Audio-Visual Hearing Aids [0.726437825413781]
本稿では, 層内変調を用いたマルチモーダル情報と正準相関解析(CCA)を組み合わせた, より生物学的に妥当な自己教師型機械学習手法を提案する。
この手法は、よりクリーンなオーディオ再構成とエネルギー効率の両方を考慮した最近の最先端の結果より優れており、スモーザーでスモーザーなニューロンの発火速度分布によって説明されている。
論文 参考訳(メタデータ) (2022-06-06T15:20:07Z) - Self-supervised models of audio effectively explain human cortical
responses to speech [71.57870452667369]
我々は、自己教師型音声表現学習の進歩に乗じて、人間の聴覚システムの最先端モデルを作成する。
これらの結果から,ヒト大脳皮質における音声処理の異なる段階に関連する情報の階層構造を,自己教師型モデルで効果的に把握できることが示唆された。
論文 参考訳(メタデータ) (2022-05-27T22:04:02Z) - Repeat after me: Self-supervised learning of acoustic-to-articulatory
mapping by vocal imitation [9.416401293559112]
そこで本稿では,限定的な解釈可能な音声パラメータ集合から複雑な音声刺激を再現可能な,事前学習されたニューラル音声合成器を組み合わせた音声生成の計算モデルを提案する。
フォワードモデルと逆モデルの両方は、異なる話者からの生の音響のみの音声データから、自己指導的な方法で共同で訓練される。
模倣シミュレーションは客観的かつ主観的に評価され、非常に奨励的なパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-04-05T15:02:49Z) - Reservoir Memory Machines as Neural Computers [70.5993855765376]
微分可能なニューラルネットワークは、干渉することなく明示的なメモリで人工ニューラルネットワークを拡張する。
我々は、非常に効率的に訓練できるモデルを用いて、微分可能なニューラルネットワークの計算能力を実現する。
論文 参考訳(メタデータ) (2020-09-14T12:01:30Z) - Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network [68.43026108936029]
雑音の多い実環境下での正確な音像定位のための純粋スパイクニューラルネットワーク(SNN)に基づく計算モデルを提案する。
このアルゴリズムを,マイクロホンアレイを用いたリアルタイムロボットシステムに実装する。
実験の結果, 平均誤差方位は13度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-07T08:22:56Z) - Recurrent Neural Network Learning of Performance and Intrinsic
Population Dynamics from Sparse Neural Data [77.92736596690297]
本稿では,RNNの入出力動作だけでなく,内部ネットワークのダイナミクスも学習できる新しいトレーニング戦略を提案する。
提案手法は、RNNを訓練し、生理学的にインスパイアされた神経モデルの内部ダイナミクスと出力信号を同時に再現する。
注目すべきは、トレーニングアルゴリズムがニューロンの小さなサブセットの活性に依存する場合であっても、内部動力学の再現が成功することである。
論文 参考訳(メタデータ) (2020-05-05T14:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。