論文の概要: Neuro-MSBG: An End-to-End Neural Model for Hearing Loss Simulation
- arxiv url: http://arxiv.org/abs/2507.15396v1
- Date: Mon, 21 Jul 2025 08:58:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.330983
- Title: Neuro-MSBG: An End-to-End Neural Model for Hearing Loss Simulation
- Title(参考訳): Neuro-MSBG:聴覚障害シミュレーションのためのエンド・ツー・エンドニューラルネットワーク
- Authors: Hui-Guan Yuan, Ryandhimas E. Zezario, Shafique Ahmed, Hsin-Min Wang, Kai-Lung Hua, Yu Tsao,
- Abstract要約: Neuro-MSBGは、効率的な時間周波数モデリングのためのパーソナライズされたオーディオグラムエンコーダを備えた軽量なエンドツーエンドモデルである。
シミュレーションランタイムを46(1秒入力で0.970秒から0.021秒に短縮する。
- 参考スコア(独自算出の注目度): 29.459592567418913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hearing loss simulation models are essential for hearing aid deployment. However, existing models have high computational complexity and latency, which limits real-time applications and lack direct integration with speech processing systems. To address these issues, we propose Neuro-MSBG, a lightweight end-to-end model with a personalized audiogram encoder for effective time-frequency modeling. Experiments show that Neuro-MSBG supports parallel inference and retains the intelligibility and perceptual quality of the original MSBG, with a Spearman's rank correlation coefficient (SRCC) of 0.9247 for Short-Time Objective Intelligibility (STOI) and 0.8671 for Perceptual Evaluation of Speech Quality (PESQ). Neuro-MSBG reduces simulation runtime by a factor of 46 (from 0.970 seconds to 0.021 seconds for a 1 second input), further demonstrating its efficiency and practicality.
- Abstract(参考訳): 補聴器配置には難聴シミュレーションモデルが不可欠である。
しかし、既存のモデルは計算の複雑さとレイテンシが高く、リアルタイムアプリケーションに制限があり、音声処理システムとの直接統合が欠如している。
これらの問題に対処するために,個人化されたオーディオグラムエンコーダを備えた軽量エンド・ツー・エンドモデルであるNeuro-MSBGを提案する。
実験の結果,Nuro-MSBGは並列推論をサポートし,元のMSBGの知覚的品質を保ち,StoIは0.9247,PESQは0.8671であった。
Neuro-MSBGはシミュレーションランタイムを46倍(1秒で0.970秒から0.021秒)削減し、その効率と実用性を実証する。
関連論文リスト
- Neuromorphic Wireless Split Computing with Resonate-and-Fire Neurons [69.73249913506042]
本稿では、共振器(RF)ニューロンを用いて時間領域信号を直接処理する無線スプリットコンピューティングアーキテクチャについて検討する。
可変周波数で共鳴することにより、RFニューロンは低スパイク活性を維持しながら時間局在スペクトル特徴を抽出する。
実験の結果,提案したRF-SNNアーキテクチャは従来のLIF-SNNやANNと同等の精度を達成できることがわかった。
論文 参考訳(メタデータ) (2025-06-24T21:14:59Z) - RBA-FE: A Robust Brain-Inspired Audio Feature Extractor for Depression Diagnosis [6.6826445546254964]
本稿では,脳にインスパイアされた音声特徴抽出器(RBA-FE)を改良した階層型ネットワークアーキテクチャを用いて,抑うつ診断のためのモデルを提案する。
RBA-FEは、ノイズを調整するために、生音声から抽出した6つの音響特性を活用し、空間特性と時間依存性の両方をキャプチャする。
ノイズ問題に対処するため,本モデルは適応速度スムーズなインテリジェンス・アンド・ファイア (ARSLIF) と呼ばれる改良されたスパイクニューロンモデルを組み込んだ。
論文 参考訳(メタデータ) (2025-06-08T13:00:45Z) - Event-based Neural Spike Detection Using Spiking Neural Networks for Neuromorphic iBMI Systems [6.5271882730600455]
埋め込み可能な脳-機械インタフェース(iBMI)は、何千ものニューロンからワイヤレスで記録するように進化しているが、データ帯域幅、消費電力、インプラントサイズに課題に直面している。
本稿では、デルタ変調とパルスカウント変調によって生成されたイベントベースのニューラルデータを処理し、信号をスパースイベントに変換する新しいスパイキングニューラルネットワークスパイク検出器(SNN-SPD)を提案する。
論文 参考訳(メタデータ) (2025-05-10T07:07:00Z) - NeuroSim V1.5: Improved Software Backbone for Benchmarking Compute-in-Memory Accelerators with Device and Circuit-level Non-idealities [2.141889595429907]
本稿では,デバイスレベルおよび回路レベルの非理想性において重要な進歩をもたらすNeuroSim V1.5を提案する。
NeuroSim V1.5は次世代のACIMアクセラレータの設計と検証を推進している。
NeuroSimのすべてのバージョンはhttps://github.com/neurosim/NeuroSimでオープンソース公開されている。
論文 参考訳(メタデータ) (2025-05-05T02:07:04Z) - HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids [30.305000305766193]
本稿では,難聴者を対象とした非侵襲的ディープラーニングに基づく音質評価モデルであるHAAQI-Netを紹介する。
HAAQIのスコアは、音楽のオーディオクリップや聴覚障害パターンから直接予測できる。
論文 参考訳(メタデータ) (2024-01-02T10:55:01Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - The Expressive Leaky Memory Neuron: an Efficient and Expressive Phenomenological Neuron Model Can Solve Long-Horizon Tasks [64.08042492426992]
本稿では,脳皮質ニューロンの生物学的モデルであるExpressive Memory(ELM)ニューロンモデルを紹介する。
ELMニューロンは、上記の入力-出力関係を1万以下のトレーニング可能なパラメータと正確に一致させることができる。
本稿では,Long Range Arena(LRA)データセットなど,時間構造を必要とするタスクで評価する。
論文 参考訳(メタデータ) (2023-06-14T13:34:13Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - Atrial Fibrillation Detection Using Weight-Pruned, Log-Quantised
Convolutional Neural Networks [25.160063477248904]
心電図信号から心房細動を検出する畳み込みニューラルネットワークモデルを開発した。
このモデルは、限られた可変長の入力データで訓練されているにもかかわらず、高い性能を示す。
最終モデルは91.1%のモデル圧縮比を達成し、高いモデル精度は91.7%、損失は1%未満であった。
論文 参考訳(メタデータ) (2022-06-14T11:47:04Z) - A Conformer Based Acoustic Model for Robust Automatic Speech Recognition [63.242128956046024]
提案手法は,二方向長短期記憶(BLSTM)モデルと発話ワイドドロップアウトと反復話者適応を用いて,最先端の音声認識システムを構築した。
コンフォーマーエンコーダは、音響モデリングに畳み込み強化されたアテンションメカニズムを使用する。
提案システムはCHiME-4コーパスの単調なASRタスクに基づいて評価される。
論文 参考訳(メタデータ) (2022-03-01T20:17:31Z) - A Lottery Ticket Hypothesis Framework for Low-Complexity Device-Robust
Neural Acoustic Scene Classification [78.04177357888284]
デバイス・ロバスト音響シーン分類(ASC)のためのデータ拡張、知識伝達、プルーニング、量子化を組み合わせた新しいニューラルモデル圧縮戦略を提案する。
本稿では,低複雑マルチデバイスASCのためのアコースティック・ロッテリー(Austratic Lottery)という,効率的なジョイント・フレームワークについて報告する。
論文 参考訳(メタデータ) (2021-07-03T16:25:24Z) - Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network [68.43026108936029]
雑音の多い実環境下での正確な音像定位のための純粋スパイクニューラルネットワーク(SNN)に基づく計算モデルを提案する。
このアルゴリズムを,マイクロホンアレイを用いたリアルタイムロボットシステムに実装する。
実験の結果, 平均誤差方位は13度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-07T08:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。