論文の概要: Machine listening in a neonatal intensive care unit
- arxiv url: http://arxiv.org/abs/2409.11439v2
- Date: Mon, 7 Oct 2024 11:44:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 20:01:55.137666
- Title: Machine listening in a neonatal intensive care unit
- Title(参考訳): 新生児集中治療室における機械聴取
- Authors: Modan Tailleur, Vincent Lostanlen, Jean-Philippe Rivière, Pierre Aumond,
- Abstract要約: 酸素、警報装置、足音は、病院で最も一般的な音源である。
本稿では,エッジコンピューティングとクラウドコンピューティングの組み合わせにより,これら2つの課題に対処する。
プライバシー保護のための音響センサを設計し,音声波形を録音する代わりに,3オクターブのスペクトルをリアルタイムで計算する。
- 参考スコア(独自算出の注目度): 1.5060156580765574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Oxygenators, alarm devices, and footsteps are some of the most common sound sources in a hospital. Detecting them has scientific value for environmental psychology but comes with challenges of its own: namely, privacy preservation and limited labeled data. In this paper, we address these two challenges via a combination of edge computing and cloud computing. For privacy preservation, we have designed an acoustic sensor which computes third-octave spectrograms on the fly instead of recording audio waveforms. For sample-efficient machine learning, we have repurposed a pretrained audio neural network (PANN) via spectral transcoding and label space adaptation. A small-scale study in a neonatological intensive care unit (NICU) confirms that the time series of detected events align with another modality of measurement: i.e., electronic badges for parents and healthcare professionals. Hence, this paper demonstrates the feasibility of polyphonic machine listening in a hospital ward while guaranteeing privacy by design.
- Abstract(参考訳): 酸素、警報装置、足音は、病院で最も一般的な音源である。
環境心理学には科学的価値があるが、プライバシー保護と限定ラベル付きデータという独自の課題が伴う。
本稿では,エッジコンピューティングとクラウドコンピューティングの組み合わせにより,これら2つの課題に対処する。
プライバシー保護のための音響センサを設計し,音声波形を録音する代わりに,3オクターブのスペクトルをリアルタイムで計算する。
サンプル効率のよい機械学習では、スペクトル変換とラベル空間適応により、事前訓練された音声ニューラルネットワーク(PANN)を再利用した。
NICU(nenenatological intensive care Unit)における小規模な研究は、検出された事象の時系列が別の測定のモダリティ、すなわち、親や医療専門家の電子的バッジと一致することを確認している。
そこで本研究では,病院病棟におけるポリフォニック・マシン・リスニングの実現可能性を示すとともに,設計によるプライバシの確保も図っている。
関連論文リスト
- SafeEar: Content Privacy-Preserving Audio Deepfake Detection [17.859275594843965]
音声コンテンツにアクセスすることなくディープフェイク音声を検知する新しいフレームワークであるSafeEarを提案する。
私たちのキーとなるアイデアは、ニューラルオーディオを、セマンティックおよび音響情報をオーディオサンプルから適切に分離する、新しいデカップリングモデルに組み込むことです。
このようにして、セマンティックな内容が検出器に露出されることはない。
論文 参考訳(メタデータ) (2024-09-14T02:45:09Z) - EchoVest: Real-Time Sound Classification and Depth Perception Expressed
through Transcutaneous Electrical Nerve Stimulation [0.0]
我々は、視覚障害者や聴覚障害者が自分の環境をより直感的に認識できるように、新しい補助デバイス、EchoVestを開発した。
EchoVestは、音の音源に基づいて経皮的電気神経刺激(TENS)を利用して、ユーザの身体に振動を伝達する。
我々は、CNNベースの機械学習モデルよりも精度と計算コストにおいて、分類タスクに最もよく使用される機械学習モデルより優れていることを目指していた。
論文 参考訳(メタデータ) (2023-07-10T14:43:32Z) - SottoVoce: An Ultrasound Imaging-Based Silent Speech Interaction Using
Deep Neural Networks [18.968402215723]
ユーザの無声発話を検出するシステムを提案する。
提案システムは,ユーザの発話音声を使わずに発話内容を認識する。
また,音声認識の精度を向上させるために,ユーザが口頭の動きを調整できることも確認した。
論文 参考訳(メタデータ) (2023-03-03T07:46:35Z) - Toward a realistic model of speech processing in the brain with
self-supervised learning [67.7130239674153]
生波形で訓練された自己教師型アルゴリズムは有望な候補である。
We show that Wav2Vec 2.0 learns brain-like representations with little as 600 hours of unlabelled speech。
論文 参考訳(メタデータ) (2022-06-03T17:01:46Z) - Personalized breath based biometric authentication with wearable
multimodality [2.335150656883681]
鼻音の特徴を持つ呼吸は、個人識別と検証において潜在的なバイオメトリックスとして示されている。
胸部のモーションセンサーが捉えた他のモダリティから得られる情報に加えて、オーディオ機能によってパフォーマンスがさらに向上することを示します。
論文 参考訳(メタデータ) (2021-10-29T17:41:43Z) - Deep Metric Learning with Locality Sensitive Angular Loss for
Self-Correcting Source Separation of Neural Spiking Signals [77.34726150561087]
本稿では, 深層学習に基づく手法を提案し, 自動掃除とロバスト分離フィルタの必要性に対処する。
本手法は, ソース分離した高密度表面筋電図記録に基づいて, 人工的に劣化したラベルセットを用いて検証する。
このアプローチにより、ニューラルネットワークは、信号のラベル付けの不完全な方法を使用して、神経生理学的時系列を正確に復号することができる。
論文 参考訳(メタデータ) (2021-10-13T21:51:56Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z) - Noise-Resilient Automatic Interpretation of Holter ECG Recordings [67.59562181136491]
本稿では,ホルター記録を雑音に頑健に解析する3段階プロセスを提案する。
第1段階は、心拍位置を検出する勾配デコーダアーキテクチャを備えたセグメンテーションニューラルネットワーク(NN)である。
第2段階は、心拍を幅または幅に分類する分類NNである。
第3のステージは、NN機能の上に、患者対応機能を組み込んだ強化決定木(GBDT)である。
論文 参考訳(メタデータ) (2020-11-17T16:15:49Z) - TinySpeech: Attention Condensers for Deep Speech Recognition Neural
Networks on Edge Devices [71.68436132514542]
エッジ上でのオンデバイス音声認識のための低フットプリント,高効率深層ニューラルネットワーク構築のためのアテンションコンデンサの概念を紹介する。
その有効性を説明するために,デバイス上での音声認識に適した低精度深層ニューラルネットワークTinySpeechを導入する。
論文 参考訳(メタデータ) (2020-08-10T16:34:52Z) - Super Low Resolution RF Powered Accelerometers for Alerting on
Hospitalized Patient Bed Exits [3.2654923574107357]
転倒は重篤な結果であり、高齢者を介護する急性病院や老人ホームで流行している。転倒のリスクを軽減するための技術介入は、自動でベッドからのイベントを監視し、医療従事者にタイムリーな監視を提供するよう警告する。
患者活動に関連する周波数領域情報は, 主に低頻度で存在している。
無線周波数識別(RFID)技術を用いた電池レスセンシング方式について検討し,病院ガウンなどの衣服への便利な統合の可能性について検討した。
論文 参考訳(メタデータ) (2020-03-19T00:58:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。