論文の概要: Infant Crying Detection in Real-World Environments
- arxiv url: http://arxiv.org/abs/2005.07036v6
- Date: Wed, 16 Feb 2022 22:01:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 18:40:55.963166
- Title: Infant Crying Detection in Real-World Environments
- Title(参考訳): 実環境における乳幼児の泣き声検出
- Authors: Xuewen Yao, Megan Micheletti, Mckensey Johnson, Edison Thomaz, Kaya de
Barbaro
- Abstract要約: 我々は、深度スペクトルと音響特性の両方を利用したモデルを含む、確立された機械学習アプローチを評価した。
780時間以上のラベル付き実世界の音声データから、幼児の泣き声のデータセットを収集し、注釈付けする。
実験結果から,実世界データを用いて実験した涙検出モデルの性能が低下していることが確認された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Most existing cry detection models have been tested with data collected in
controlled settings. Thus, the extent to which they generalize to noisy and
lived environments is unclear. In this paper, we evaluate several established
machine learning approaches including a model leveraging both deep spectrum and
acoustic features. This model was able to recognize crying events with F1 score
0.613 (Precision: 0.672, Recall: 0.552), showing improved external validity
over existing methods at cry detection in everyday real-world settings. As part
of our evaluation, we collect and annotate a novel dataset of infant crying
compiled from over 780 hours of labeled real-world audio data, captured via
recorders worn by infants in their homes, which we make publicly available. Our
findings confirm that a cry detection model trained on in-lab data
underperforms when presented with real-world data (in-lab test F1: 0.656,
real-world test F1: 0.236), highlighting the value of our new dataset and
model.
- Abstract(参考訳): 既存のcry検出モデルは、制御された設定で収集されたデータでテストされている。
したがって、騒音や生活環境への一般化の程度は不明確である。
本稿では,深層スペクトルと音響特徴を併用したモデルを含むいくつかの確立した機械学習手法を評価する。
このモデルでは、F1スコア0.613(精度:0.672、リコール:0.552)で泣く出来事を認識することができ、日々の現実の環境での涙検出における既存の方法に対する外的妥当性が改善された。
評価の一環として, 乳幼児が自宅で装着したレコーダーを用いて, 780時間以上のラベル付き実世界の音声データから, 乳幼児の泣き声のデータセットを収集, 注釈し, 公開している。
実験結果から,実世界データ(実世界データF1: 0.656,実世界テストF1: 0.236)を提示した場合,実験室内データに基づいてトレーニングした涙検出モデルは,新たなデータセットとモデルの価値を強調した。
関連論文リスト
- Textile Anomaly Detection: Evaluation of the State-of-the-Art for Automated Quality Inspection of Carpet [0.0]
羊毛カーペットの自動検査を目的として,最先端の教師なし検出モデルを評価した。
4種類の独自のカーペットテクスチャのカスタムデータセットが作成され、モデルを徹底的にテストした。
本研究の重要度は,異常領域の検出精度,誤検出回数,実時間における各モデルの推測時間である。
論文 参考訳(メタデータ) (2024-07-26T01:13:59Z) - Sound Tagging in Infant-centric Home Soundscapes [30.76025173544015]
本研究では,家庭内における幼児中心音環境における大規模事前学習モデルの性能について検討する。
この結果から,収集したデータセットと公開データセットを組み合わせることで,F1スコアを増大させることで,モデルを微調整できることが示唆された。
論文 参考訳(メタデータ) (2024-06-25T00:15:54Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Open World Object Detection in the Era of Foundation Models [53.683963161370585]
5つの実世界のアプリケーション駆動データセットを含む新しいベンチマークを導入する。
本稿では,オープンワールドのための新しいオブジェクト検出モデル(FOMO)を提案する。
論文 参考訳(メタデータ) (2023-12-10T03:56:06Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - A Gait Triaging Toolkit for Overlapping Acoustic Events in Indoor
Environments [0.1933681537640272]
本稿では,歩行検出のための機械学習モデルのトレーニングに適した歩行音声サンプルをトリアージする,機械学習に基づく新しいフィルタを提案する。
フィルタの有効性を示すため,高齢者から収集した歩行データセットに対して,フィルタを適用することなく深層学習モデルを訓練し,評価する。
提案フィルタは,屋内環境における高齢者の歩行検出モデルのトレーニングを行うため,歩行サンプルの手動アノテーションのタスクを自動化する。
論文 参考訳(メタデータ) (2022-11-11T01:33:14Z) - Learning to diagnose common thorax diseases on chest radiographs from
radiology reports in Vietnamese [0.33598755777055367]
ベトナムの放射線学報告から情報を抽出し,胸部X線(CXR)画像の正確なラベルを提供するデータ収集・アノテーションパイプラインを提案する。
このことは、ベトナムの放射線学者や臨床医が、国によって異なる可能性のある内因性診断カテゴリと密接に一致したデータに注釈を付けることで、ベトナムの放射線技師や臨床医に利益をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-09-11T06:06:03Z) - Fake It Till You Make It: Near-Distribution Novelty Detection by
Score-Based Generative Models [54.182955830194445]
既存のモデルは、いわゆる"近く分布"設定で失敗するか、劇的な低下に直面します。
本稿では, スコアに基づく生成モデルを用いて, 合成近分布異常データを生成することを提案する。
本手法は,9つのノベルティ検出ベンチマークにおいて,近分布ノベルティ検出を6%改善し,最先端のノベルティ検出を1%から5%パスする。
論文 参考訳(メタデータ) (2022-05-28T02:02:53Z) - Learning with Noisy Labels Revisited: A Study Using Real-World Human
Annotations [54.400167806154535]
ノイズラベルを用いた学習に関する既存の研究は、主に合成ラベルノイズに焦点を当てている。
本研究は2つの新しいベンチマークデータセット(CIFAR-10N, CIFAR-100N)を示す。
実世界のノイズラベルは古典的に採用されたクラス依存のラベルではなく、インスタンス依存のパターンに従うことを示す。
論文 参考訳(メタデータ) (2021-10-22T22:42:11Z) - Chest x-ray automated triage: a semiologic approach designed for
clinical implementation, exploiting different types of labels through a
combination of four Deep Learning architectures [83.48996461770017]
本研究では,異なる畳み込みアーキテクチャの後期融合に基づく深層学習手法を提案する。
公開胸部x線画像と機関アーカイブを組み合わせたトレーニングデータセットを4つ構築した。
4つの異なるディープラーニングアーキテクチャをトレーニングし、それらのアウトプットとレイトフュージョン戦略を組み合わせることで、統一されたツールを得ました。
論文 参考訳(メタデータ) (2020-12-23T14:38:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。