論文の概要: Weakly Supervised Detection of Baby Cry
- arxiv url: http://arxiv.org/abs/2304.10001v2
- Date: Wed, 1 Nov 2023 03:00:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 17:56:50.996000
- Title: Weakly Supervised Detection of Baby Cry
- Title(参考訳): 乳幼児の泣き声の弱さ検出
- Authors: Weijun Tan
- Abstract要約: 本稿では,乳児の泣き声を検出するために,弱教師付き異常検出法を提案する。
この弱い監視では、オーディオファイルに泣き声がある場合にのみ弱いアノテーションが必要である。
- 参考スコア(独自算出の注目度): 8.067880298298185
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Detection of baby cries is an important part of baby monitoring and health
care. Almost all existing methods use supervised SVM, CNN, or their varieties.
In this work, we propose to use weakly supervised anomaly detection to detect a
baby cry. In this weak supervision, we only need weak annotation if there is a
cry in an audio file. We design a data mining technique using the pre-trained
VGGish feature extractor and an anomaly detection network on long untrimmed
audio files. The obtained datasets are used to train a simple CNN feature
network for cry/non-cry classification. This CNN is then used as a feature
extractor in an anomaly detection framework to achieve better cry detection
performance.
- Abstract(参考訳): 乳幼児の泣き声の検出は乳児のモニタリングと健康管理の重要な部分である。
既存のほとんどのメソッドは、教師付きSVM、CNN、またはそれらの変種を使用する。
本研究では,乳児の泣き声を検出するために弱い教師付き異常検出法を提案する。
この弱い監視では、オーディオファイルに泣き声がある場合にのみ弱いアノテーションが必要である。
我々は、VGGish特徴抽出器と、長い音声ファイルの異常検出ネットワークを用いて、データマイニング手法を設計する。
得られたデータセットは、簡単なCNN機能ネットワークをトレーニングして、Cry/non-cry分類を行う。
次に、このCNNを異常検出フレームワークの機能抽出器として使用し、より優れた低温検出性能を実現する。
関連論文リスト
- Detection of Children Abuse by Voice and Audio Classification by
Short-Time Fourier Transform Machine Learning implemented on Nvidia Edge GPU
device [0.0]
この実験は、機械学習を使って子供の声を分類し、認識する。
子供が泣き叫んだり叫んだりすると、直ちに関連する職員に警告が送られる。
論文 参考訳(メタデータ) (2023-07-27T16:48:19Z) - Self-supervised learning for infant cry analysis [2.7973623341455602]
本研究は,1000人以上の新生児の臨床徴候を含む泣き声のデータベースを解析するための自己教師付き学習(SSL)について検討する。
具体的には, 痛み, 飢え, 不快感などの涙の引き金の同定とともに, 涙による神経障害の検出を標的とした。
SSLコントラスト損失(SimCLR)によるプレトレーニングは,神経損傷と涙の引き金の両方に対する教師付きプレトレーニングよりも有意に優れていた。
論文 参考訳(メタデータ) (2023-05-02T16:27:18Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Abuse and Fraud Detection in Streaming Services Using Heuristic-Aware
Machine Learning [0.45880283710344055]
本研究は,ユーザのストリーミング動作をモデル化することで,ストリーミングサービスに対する不正・悪用検出フレームワークを提案する。
本研究では,半教師付きアプローチと,異常検出のための教師付きアプローチについて検討する。
私たちの知る限りでは、実世界のストリーミングサービスにおいて、不正行為の検出と不正検出に機械学習を使った最初の論文である。
論文 参考訳(メタデータ) (2022-03-04T03:57:58Z) - A Critical Study on the Recent Deep Learning Based Semi-Supervised Video
Anomaly Detection Methods [3.198144010381572]
本稿では,この分野の研究者を新たな視点に紹介し,最近の深層学習に基づく半教師付きビデオ異常検出手法についてレビューする。
私たちのゴールは、より効果的なビデオ異常検出方法の開発を支援することです。
論文 参考訳(メタデータ) (2021-11-02T14:00:33Z) - Audio-visual Representation Learning for Anomaly Events Detection in
Crowds [119.72951028190586]
本稿では,音声と視覚信号の同時モデリングにおけるマルチモーダル学習の活用を試みる。
監視シーンにおける合成音声視覚データセットであるSHADEデータセットについて実験を行った。
音声信号の導入は,異常事象の検出性能を効果的に向上し,他の最先端手法よりも優れることがわかった。
論文 参考訳(メタデータ) (2021-10-28T02:42:48Z) - Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。
第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。
本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文 参考訳(メタデータ) (2021-08-10T05:44:23Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - UAV-AdNet: Unsupervised Anomaly Detection using Deep Neural Networks for
Aerial Surveillance [20.318367304051176]
本稿では,重要なインフラの監視のために,ディープニューラルネットワークを用いた全体的異常検出システムを提案する。
まず,鳥視画像中の物体の空間配置を明示的に表現する手法を提案する。
次に、教師なし異常検出(UAV-AdNet)のためのディープニューラルネットワークアーキテクチャを提案する。
文献研究とは異なり、GPSと画像データを組み合わせて異常な観察を予測する。
論文 参考訳(メタデータ) (2020-11-05T14:26:29Z) - VideoForensicsHQ: Detecting High-quality Manipulated Face Videos [77.60295082172098]
偽造検知器の性能は、人間の目で見られる人工物の存在にどのように依存するかを示す。
前例のない品質の顔ビデオ偽造検出のための新しいベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2020-05-20T21:17:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。