論文の概要: "Seeing Sound": Audio Classification with the Wigner-Wille Distribution
and Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2211.03202v1
- Date: Sun, 6 Nov 2022 19:01:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 16:36:16.125224
- Title: "Seeing Sound": Audio Classification with the Wigner-Wille Distribution
and Convolutional Neural Networks
- Title(参考訳): 見る音」:ウィグナー・ウィリー分布と畳み込みニューラルネットワークを用いた音声分類
- Authors: Antonios Marios Christonasis, Stef van Eijndhoven, Peter Duin
- Abstract要約: センサーネットワークから得られるデータは、センサーフュージョンとAIアルゴリズムを組み合わせることで、自動運転車のような分野のイノベーションを促進する。
本稿では,都市環境における音センサデータの利用の可能性について検討する。
本稿では,Wigner-Ville分布と畳み込みニューラルネットワークを用いた音声データの分類手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With big data becoming increasingly available, IoT hardware becoming widely
adopted, and AI capabilities becoming more powerful, organizations are
continuously investing in sensing. Data coming from sensor networks are
currently combined with sensor fusion and AI algorithms to drive innovation in
fields such as self-driving cars. Data from these sensors can be utilized in
numerous use cases, including alerts in safety systems of urban settings, for
events such as gun shots and explosions. Moreover, diverse types of sensors,
such as sound sensors, can be utilized in low-light conditions or at locations
where a camera is not available. This paper investigates the potential of the
utilization of sound-sensor data in an urban context. Technically, we propose a
novel approach of classifying sound data using the Wigner-Ville distribution
and Convolutional Neural Networks. In this paper, we report on the performance
of the approach on open-source datasets. The concept and work presented is
based on my doctoral thesis, which was performed as part of the Engineering
Doctorate program in Data Science at the University of Eindhoven, in
collaboration with the Dutch National Police. Additional work on real-world
datasets was performed during the thesis, which are not presented here due to
confidentiality.
- Abstract(参考訳): ビッグデータがますます普及し、IoTハードウェアが広く採用され、AI機能がより強力になるにつれて、組織はセンサーに継続的に投資している。
センサーネットワークから得られるデータは、現在、センサーフュージョンとAIアルゴリズムを組み合わせて、自動運転車のような分野のイノベーションを推進する。
これらのセンサーからのデータは、都市環境の安全システムにおける警告や、銃声や爆発などのイベントなど、多くのユースケースで利用することができる。
さらに、音センサのような多様なセンサーは、低照度環境でも、カメラが使えない場所でも利用することができる。
本稿では,都市環境における音センサデータの利用の可能性について検討する。
本稿では,Wigner-Ville分布と畳み込みニューラルネットワークを用いた音声データの分類手法を提案する。
本稿では,オープンソースデータセットに対するアプローチの性能について報告する。
この概念と研究は、アイントホーフェン大学のデータサイエンスにおける工学博士課程の一環として、オランダ国立警察と共同で行った私の博士論文に基づいている。
現実世界のデータセットに関する追加の作業は論文中に行われたが、秘密性のためここでは提示されていない。
関連論文リスト
- Generative AI for Data Augmentation in Wireless Networks: Analysis, Applications, and Case Study [59.780800481241066]
Generative Artificial Intelligence (GenAI) は、無線データ拡張の効果的な代替手段である。
本稿では、無線ネットワークにおけるGenAI駆動型データ拡張の可能性と有効性について考察する。
本稿では,Wi-Fiジェスチャー認識のための一般化拡散モデルに基づくデータ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-13T05:15:25Z) - Networking Systems for Video Anomaly Detection: A Tutorial and Survey [55.28514053969056]
ビデオ異常検出(VAD)は人工知能(AI)コミュニティにおける基本的な研究課題である。
本稿では,各種深層学習駆動型VAD経路の基本前提,学習フレームワーク,適用シナリオについて述べる。
我々は、産業用IoTおよびスマート都市における最新のNSVAD研究と、デプロイ可能なNSVADのためのエンドクラウド共同アーキテクチャを紹介します。
論文 参考訳(メタデータ) (2024-05-16T02:00:44Z) - Open-sourced Data Ecosystem in Autonomous Driving: the Present and Future [130.87142103774752]
このレビューは、70以上のオープンソースの自動運転データセットを体系的に評価する。
高品質なデータセットの作成の基礎となる原則など、さまざまな側面に関する洞察を提供する。
また、解決を保障する科学的、技術的課題も検討している。
論文 参考訳(メタデータ) (2023-12-06T10:46:53Z) - Smart Infrastructure: A Research Junction [5.172393727004225]
本稿では,ドイツ・アシャッフェンブルクの公的な市内交差点に位置する視覚センサ技術を備えたインテリジェントな研究基盤について紹介する。
マルチビューカメラシステムは、交通状況を監視し、道路利用者の行動を知覚する。
このシステムは、データ生成の研究、新しいHADセンサーシステム、アルゴリズム、人工知能(AI)トレーニング戦略の評価に使用される。
論文 参考訳(メタデータ) (2023-07-12T14:04:12Z) - Robustness of Physics-Informed Neural Networks to Noise in Sensor Data [0.0]
PINNは、物理に基づくドメイン知識をニューラルネットワークモデルに組み込む効果的な方法であることが示されている。
本研究では、物理インフォームドニューラルネットワークのロバスト性について、データのノイズの大きさについて予備的な調査を行う。
論文 参考訳(メタデータ) (2022-11-22T06:24:43Z) - Federated Deep Learning Meets Autonomous Vehicle Perception: Design and
Verification [168.67190934250868]
フェデレーテッド・ラーニング・パワード・コネクテッド・オートモービル(FLCAV)が提案されている。
FLCAVは通信とアノテーションのコストを削減しながらプライバシを保存する。
マルチステージトレーニングのためのネットワークリソースと道路センサのポーズを決定することは困難である。
論文 参考訳(メタデータ) (2022-06-03T23:55:45Z) - Data Heterogeneity-Robust Federated Learning via Group Client Selection
in Industrial IoT [57.67687126339891]
FedGSは5Gのエンパワーメント産業のための階層的なクラウド・エッジ・エンドのFLフレームワークである。
自然にクラスタ化されたファクトリデバイスを利用することで、FedGSは勾配ベースのバイナリ置換アルゴリズムを使用する。
実験によると、FedGSは精度を3.5%改善し、トレーニングラウンドを平均59%削減している。
論文 参考訳(メタデータ) (2022-02-03T10:48:17Z) - Integrate-and-Fire Neurons for Low-Powered Pattern Recognition [0.0]
コンデンサの電荷と放電特性を利用した低出力ニューロンモデル「Integrate-and-Fire」を導入する。
並列および直列RC回路を用いて、繰り返し形式で表現できるトレーニング可能なニューロンモデルを開発した。
本論文は,第20回人工知能・ソフトコンピューティングWebシステム国際会議(ICAISC 2021)で発表された研究の全文である。
論文 参考訳(メタデータ) (2021-06-28T12:08:00Z) - Heterogeneous Noisy Short Signal Camouflage in Multi-Domain Environment
Decision-Making [0.0]
画像や音声信号に変換することで,情報(センサ信号)を隠蔽する手法を提案する。
軍事近代化に向けた最新の試みの1つとして、インテリジェントな識別・検出操作を実現する上での課題について検討する。
論文 参考訳(メタデータ) (2021-06-02T22:59:58Z) - Occupancy Detection in Room Using Sensor Data [0.0]
本稿では,複数の変数を用いてセンサデータを用いて占有率を検出するソリューションを提案する。
Decision Tree, Random Forest, Gradient Boosting Machine, Logistic Regression, Naive Bayes, Kernelized SVM, K-Nearest Neighborsの7つの有名なアルゴリズムがテストされ、比較されている。
論文 参考訳(メタデータ) (2021-01-10T19:53:57Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。