論文の概要: On Multitask Loss Function for Audio Event Detection and Localization
- arxiv url: http://arxiv.org/abs/2009.05527v1
- Date: Fri, 11 Sep 2020 16:59:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 22:10:19.291721
- Title: On Multitask Loss Function for Audio Event Detection and Localization
- Title(参考訳): 音声イベント検出と局所化のためのマルチタスク損失関数について
- Authors: Huy Phan, Lam Pham, Philipp Koch, Ngoc Q. K. Duong, Ian McLoughlin,
Alfred Mertins
- Abstract要約: 複数ラベルのイベント検出と局所化の両方を回帰問題として定式化するマルチタスク回帰モデルを提案する。
不均一な損失関数の共通結合は、同次平均二乗誤差損失が収束と性能の向上につながるのに対して、ネットワークがデータに不適合であることを示す。
- 参考スコア(独自算出の注目度): 37.91770573529112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Audio event localization and detection (SELD) have been commonly tackled
using multitask models. Such a model usually consists of a multi-label event
classification branch with sigmoid cross-entropy loss for event activity
detection and a regression branch with mean squared error loss for
direction-of-arrival estimation. In this work, we propose a multitask
regression model, in which both (multi-label) event detection and localization
are formulated as regression problems and use the mean squared error loss
homogeneously for model training. We show that the common combination of
heterogeneous loss functions causes the network to underfit the data whereas
the homogeneous mean squared error loss leads to better convergence and
performance. Experiments on the development and validation sets of the DCASE
2020 SELD task demonstrate that the proposed system also outperforms the DCASE
2020 SELD baseline across all the detection and localization metrics, reducing
the overall SELD error (the combined metric) by approximately 10% absolute.
- Abstract(参考訳): 音声イベントのローカライゼーションと検出(SELD)は、マルチタスクモデルを用いて一般的に行われている。
このようなモデルは通常、イベントアクティビティ検出のためのsgmoidクロスエントロピー損失を持つマルチラベルイベント分類ブランチと、指向性推定のための平均二乗誤差損失を持つ回帰ブランチで構成される。
本研究では, (マルチラベル) 事象検出と局所化の両方を回帰問題として定式化し, モデルトレーニングに平均二乗誤差損失を均等に用いるマルチタスク回帰モデルを提案する。
不均一な損失関数の共通結合は、同次平均二乗誤差損失が収束と性能の向上につながるのに対して、ネットワークがデータに不適合であることを示す。
DCASE 2020 SELDタスクの開発と検証セットの実験では、提案システムはすべての検出とローカライゼーションの指標でDCASE 2020 SELDベースラインを上回り、SELD全体のエラー(組み合わせのメトリクス)を約10%削減することを示した。
関連論文リスト
- FUN-AD: Fully Unsupervised Learning for Anomaly Detection with Noisy Training Data [1.0650780147044159]
ラベルなしおよび潜在的に汚染されたトレーニングデータを用いた完全教師なし異常検出のための新しい学習ベースアプローチを提案する。
本手法は, 2つの観測結果から, 正常試料間の対特徴距離が, 異常試料や異種試料間の対特徴距離よりも平均的に小さい可能性が示唆され, 互いに近接する2つの特徴対が等質な対である可能性が示唆された。
本研究は, 近接する近傍距離が信頼度の高いサンプルと異常を区別できることを示す最初の観測結果に基づいて, 反復的に再構成されたメモリバンクを用いた擬似ラベル方式を提案する。
論文 参考訳(メタデータ) (2024-11-25T05:51:38Z) - MIM-GAN-based Anomaly Detection for Multivariate Time Series Data [7.734588574138427]
GAN(Generative Adversarial Network)の損失関数は,異常検出のための生成サンプルの品質と多様性に影響を与える重要な要因である。
メッセージ重要度尺度(MIM-GAN)を用いたGANに基づく教師なし多重時系列異常検出アルゴリズムを提案する。
実験の結果,MIM-GANに基づく異常検出アルゴリズムは精度,リコール,F1スコアにおいて優れた性能を示した。
論文 参考訳(メタデータ) (2023-10-26T02:09:39Z) - Anomaly Detection with Score Distribution Discrimination [4.468952886990851]
本稿では,スコア分布の観点から,異常スコア関数の最適化を提案する。
正常試料と異常試料のスコア分布の重なりを最小化するオーバーラップ損失と呼ばれる新しい損失関数を設計する。
論文 参考訳(メタデータ) (2023-06-26T03:32:57Z) - Robust Multimodal Failure Detection for Microservice Systems [32.25907616511765]
AnoFusionは、マイクロサービスシステムに対する教師なしの障害検出アプローチである。
異種マルチモーダルデータの相関を学習し、グラフ注意ネットワーク(GAT)とGRU(Gated Recurrent Unit)を統合する。
これはそれぞれ0.857と0.922のF1スコアを達成し、最先端の故障検出手法より優れている。
論文 参考訳(メタデータ) (2023-05-30T12:39:42Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Discriminative-Generative Dual Memory Video Anomaly Detection [81.09977516403411]
近年,ビデオ異常検出(VAD)には,トレーニングプロセス中に通常のデータに代えて,いくつかの異常を使おうと試みている。
本稿では,いくつかの異常を生かしてデータの不均衡を解決するために,識別生成型デュアルメモリ(dream)異常検出モデルを提案する。
論文 参考訳(メタデータ) (2021-04-29T15:49:01Z) - Shaping Deep Feature Space towards Gaussian Mixture for Visual
Classification [74.48695037007306]
視覚分類のためのディープニューラルネットワークのためのガウス混合損失関数(GM)を提案する。
分類マージンと可能性正規化により、GM損失は高い分類性能と特徴分布の正確なモデリングの両方を促進する。
提案したモデルは、追加のトレーニング可能なパラメータを使わずに、簡単かつ効率的に実装できる。
論文 参考訳(メタデータ) (2020-11-18T03:32:27Z) - Optimized Loss Functions for Object detection: A Case Study on Nighttime
Vehicle Detection [0.0]
本稿では,2つの損失関数を同時に分類と局所化に最適化する。
本研究は, 正試料の局在化精度向上のためにのみ相関が適用されている既存研究と比較して, 相関を利用して真に硬い負試料を得る。
MIoUと呼ばれる新しい局所化損失は、予測ボックスとターゲットボックスの間のマハラノビス距離を組み込むことで、DIoU損失の勾配の不整合を解消する。
論文 参考訳(メタデータ) (2020-11-11T03:00:49Z) - Learning by Minimizing the Sum of Ranked Range [58.24935359348289]
本稿では,学習目標を定式化するための一般的なアプローチとして,ランキング範囲(SoRR)の和を紹介した。
ランク付き範囲は、実数の集合のソートされた値の連続的なシーケンスである。
我々は,SoRRフレームワークの最小化のための機械学習における2つの応用,すなわち,バイナリ分類のためのAoRR集約損失とマルチラベル/マルチクラス分類のためのTKML個人損失について検討する。
論文 参考訳(メタデータ) (2020-10-05T01:58:32Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。