論文の概要: Deep Neural Decision Forest for Acoustic Scene Classification
- arxiv url: http://arxiv.org/abs/2203.03436v1
- Date: Mon, 7 Mar 2022 14:39:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 15:16:31.953080
- Title: Deep Neural Decision Forest for Acoustic Scene Classification
- Title(参考訳): 音響シーン分類のための深層神経決定林
- Authors: Jianyuan Sun, Xubo Liu, Xinhao Mei, Jinzheng Zhao, Mark D. Plumbley,
Volkan K{\i}l{\i}\c{c}, Wenwu Wang
- Abstract要約: 音響シーン分類(ASC)は、録音環境の特性に基づいて音声クリップを分類することを目的としている。
深層神経決定林(DNDF)を用いたASCの新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 45.886356124352226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Acoustic scene classification (ASC) aims to classify an audio clip based on
the characteristic of the recording environment. In this regard, deep learning
based approaches have emerged as a useful tool for ASC problems. Conventional
approaches to improving the classification accuracy include integrating
auxiliary methods such as attention mechanism, pre-trained models and ensemble
multiple sub-networks. However, due to the complexity of audio clips captured
from different environments, it is difficult to distinguish their categories
without using any auxiliary methods for existing deep learning models using
only a single classifier. In this paper, we propose a novel approach for ASC
using deep neural decision forest (DNDF). DNDF combines a fixed number of
convolutional layers and a decision forest as the final classifier. The
decision forest consists of a fixed number of decision tree classifiers, which
have been shown to offer better classification performance than a single
classifier in some datasets. In particular, the decision forest differs
substantially from traditional random forests as it is stochastic,
differentiable, and capable of using the back-propagation to update and learn
feature representations in neural network. Experimental results on the
DCASE2019 and ESC-50 datasets demonstrate that our proposed DNDF method
improves the ASC performance in terms of classification accuracy and shows
competitive performance as compared with state-of-the-art baselines.
- Abstract(参考訳): 音響シーン分類(ASC)は、録音環境の特性に基づいて音声クリップを分類することを目的とする。
この点において、深層学習に基づくアプローチは、ASC問題に有用なツールとして現れている。
従来の分類精度の改善には、注意機構、事前訓練されたモデル、複数のサブネットワークのアンサンブルといった補助的な手法の統合が含まれる。
しかし、異なる環境から取得した音声クリップの複雑さのため、一つの分類器だけで既存のディープラーニングモデルに補助的な手法を使わずに、それらのカテゴリを区別することは困難である。
本稿では,深層神経決定林(DNDF)を用いたASCの新しいアプローチを提案する。
DNDFは固定数の畳み込み層と決定林を最終分類器として結合する。
決定林は一定数の決定木分類器から構成されており、いくつかのデータセットでは単一の分類器よりも優れた分類性能が示されている。
特に、決定林は確率的で微分可能であり、バックプロパゲーションを使用してニューラルネットワークで特徴表現を更新および学習することができるため、従来のランダム林とは大きく異なる。
dcase2019およびesc-50データセットにおける実験結果から,提案手法は分類精度の面でasc性能を改善し,最先端のベースラインと比較して競合性能を示す。
関連論文リスト
- Informed deep hierarchical classification: a non-standard analysis inspired approach [0.0]
出力層の前に配置された特定のプロジェクション演算子を備えた多出力ディープニューラルネットワークで構成されている。
このようなアーキテクチャの設計は、LH-DNN(Lexicographic Hybrid Deep Neural Network)と呼ばれ、異なる研究分野と非常に離れた研究分野のツールを組み合わせることで実現されている。
アプローチの有効性を評価するために、階層的な分類タスクに適した畳み込みニューラルネットワークであるB-CNNと比較する。
論文 参考訳(メタデータ) (2024-09-25T14:12:50Z) - Confidence-aware Contrastive Learning for Selective Classification [20.573658672018066]
この研究は、選択分類のための一般化を提供し、特徴層を最適化することで選択分類の性能を向上させることを開示する。
この理論に触発されて、我々は初めて特徴レベルで選択的分類モデルを明確に改善することを提案し、新たに選択的分類のための信頼を意識したコントラスト学習手法であるCCL-SCを提案する。
論文 参考訳(メタデータ) (2024-06-07T08:43:53Z) - Domain Adaptive Nuclei Instance Segmentation and Classification via
Category-aware Feature Alignment and Pseudo-labelling [65.40672505658213]
本稿では, UDA 核インスタンス分割と分類のための新しいディープニューラルネットワークである Category-Aware 機能アライメントと Pseudo-Labelling Network (CAPL-Net) を提案する。
我々のアプローチは、最先端のUDA手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2022-07-04T07:05:06Z) - Making CNNs Interpretable by Building Dynamic Sequential Decision
Forests with Top-down Hierarchy Learning [62.82046926149371]
本稿では,CNN(Convlutional Neural Networks)を解釈可能なモデル転送方式を提案する。
我々は、CNNの上に微分可能な意思決定林を構築することで、これを実現する。
DDSDF(Dep Dynamic Sequential Decision Forest)と命名する。
論文 参考訳(メタデータ) (2021-06-05T07:41:18Z) - An evidential classifier based on Dempster-Shafer theory and deep
learning [6.230751621285322]
Dempster-Shafer(DS)理論に基づく新しい分類システムと、集合値分類のための畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
画像認識,信号処理,セマンティック-リレーションシップ分類タスクに関する実験では,深部CNN,DS層,期待されるユーティリティ層の組み合わせにより,分類精度の向上が図られている。
論文 参考訳(メタデータ) (2021-03-25T01:29:05Z) - Relational Teacher Student Learning with Neural Label Embedding for
Device Adaptation in Acoustic Scene Classification [49.0621360050418]
音響シーン分類におけるデバイスミスマッチ問題に対処するドメイン適応フレームワークを提案する。
音響シーンのクラス間の構造的関係を考慮し、本提案手法は本質的にデバイスに依存しない関係を捉える。
トレーニング段階では、転写可能な知識はソースドメインからNLEに凝縮される。
適応段階では、ペアのソースターゲットデータを使用しずに適応対象モデルを学習するために、新しいRTSL戦略を採用する。
論文 参考訳(メタデータ) (2020-07-31T23:07:20Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。