論文の概要: Subject Envelope based Multitype Reconstruction Algorithm of Speech
Samples of Parkinson's Disease
- arxiv url: http://arxiv.org/abs/2108.09922v1
- Date: Mon, 23 Aug 2021 04:20:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:19:26.015890
- Title: Subject Envelope based Multitype Reconstruction Algorithm of Speech
Samples of Parkinson's Disease
- Title(参考訳): 主観的エンベロープに基づくパーキンソン病音声サンプルの多型再構成アルゴリズム
- Authors: Yongming Li, Chengyu Liu, Pin Wang, Hehua Zhang, Anhai Wei
- Abstract要約: パーキンソン病(PD)のリスクは極めて深刻であり,現在PD音声認識は有効な診断方法である。
病期, コーパス, その他の因子がデータ収集に与える影響により, PDの状態を反映する1つの被験者内のすべてのサンプルの能力は様々である。
本稿では,多型再構成演算子に基づくPD音声サンプル変換アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 9.201534250475934
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The risk of Parkinson's disease (PD) is extremely serious, and PD speech
recognition is an effective method of diagnosis nowadays. However, due to the
influence of the disease stage, corpus, and other factors on data collection,
the ability of every samples within one subject to reflect the status of PD
vary. No samples are useless totally, and not samples are 100% perfect. This
characteristic means that it is not suitable just to remove some samples or
keep some samples. It is necessary to consider the sample transformation for
obtaining high quality new samples. Unfortunately, existing PD speech
recognition methods focus mainly on feature learning and classifier design
rather than sample learning, and few methods consider the sample
transformation. To solve the problem above, a PD speech sample transformation
algorithm based on multitype reconstruction operators is proposed in this
paper. The algorithm is divided into four major steps. Three types of
reconstruction operators are designed in the algorithm: types A, B and C.
Concerning the type A operator, the original dataset is directly reconstructed
by designing a linear transformation to obtain the first dataset. The type B
operator is designed for clustering and linear transformation of the dataset to
obtain the second new dataset. The third operator, namely, the type C operator,
reconstructs the dataset by clustering and convolution to obtain the third
dataset. Finally, the base classifier is trained based on the three new
datasets, and then the classification results are fused by decision weighting.
In the experimental section, two representative PD speech datasets are used for
verification. The results show that the proposed algorithm is effective.
Compared with other algorithms, the proposed algorithm achieves apparent
improvements in terms of classification accuracy.
- Abstract(参考訳): パーキンソン病(PD)のリスクは極めて深刻であり,現在PD音声認識は有効な診断方法である。
しかし, 病期, コーパス, その他の因子がデータ収集に与える影響から, PDの状態を反映した各試料の収集能力は異なる。
全く役に立たないサンプルはなく、100%完璧ではない。
この特徴は、サンプルを取り除いたり、サンプルを保持するだけでは適切でないことを意味する。
高品質な新しいサンプルを得るためには,サンプル変換を検討する必要がある。
残念なことに,既存のPD音声認識手法は,サンプル学習よりも特徴学習と分類器設計に重点を置いている。
以上の問題を解決するために,多型再構成演算子に基づくPD音声サンプル変換アルゴリズムを提案する。
アルゴリズムは4つの大きなステップに分けられる。
a型、b型、c型の3種類の再構成演算子がアルゴリズムで設計されている。 a型演算子に関して、最初のデータセットを取得するために線形変換を設計することで、元のデータセットを直接再構成する。
タイプB演算子は、第2の新しいデータセットを得るためにデータセットのクラスタリングと線形変換のために設計されている。
第3のオペレータ、すなわちタイプCオペレータは、クラスタリングと畳み込みによってデータセットを再構築し、第3のデータセットを取得する。
最後に、3つの新しいデータセットに基づいてベース分類器を訓練し、決定重み付けによって分類結果を融合する。
実験区間では,2つの代表的なPD音声データセットを用いて検証を行う。
その結果,提案アルゴリズムの有効性が示された。
他のアルゴリズムと比較して,提案アルゴリズムは分類精度の点で明らかに改善されている。
関連論文リスト
- Comparative study of subset selection methods for rapid prototyping of
3D object detection algorithms [0.0]
プロトタイピングオブジェクト検出アルゴリズムは、エネルギーと環境への影響の観点から、時間と費用がかかる。
このようなサブセットを選択するための3つのアルゴリズム(ランダムサンプリング、クラスごとのランダムサンプリング、および提案したMONSPeC)の比較を行う。
本研究は,基本的ランダムサンプリングよりも,クラスごとのランダムサンプリングとMONSPeCの有効性が優れていることを示す実証的証拠を提供する。
論文 参考訳(メタデータ) (2023-06-30T11:09:20Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Few-shot Open-set Recognition by Transformation Consistency [30.757030359718048]
SnaTCHerと呼ばれる、疑似未知のサンプルを必要としない新しい未知クラスのサンプル検出器を提案します。
本手法は,変換整合性に基づいて,変換されたプロトタイプと修正されたプロトタイプセットとの差を測定する。
提案手法は,未知のクラス分布推定問題を疑似未知のクラスサンプルとは独立に,相対的な特徴変換問題に変更する。
論文 参考訳(メタデータ) (2021-03-02T07:37:17Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - A Method for Handling Multi-class Imbalanced Data by Geometry based
Information Sampling and Class Prioritized Synthetic Data Generation (GICaPS) [15.433936272310952]
本稿では,多ラベル分類問題における不均衡データ処理の問題について考察する。
特徴ベクトル間の幾何学的関係を利用する2つの新しい手法が提案されている。
提案手法の有効性は,汎用的なマルチクラス認識問題を解くことによって解析する。
論文 参考訳(メタデータ) (2020-10-11T04:04:26Z) - A Systematic Characterization of Sampling Algorithms for Open-ended
Language Generation [71.31905141672529]
本稿では,自己回帰型言語モデルに広く採用されている祖先サンプリングアルゴリズムについて検討する。
エントロピー低減, 秩序保存, 斜面保全の3つの重要な特性を同定した。
これらの特性を満たすサンプリングアルゴリズムのセットが,既存のサンプリングアルゴリズムと同等に動作することがわかった。
論文 参考訳(メタデータ) (2020-09-15T17:28:42Z) - Ensemble Wrapper Subsampling for Deep Modulation Classification [70.91089216571035]
受信した無線信号のサブサンプリングは、ハードウェア要件と信号処理アルゴリズムの計算コストを緩和するために重要である。
本稿では,無線通信システムにおけるディープラーニングを用いた自動変調分類のためのサブサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-10T06:11:13Z) - Classification Algorithm of Speech Data of Parkinsons Disease Based on
Convolution Sparse Kernel Transfer Learning with Optimal Kernel and Parallel
Sample Feature Selection [14.1270098940551]
スパースカーネル転送学習に基づく新しいPD分類アルゴリズムを提案する。
スパース伝達学習は公共データセットからPD音声の特徴構造情報を抽出するために用いられる。
提案アルゴリズムは、分類精度が明らかに向上する。
論文 参考訳(メタデータ) (2020-02-10T13:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。