論文の概要: Optimizing Automatic Speech Assessment: W-RankSim Regularization and Hybrid Feature Fusion Strategies
- arxiv url: http://arxiv.org/abs/2406.10873v1
- Date: Sun, 16 Jun 2024 09:55:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-18 20:21:59.031694
- Title: Optimizing Automatic Speech Assessment: W-RankSim Regularization and Hybrid Feature Fusion Strategies
- Title(参考訳): 音声自動評価の最適化:W-RankSim正規化とハイブリッド機能融合戦略
- Authors: Chung-Wen Wu, Berlin Chen,
- Abstract要約: 自動音声アセスメント(ASA)の新しい正規化手法として重み付きベクトルランク付け類似性(W-RankSim)を導入する。
W-RankSimは、類似したクラスに対して出力層内の重み付きベクトルに近づき、類似したラベルを持つ特徴ベクトルは徐々に互いに近づき合うことを示唆している。
本稿では,SSLと手作り機能を組み合わせたハイブリッドモデルを提案する。
- 参考スコア(独自算出の注目度): 4.617955187293867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Speech Assessment (ASA) has seen notable advancements with the utilization of self-supervised features (SSL) in recent research. However, a key challenge in ASA lies in the imbalanced distribution of data, particularly evident in English test datasets. To address this challenge, we approach ASA as an ordinal classification task, introducing Weighted Vectors Ranking Similarity (W-RankSim) as a novel regularization technique. W-RankSim encourages closer proximity of weighted vectors in the output layer for similar classes, implying that feature vectors with similar labels would be gradually nudged closer to each other as they converge towards corresponding weighted vectors. Extensive experimental evaluations confirm the effectiveness of our approach in improving ordinal classification performance for ASA. Furthermore, we propose a hybrid model that combines SSL and handcrafted features, showcasing how the inclusion of handcrafted features enhances performance in an ASA system.
- Abstract(参考訳): 自動音声アセスメント(ASA)は,近年,自己教師機能(SSL)の活用によって顕著な進歩を遂げている。
しかし、ASAの重要な課題はデータの不均衡な分散であり、特に英語のテストデータセットでは明らかである。
この課題に対処するため、我々はASAを規則的分類タスクとしてアプローチし、新しい正規化手法としてW-RankSim(Weighted Vectors Ranking similarity)を導入した。
W-RankSim は出力層における類似のクラスに対する重み付きベクトルの近さを奨励し、類似ラベルを持つ特徴ベクトルは対応する重み付きベクトルに収束するにつれて、徐々に互いに近付くことを示唆している。
広範囲な実験的評価により, ASAの経時的分類性能向上に対するアプローチの有効性が確認された。
さらに,SSLと手作り機能を組み合わせたハイブリッドモデルを提案し,手作り機能の導入によってASAシステムの性能が向上することを示す。
関連論文リスト
- reCSE: Portable Reshaping Features for Sentence Embedding in Self-supervised Contrastive Learning [1.4604134018640291]
特徴再構成に基づく自己教師付きコントラスト学習文表現フレームワークreCSEを提案する。
このフレームワークは、離散データ拡張メソッドを使用する現在の高度なモデルとは異なる。
我々のreCSEはセマンティック類似性タスクにおける競合性能を達成した。
論文 参考訳(メタデータ) (2024-08-09T09:56:30Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Regularization Through Simultaneous Learning: A Case Study on Plant
Classification [0.0]
本稿では,トランスファーラーニングとマルチタスクラーニングの原則に基づく正規化アプローチである同時学習を紹介する。
我々は、ターゲットデータセットであるUFOP-HVDの補助データセットを活用し、カスタマイズされた損失関数でガイドされた同時分類を容易にする。
興味深いことに,本手法は正規化のないモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-22T19:44:57Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z) - Structure-Aware Feature Generation for Zero-Shot Learning [108.76968151682621]
潜在空間と生成ネットワークの両方を学習する際の位相構造を考慮し,SA-GANと呼ばれる新しい構造認識特徴生成手法を提案する。
本手法は,未確認クラスの一般化能力を大幅に向上させ,分類性能を向上させる。
論文 参考訳(メタデータ) (2021-08-16T11:52:08Z) - Boosting the Generalization Capability in Cross-Domain Few-shot Learning
via Noise-enhanced Supervised Autoencoder [23.860842627883187]
我々は、新しいノイズ強調型教師付きオートエンコーダ(NSAE)を用いて、特徴分布のより広範なバリエーションを捉えるようモデルに教える。
NSAEは入力を共同で再構築し、入力のラベルと再構成されたペアを予測することによってモデルを訓練する。
また、NSAE構造を利用して、より適応性を高め、対象領域の分類性能を向上させる2段階の微調整手順を提案する。
論文 参考訳(メタデータ) (2021-08-11T04:45:56Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Interpretable Sequence Classification via Discrete Optimization [26.899228003677138]
医療監視や侵入検知といった多くの応用において、早期分類は介入を促すために不可欠である。
本研究では、進化する観測トレースから早期分類を好む配列分類器を学習する。
我々の分類器は解釈可能であり, 説明, 反実的推論, 人為的ループ修正を行う。
論文 参考訳(メタデータ) (2020-10-06T15:31:07Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z) - Polarized-VAE: Proximity Based Disentangled Representation Learning for
Text Generation [12.191798515559622]
偏極VAE(Polarized-VAE)は、近接測度に基づいて潜在空間の属性をアンタングルするアプローチである。
本手法は,文の意味と構文をアンタングル化し,伝達実験を行う。
論文 参考訳(メタデータ) (2020-04-22T19:26:09Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。