論文の概要: SESQA: semi-supervised learning for speech quality assessment
- arxiv url: http://arxiv.org/abs/2010.00368v2
- Date: Mon, 8 Feb 2021 09:01:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:54:08.836421
- Title: SESQA: semi-supervised learning for speech quality assessment
- Title(参考訳): SESQA:音声品質評価のための半教師付き学習
- Authors: Joan Serr\`a, Jordi Pons, Santiago Pascual
- Abstract要約: 半教師付き学習手法の課題に対処し、利用可能なデータと補完基準を5つの補助課題と組み合わせる。
私たちの結果が示します。
アプローチは既存のメソッドのエラーを36%以上削減できる。
再利用可能な特徴または補助的な出力の観点から追加の利益を提供する。
- 参考スコア(独自算出の注目度): 26.14516018425591
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic speech quality assessment is an important, transversal task whose
progress is hampered by the scarcity of human annotations, poor generalization
to unseen recording conditions, and a lack of flexibility of existing
approaches. In this work, we tackle these problems with a semi-supervised
learning approach, combining available annotations with programmatically
generated data, and using 3 different optimization criteria together with 5
complementary auxiliary tasks. Our results show that such a semi-supervised
approach can cut the error of existing methods by more than 36%, while
providing additional benefits in terms of reusable features or auxiliary
outputs. Improvement is further corroborated with an out-of-sample test showing
promising generalization capabilities.
- Abstract(参考訳): 自動音声品質評価は、人間のアノテーションの不足、見えない記録条件への一般化の欠如、既存のアプローチの柔軟性の欠如によって進行が妨げられる重要な、横断的なタスクである。
本研究では,利用可能なアノテーションとプログラム的に生成されたデータを組み合わせた半教師付き学習手法と,3つの異なる最適化基準と5つの補助タスクを用いて,これらの問題に取り組む。
このような半教師付き手法は,既存の手法の誤りを36%以上削減し,再利用可能な特徴や補助的な出力の面で付加的な利点を提供する。
改善はさらに、有望な一般化能力を示すサンプル外テストと一致している。
関連論文リスト
- Spectral Representation for Causal Estimation with Hidden Confounders [33.148766692274215]
隠れた共同創設者が存在する場合の因果効果推定の問題に対処する。
本手法では,条件付き期待演算子の特異値分解とサドル点最適化問題を用いる。
論文 参考訳(メタデータ) (2024-07-15T05:39:56Z) - Augmenting Unsupervised Reinforcement Learning with Self-Reference [63.68018737038331]
人間は、新しいタスクを学ぶ際に、過去の経験を明確に表現する能力を持っている。
本稿では,歴史情報を活用するためのアドオンモジュールとして,自己参照(SR)アプローチを提案する。
提案手法は,非教師付き強化学習ベンチマークにおけるIQM(Interquartile Mean)性能と最適ギャップ削減の両面から,最先端の成果を実現する。
論文 参考訳(メタデータ) (2023-11-16T09:07:34Z) - A study on the impact of Self-Supervised Learning on automatic dysarthric speech assessment [6.284142286798582]
以上の結果から,HuBERTは難聴分類,単語認識,インテリジェンス分類において最も汎用性の高い特徴抽出器であり,従来の音響特徴と比較して,それぞれ+24.7%,+61%,テキストおよび+7.2%の精度を実現していることがわかった。
論文 参考訳(メタデータ) (2023-06-07T11:04:02Z) - Uncertainty-Driven Action Quality Assessment [67.20617610820857]
本稿では,複数の判定スコアの多様性を捉えるために,不確実性駆動型AQA (UD-AQA) という新しい確率モデルを提案する。
我々は,AQA回帰損失の再重み付けに使用される各予測の不確かさを推定する。
提案手法は,オリンピックイベントMTL-AQAとFineDivingの3つのベンチマークと,手術スキルJIGSAWSデータセットの3つのベンチマークで比較結果を得た。
論文 参考訳(メタデータ) (2022-07-29T07:21:15Z) - A Mutually Reinforced Framework for Pretrained Sentence Embeddings [49.297766436632685]
InfoCSEは高品質な文埋め込みを学習するための新しいフレームワークである。
文表現モデル自体を利用して、以下の反復的な自己スーパービジョンプロセスを実現する。
言い換えれば、表現学習とデータアノテーションは相互に強化され、強い自己超越効果が導出される。
論文 参考訳(メタデータ) (2022-02-28T14:00:16Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Self-attention fusion for audiovisual emotion recognition with
incomplete data [103.70855797025689]
視覚的感情認識を応用したマルチモーダルデータ解析の問題点を考察する。
本稿では、生データから学習可能なアーキテクチャを提案し、その3つの変種を異なるモダリティ融合機構で記述する。
論文 参考訳(メタデータ) (2022-01-26T18:04:29Z) - Guided Point Contrastive Learning for Semi-supervised Point Cloud
Semantic Segmentation [90.2445084743881]
そこで本研究では,モデル性能を向上させるために,未ラベルの点群をトレーニングに採用するための半教師付き点群セマンティックセマンティックセマンティックセマンティクスを提案する。
近年の自己監督型タスクのコントラスト損失に触発されて,特徴表現とモデル一般化能力を高めるためのガイド付きポイントコントラスト損失を提案する。
論文 参考訳(メタデータ) (2021-10-15T16:38:54Z) - Exploration of Audio Quality Assessment and Anomaly Localisation Using
Attention Models [37.60722440434528]
本稿では,双方向長期記憶とアテンション機構を併用し,音質評価のための新しいモデルを提案する。
前者は、録音から情報を学ぶ人間の聴覚知覚能力を模倣することであり、後者は、対象の特徴を強調することによって、所望の信号から干渉を更に識別することである。
提案手法を評価するため,様々な自然音を混合してTIMITデータセットを用いて拡張する。
論文 参考訳(メタデータ) (2020-05-16T17:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。