論文の概要: Semi-FedSER: Semi-supervised Learning for Speech Emotion Recognition On
Federated Learning using Multiview Pseudo-Labeling
- arxiv url: http://arxiv.org/abs/2203.08810v1
- Date: Tue, 15 Mar 2022 21:50:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 15:51:16.386793
- Title: Semi-FedSER: Semi-supervised Learning for Speech Emotion Recognition On
Federated Learning using Multiview Pseudo-Labeling
- Title(参考訳): Semi-FedSER:Multiview Pseudo-Labeling を用いたフェデレーション学習における音声感情認識のための半教師付き学習
- Authors: Tiantian Feng and Shrikanth Narayanan
- Abstract要約: 音声感情認識(SER)アプリケーションは、しばしばプライバシー上の懸念に結びついている。
Federated Learning(FL)は、クライアントをコーディネートして、ローカルデータを共有せずにモデルを協調的にトレーニングする分散機械学習アルゴリズムである。
本研究では,ラベル付きデータとラベルなしデータの両方を用いて,FLにおける限定データサンプルの課題に対処する半教師付きフェデレーション学習フレームワークであるSemi-FedSERを提案する。
- 参考スコア(独自算出の注目度): 43.17379040854574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech Emotion Recognition (SER) application is frequently associated with
privacy concerns as it often acquires and transmits speech data at the
client-side to remote cloud platforms for further processing. These speech data
can reveal not only speech content and affective information but the speaker's
identity, demographic traits, and health status. Federated learning (FL) is a
distributed machine learning algorithm that coordinates clients to train a
model collaboratively without sharing local data. This algorithm shows enormous
potential for SER applications as sharing raw speech or speech features from a
user's device is vulnerable to privacy attacks. However, a major challenge in
FL is limited availability of high-quality labeled data samples. In this work,
we propose a semi-supervised federated learning framework, Semi-FedSER, that
utilizes both labeled and unlabeled data samples to address the challenge of
limited labeled data samples in FL. We show that our Semi-FedSER can generate
desired SER performance even when the local label rate l=20 using two SER
benchmark datasets: IEMOCAP and MSP-Improv.
- Abstract(参考訳): 音声感情認識(SER)アプリケーションは、クライアント側の音声データをリモートクラウドプラットフォームに取得して送信し、さらなる処理を行うため、しばしばプライバシー上の懸念に結びついている。
これらの音声データは、音声の内容や感情情報だけでなく、話者のアイデンティティ、人口特性、健康状態を明らかにすることができる。
Federated Learning(FL)は、クライアントをコーディネートして、ローカルデータを共有せずにモデルを協調的にトレーニングする分散機械学習アルゴリズムである。
このアルゴリズムは、ユーザーのデバイスから生の音声または音声の特徴を共有することがプライバシー攻撃に弱いため、serアプリケーションにとって大きな可能性を示している。
しかしながら、flの大きな課題は、高品質なラベル付きデータサンプルの可用性の制限である。
本研究では,ラベル付きデータとラベルなしデータの両方を利用する半教師付きフェデレート学習フレームワークであるSemi-FedSERを提案し,FLにおける限定ラベル付きデータサンプルの課題に対処する。
筆者らは,IEMOCAP と MSP-Improv の2つのベンチマークデータセットを用いて,ローカルラベルレート l=20 であっても,SER が所望の性能を実現できることを示した。
関連論文リスト
- Partial Federated Learning [26.357723187375665]
Federated Learning(FL)は、エッジデバイスに制約されたユーザデータに基づいて機械学習モデルをトレーニングする一般的なアルゴリズムである。
そこで我々は、機械学習モデルに、データのサブセットをサーバに提供可能なデータを用いてトレーニングする、Partial Federated Learning (PartialFL) と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-03T21:04:36Z) - Communication-Efficient Personalized Federated Learning for
Speech-to-Text Tasks [66.78640306687227]
プライバシー保護と法的規制を満たすために、連邦学習(FL)は、音声テキスト(S2T)システムのトレーニングにおいて大きな注目を集めている。
S2Tタスクで一般的に使用されるFLアプローチ(textscFedAvg)は、通常、広範な通信オーバーヘッドに悩まされる。
我々は、クライアント側チューニングとサーバとのインタラクションのための軽量なLoRAモジュールであるtextscFedLoRA と、$k$-near を備えたグローバルモデルである textscFedMem を導入したパーソナライズされたS2Tフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-18T15:39:38Z) - Federated Representation Learning for Automatic Speech Recognition [20.641076546330986]
Federated Learning(FL)はプライバシ保護のパラダイムであり、エッジデバイスがデータを共有せずに協調的に学習できるようにする。
我々は、データのプライバシー制約に配慮した自動音声認識のための表現を学習するために、自己教師付き学習(SSL)とFLをまとめる。
FL における事前学習型 ASR エンコーダは,中心的な事前学習モデルと同様に動作し,事前学習に比べて 12-15% (WER) の改善が得られた。
論文 参考訳(メタデータ) (2023-08-03T20:08:23Z) - FedNoisy: Federated Noisy Label Learning Benchmark [53.73816587601204]
フェデレーション学習は、クライアントからの機密データを集約することなく、分散学習で人気を集めている。
データ分離の分散と分離の性質は、データ品質によって複雑になり、ノイズの多いラベルに対してより脆弱になる可能性がある。
私たちは、研究者が潜在的にフェデレートされたノイズ設定を十分に調査するのに役立つ、最初の標準ベンチマークを提供しています。
論文 参考訳(メタデータ) (2023-06-20T16:18:14Z) - Semi-Supervised Federated Learning for Keyword Spotting [15.044022869136262]
キーワードスポッティング(KWS)は、モバイルデバイスや仮想アシスタントにおける音声ベースのアプリケーションにおいて重要な側面である。
フェデレートラーニング(FL)の最近の進歩は、機械学習モデルをトレーニングする能力を著しく拡大している。
論文 参考訳(メタデータ) (2023-05-09T00:46:12Z) - Scalable Collaborative Learning via Representation Sharing [53.047460465980144]
フェデレートラーニング(FL)とスプリットラーニング(SL)は、データを(デバイス上で)プライベートにしながら協調学習を可能にする2つのフレームワークである。
FLでは、各データ保持者がモデルをローカルにトレーニングし、集約のために中央サーバにリリースする。
SLでは、クライアントは個々のカット層アクティベーション(スマッシュされたデータ)をサーバにリリースし、そのレスポンス(推論とバックの伝搬の両方)を待つ必要があります。
本研究では, クライアントがオンライン知識蒸留を通じて, 対照的な損失を生かして協調する, プライバシ保護機械学習の新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-20T10:49:22Z) - SLICER: Learning universal audio representations using low-resource
self-supervised pre-training [53.06337011259031]
ラベルなし音声データに事前学習エンコーダを組み込むための自己指導型学習手法を提案する。
我々の主な目的は、多種多様な音声および非音声タスクにまたがる一般化が可能な音声表現を学習することである。
論文 参考訳(メタデータ) (2022-11-02T23:45:33Z) - Split Federated Learning on Micro-controllers: A Keyword Spotting
Showcase [1.4794135558227681]
フェデレートラーニング(Federated Learning)は,ユーザの生データをサーバに収集することなく,ローカルでモデルをトレーニングする,プライベートラーニングスキームとして提案されている。
本研究では,Arduinoボード上に単純なSFLフレームワークを実装し,90%以上の精度でキーワードスポッティングアプリケーションのための中国語桁音声データセットの正当性を検証した。
英数字音声データセットでは、SFL実装は最先端のFL実装と比較して13.89%高い精度を実現している。
論文 参考訳(メタデータ) (2022-10-04T23:42:45Z) - Attribute Inference Attack of Speech Emotion Recognition in Federated
Learning Settings [56.93025161787725]
Federated Learning(FL)は、クライアントをコーディネートして、ローカルデータを共有せずにモデルを協調的にトレーニングする分散機械学習パラダイムである。
本稿では,共有勾配やモデルパラメータからクライアントの機密属性情報を推測する属性推論攻撃フレームワークを提案する。
FLを用いて学習したSERシステムに対して,属性推論攻撃が達成可能であることを示す。
論文 参考訳(メタデータ) (2021-12-26T16:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。