論文の概要: PosCUDA: Position based Convolution for Unlearnable Audio Datasets
- arxiv url: http://arxiv.org/abs/2401.02135v1
- Date: Thu, 4 Jan 2024 08:39:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-05 15:30:42.646733
- Title: PosCUDA: Position based Convolution for Unlearnable Audio Datasets
- Title(参考訳): PosCUDA:未学習オーディオデータセットのための位置ベースの畳み込み
- Authors: Vignesh Gokul, Shlomo Dubnov
- Abstract要約: PosCUDAは、学習不能なオーディオデータセットを作成するための位置ベースの畳み込みである。
実験により,PosCUDAは元の音声データセットの品質を維持しつつ,未学習性を達成できることを実証的に示す。
- 参考スコア(独自算出の注目度): 7.4768400786925175
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models require large amounts of clean data to acheive good
performance. To avoid the cost of expensive data acquisition, researchers use
the abundant data available on the internet. This raises significant privacy
concerns on the potential misuse of personal data for model training without
authorisation. Recent works such as CUDA propose solutions to this problem by
adding class-wise blurs to make datasets unlearnable, i.e a model can never use
the acquired dataset for learning. However these methods often reduce the
quality of the data making it useless for practical applications. We introduce
PosCUDA, a position based convolution for creating unlearnable audio datasets.
PosCUDA uses class-wise convolutions on small patches of audio. The location of
the patches are based on a private key for each class, hence the model learns
the relations between positional blurs and labels, while failing to generalize.
We empirically show that PosCUDA can achieve unlearnability while maintaining
the quality of the original audio datasets. Our proposed method is also robust
to different audio feature representations such as MFCC, raw audio and
different architectures such as transformers, convolutional networks etc.
- Abstract(参考訳): ディープラーニングモデルは、優れたパフォーマンスを得るために大量のクリーンデータを必要とします。
高価なデータ取得のコストを避けるために、研究者はインターネットで利用可能な豊富なデータを使用する。
これは、認証なしでモデルトレーニングのために個人データを誤用する可能性があるというプライバシー上の懸念を生じさせる。
CUDAのような最近の研究は、クラスワイドのぼかしを追加してデータセットを学習不能にすることでこの問題に対する解決策を提案する。
しかし、これらの手法はしばしばデータの品質を低下させ、実用的なアプリケーションでは役に立たない。
学習不能な音声データセットを作成するための位置ベースの畳み込みであるPosCUDAを紹介する。
PosCUDAは、小さなオーディオのパッチにクラスワイドの畳み込みを使用する。
パッチの位置は各クラス用の秘密鍵に基づいているため、モデルは一般化に失敗しながら、位置ボケとラベルの関係を学習する。
実験により,PosCUDAは元の音声データセットの品質を維持しつつ,未学習性を達成できることを実証的に示す。
また,提案手法は,MFCC,生オーディオ,トランスフォーマー,畳み込みネットワークなどの異なるアーキテクチャに頑健である。
関連論文リスト
- Learning from Convolution-based Unlearnable Datastes [5.332412565926725]
ConlearnベースのUnlearnable DAtaset(CUDA)メソッドは、データセット内のすべてのイメージにクラスワイドなぼかしを適用することによって、データを学習不能にすることを目的としている。
本研究は,画像のシャープ化と周波数フィルタリングにより,データが未学習のままであるか否かを評価する。
学習不能なデータを用いて学習したモデルに対して,逆行訓練によるテスト精度の大幅な向上を観察する。
論文 参考訳(メタデータ) (2024-11-04T01:51:50Z) - Scaling Laws for Data Filtering -- Data Curation cannot be Compute Agnostic [99.3682210827572]
ビジョン言語モデル(VLM)は、慎重にキュレートされたWebデータセット上で数千のGPU時間でトレーニングされる。
データキュレーション戦略は通常、トレーニングに利用可能な計算を知らないように開発されている。
ウェブデータの非均一性を考慮したニューラルスケーリング法則を導入する。
論文 参考訳(メタデータ) (2024-04-10T17:27:54Z) - Learn to Unlearn for Deep Neural Networks: Minimizing Unlearning
Interference with Gradient Projection [56.292071534857946]
最近のデータプライバシ法は、機械学習への関心を喚起している。
課題は、残りのデータセットに関する知識を変更することなく、忘れたデータに関する情報を捨てることである。
我々は、プロジェクテッド・グラディエント・アンラーニング(PGU)という、プロジェクテッド・グラディエント・ベースの学習手法を採用する。
トレーニングデータセットがもはやアクセスできない場合でも、スクラッチからスクラッチで再トレーニングされたモデルと同じような振る舞いをするモデルを、我々のアンラーニング手法が生成できることを実証するための実証的な証拠を提供する。
論文 参考訳(メタデータ) (2023-12-07T07:17:24Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Few-Shot Non-Parametric Learning with Deep Latent Variable Model [50.746273235463754]
遅延変数を用いた圧縮による非パラメトリック学習(NPC-LV)を提案する。
NPC-LVは、ラベルなしデータが多いがラベル付きデータはほとんどないデータセットの学習フレームワークである。
我々は,NPC-LVが低データ構造における画像分類における3つのデータセットの教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-23T09:35:03Z) - Learning from Multiple Noisy Augmented Data Sets for Better
Cross-Lingual Spoken Language Understanding [69.40915115518523]
トレーニングデータの欠如は、低リソース言語への音声言語理解(SLU)をスケールアウトする上で大きな課題となる。
低リソースターゲット言語でのトレーニングデータを合成するために、様々なデータ拡張手法が提案されている。
本稿では,拡張データにおけるノイズの軽減に焦点をあてる。
論文 参考訳(メタデータ) (2021-09-03T15:44:15Z) - Federated Self-Training for Semi-Supervised Audio Recognition [0.23633885460047763]
本研究では,自己学習による音声モデルの半教師あり学習の問題について検討する。
我々はFedSTARを提案し、大規模なデバイス上での未ラベルデータを利用して音声認識モデルの一般化を改善する。
論文 参考訳(メタデータ) (2021-07-14T17:40:10Z) - Learning with Out-of-Distribution Data for Audio Classification [60.48251022280506]
我々は,OODインスタンスを破棄するよりも,特定のOODインスタンスを検出・復号化することで,学習に肯定的な影響を及ぼすことを示す。
提案手法は,畳み込みニューラルネットワークの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-02-11T21:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。