論文の概要: Data is Overrated: Perceptual Metrics Can Lead Learning in the Absence
of Training Data
- arxiv url: http://arxiv.org/abs/2312.03455v1
- Date: Wed, 6 Dec 2023 12:27:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-07 14:55:00.338807
- Title: Data is Overrated: Perceptual Metrics Can Lead Learning in the Absence
of Training Data
- Title(参考訳): データは過大評価される: 知覚メトリクスはトレーニングデータの欠如で学習をリードできる
- Authors: Tashi Namgyal, Alexander Hepburn, Raul Santos-Rodriguez, Valero
Laparra, Jesus Malo
- Abstract要約: 知覚メトリクスは、画像やオーディオなどの自然信号の品質を評価するために伝統的に使用されている。
本研究では,標準的なユークリッド損失を学習したモデルに対して,知覚的損失を伴うトレーニングにより,テスト時の分光図の再構成や音声の再合成が向上することを示す。
- 参考スコア(独自算出の注目度): 44.659718609385315
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Perceptual metrics are traditionally used to evaluate the quality of natural
signals, such as images and audio. They are designed to mimic the perceptual
behaviour of human observers and usually reflect structures found in natural
signals. This motivates their use as loss functions for training generative
models such that models will learn to capture the structure held in the metric.
We take this idea to the extreme in the audio domain by training a compressive
autoencoder to reconstruct uniform noise, in lieu of natural data. We show that
training with perceptual losses improves the reconstruction of spectrograms and
re-synthesized audio at test time over models trained with a standard Euclidean
loss. This demonstrates better generalisation to unseen natural signals when
using perceptual metrics.
- Abstract(参考訳): 知覚指標は伝統的に、画像や音声などの自然信号の品質を評価するために用いられる。
人間の観察者の知覚行動を模倣し、通常、自然の信号で見られる構造を反映するように設計されている。
これにより、モデルがメトリックに保持される構造を捉えることを学ぶように、生成モデルのトレーニングにおける損失関数としての使用が動機付けられる。
我々は、圧縮オートエンコーダを訓練し、自然データの代わりに均一なノイズを再構成することで、このアイデアをオーディオ領域の極端に当てはめる。
知覚損失のあるトレーニングは、標準ユークリッド損失で訓練されたモデルよりも、テスト時間におけるスペクトログラムの再構成と音声の再合成を改善できることが示されている。
これは知覚的メトリクスを使用するとき、自然信号が見えないようにより良い一般化を示す。
関連論文リスト
- The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification [42.14708549155406]
損失関数として知覚メトリクスで訓練されたモデルが知覚的に意味のある特徴を捉えることができることを示す。
知覚的損失で訓練されたオートエンコーダから抽出した特徴を用いることで,音楽理解タスクのパフォーマンスが向上することが実証された。
論文 参考訳(メタデータ) (2024-09-25T16:29:21Z) - Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2023-09-29T06:18:15Z) - Self-Supervised Learning for Audio-Based Emotion Recognition [1.7598252755538808]
自己教師付き学習は、教師付きラベルの不足にもかかわらず学習できる方法のファミリーである。
我々は,CMU-MOSEIの音響モダリティからの感情の分類に自己教師付き学習事前学習を適用した。
自己教師型学習は、すべてのメトリクスにわたるモデルの性能を一貫して改善する。
論文 参考訳(メタデータ) (2023-07-23T14:40:50Z) - Dynamic Scheduled Sampling with Imitation Loss for Neural Text
Generation [10.306522595622651]
トレーニング時間精度のみに基づいてスケジュールを維持するDySI(Dynamic Scheduled Sampling with Imitation Loss)を導入する。
DySIは標準的な機械翻訳ベンチマークの顕著な改善を実現し、他のテキスト生成モデルの堅牢性を大幅に改善した。
論文 参考訳(メタデータ) (2023-01-31T16:41:06Z) - Automatic Recall Machines: Internal Replay, Continual Learning and the
Brain [104.38824285741248]
ニューラルネットワークのリプレイには、記憶されたサンプルを使ってシーケンシャルなデータのトレーニングが含まれる。
本研究では,これらの補助サンプルをフライ時に生成する手法を提案する。
代わりに、評価されたモデル自体内の学習したサンプルの暗黙の記憶が利用されます。
論文 参考訳(メタデータ) (2020-06-22T15:07:06Z) - Applications of Koopman Mode Analysis to Neural Networks [52.77024349608834]
我々は,ニューラルネットワークのトレーニング過程を,高次元の重み空間に作用する力学系と考える。
アーキテクチャに必要なレイヤ数を決定するために、Koopmanスペクトルをどのように利用できるかを示す。
また、Koopmanモードを使えば、ネットワークを選択的にプーンしてトレーニング手順を高速化できることを示す。
論文 参考訳(メタデータ) (2020-06-21T11:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。