論文の概要: Environment Transfer for Distributed Systems
- arxiv url: http://arxiv.org/abs/2101.01863v1
- Date: Wed, 6 Jan 2021 04:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 07:52:25.215442
- Title: Environment Transfer for Distributed Systems
- Title(参考訳): 分散システムのための環境伝達
- Authors: Chunheng Jiang, Jae-wook Ahn, Nirmit Desai
- Abstract要約: 本論文では,音声データ間の音響的風合いの伝達に用いる手法を拡張する手法を提案する。
分散音響データ拡張のための環境間で音声シグネチャを転送する。
本稿では,生成した音響データを分類精度と内容保存に基づいて評価する指標を考案する。
- 参考スコア(独自算出の注目度): 5.8010446129208155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collecting sufficient amount of data that can represent various acoustic
environmental attributes is a critical problem for distributed acoustic machine
learning. Several audio data augmentation techniques have been introduced to
address this problem but they tend to remain in simple manipulation of existing
data and are insufficient to cover the variability of the environments. We
propose a method to extend a technique that has been used for transferring
acoustic style textures between audio data. The method transfers audio
signatures between environments for distributed acoustic data augmentation.
This paper devises metrics to evaluate the generated acoustic data, based on
classification accuracy and content preservation. A series of experiments were
conducted using UrbanSound8K dataset and the results show that the proposed
method generates better audio data with transferred environmental features
while preserving content features.
- Abstract(参考訳): 様々な音響環境特性を表現できる量のデータを集めることは、分散音響機械学習にとって重要な問題である。
この問題に対処するためにいくつかのオーディオデータ拡張技術が導入されたが、既存のデータの単純な操作に留まり、環境の変動をカバーできない傾向にある。
本稿では,音声データ間の音響スタイルのテクスチャの転送に用いられてきた手法を拡張する手法を提案する。
分散音響データ拡張のための環境間で音声シグネチャを転送する。
本稿では,分類精度とコンテンツ保存に基づいて,生成した音響データを評価するメトリクスを考案する。
urbansound8kデータセットを用いて実験を行い,提案手法がコンテンツの特徴を維持しつつ,環境特性を伝達する音声データを生成することを示した。
関連論文リスト
- Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio
Detection [54.20974251478516]
本稿では,破滅的な忘れを克服するために,偽音声検出のための連続学習アルゴリズムを提案する。
検出ネットワークを微調整する場合,本手法では,真の発話と偽発話の比率に応じて,重み付けの方向を適応的に計算する。
本手法は,音声の感情認識などの関連分野に容易に一般化できる。
論文 参考訳(メタデータ) (2023-08-07T05:05:49Z) - Can We Transfer Noise Patterns? A Multi-environment Spectrum Analysis
Model Using Generated Cases [10.876490928902838]
スペクトルデータベースのテストデバイスは、非作業環境にデプロイされた場合、複雑なノイズパターンに悩まされる。
本研究では,異なる環境における標準試料のスペクトルを事例として,そのノイズパターンの違いを学習するノイズパターン伝達モデルを提案する。
サンプルからサンプルまでのケースベースを生成し、データセットレベルのノイズ学習におけるサンプルレベルのノイズの干渉を排除する。
論文 参考訳(メタデータ) (2023-08-02T13:29:31Z) - Self-Supervised Visual Acoustic Matching [63.492168778869726]
音響マッチングは、ターゲットの音響環境に録音されたかのように、音声クリップを再合成することを目的としている。
そこで本研究では,対象のシーン画像と音声のみを含む,視覚的音響マッチングのための自己教師型アプローチを提案する。
提案手法は,条件付きGANフレームワークと新しいメトリクスを用いて,室内音響をアンタングル化し,音をターゲット環境に再合成する方法を共同で学習する。
論文 参考訳(メタデータ) (2023-07-27T17:59:59Z) - Adaptive ship-radiated noise recognition with learnable fine-grained
wavelet transform [25.887932248706218]
本稿では,適応型一般化認識システム AGNet を提案する。
固定ウェーブレットパラメータをきめ細かな学習可能なパラメータに変換することにより、AGNetは異なる周波数で水中音の特性を学習する。
実験の結果、AGNetは水中音響データセットのベースライン法を全て上回っていることがわかった。
論文 参考訳(メタデータ) (2023-05-31T06:56:01Z) - Timbre Transfer with Variational Auto Encoding and Cycle-Consistent
Adversarial Networks [0.6445605125467573]
本研究は,音源音の音色を目標音の音色に変換し,音質の低下を最小限に抑えた深層学習の音色伝達への適用について検討する。
この手法は、変分オートエンコーダとジェネレーティブ・アドバイサル・ネットワークを組み合わせて、音源の有意義な表現を構築し、ターゲット音声の現実的な世代を生成する。
論文 参考訳(メタデータ) (2021-09-05T15:06:53Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Ensemble of Discriminators for Domain Adaptation in Multiple Sound
Source 2D Localization [7.564344795030588]
本稿では,複数音源の局所化のための領域適応手法の精度を向上させる識別器のアンサンブルを提案する。
このようなデータセットの記録とラベリングは、特にさまざまな音響条件をカバーするために十分な多様性を必要とするため、非常にコストがかかる。
論文 参考訳(メタデータ) (2020-12-10T09:17:29Z) - Cross-domain Adaptation with Discrepancy Minimization for
Text-independent Forensic Speaker Verification [61.54074498090374]
本研究では,複数の音響環境下で収集したCRSS-Forensicsオーディオデータセットを紹介する。
我々は、VoxCelebデータを用いてCNNベースのネットワークを事前訓練し、次に、CRSS-Forensicsのクリーンな音声で高レベルのネットワーク層の一部を微調整するアプローチを示す。
論文 参考訳(メタデータ) (2020-09-05T02:54:33Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。