論文の概要: Sampling-Frequency-Independent Universal Sound Separation
- arxiv url: http://arxiv.org/abs/2309.12581v1
- Date: Fri, 22 Sep 2023 02:16:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-25 16:12:25.922426
- Title: Sampling-Frequency-Independent Universal Sound Separation
- Title(参考訳): サンプリング周波数非依存な普遍音分離
- Authors: Tomohiko Nakamura and Kohei Yatabe
- Abstract要約: 本稿では,未訓練サンプリング周波数(SF)を処理可能なユニバーサル音分離(USS)手法を提案する。
提案するSFI畳み込み層は,入力SFに応じて畳み込みカーネルを生成することで,様々なSFを処理できる。
- 参考スコア(独自算出の注目度): 27.389093857615872
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a universal sound separation (USS) method capable of
handling untrained sampling frequencies (SFs). The USS aims at separating
arbitrary sources of different types and can be the key technique to realize a
source separator that can be universally used as a preprocessor for any
downstream tasks. To realize a universal source separator, there are two
essential properties: universalities with respect to source types and recording
conditions. The former property has been studied in the USS literature, which
has greatly increased the number of source types that can be handled by a
single neural network. However, the latter property (e.g., SF) has received
less attention despite its necessity. Since the SF varies widely depending on
the downstream tasks, the universal source separator must handle a wide variety
of SFs. In this paper, to encompass the two properties, we propose an
SF-independent (SFI) extension of a computationally efficient USS network,
SuDoRM-RF. The proposed network uses our previously proposed SFI convolutional
layers, which can handle various SFs by generating convolutional kernels in
accordance with an input SF. Experiments show that signal resampling can
degrade the USS performance and the proposed method works more consistently
than signal-resampling-based methods for various SFs.
- Abstract(参考訳): 本稿では,未訓練サンプリング周波数(SF)を処理可能なユニバーサル音分離(USS)手法を提案する。
USSは、異なるタイプの任意のソースを分離することを目的としており、ダウンストリームタスクのプリプロセッサとして普遍的に使用できるソースセパレータを実現するための重要な技術である。
ユニバーサルソースセパレータを実現するには、ソースタイプと記録条件に関する普遍性という2つの重要な特性がある。
以前の特性はussの文献で研究されており、単一のニューラルネットワークで処理できるソースタイプの数は大幅に増加した。
しかし、後者の性質(例えばsf)は、その必要性にもかかわらずあまり注目されていない。
SFは下流のタスクによって大きく異なるため、ユニバーサルソースセパレータは様々なSFを扱う必要がある。
本稿では,この2つの特性を包含するために,計算効率の良い USS ネットワーク SuDoRM-RF の SF-independent (SFI) 拡張を提案する。
提案するネットワークは,提案するsfi畳み込み層を用いて,入力sfに応じて畳み込みカーネルを生成することにより,様々なsfを処理できる。
実験により, 信号再サンプリングはUSSの性能を劣化させることが可能であり, 提案手法は各種SFの信号再サンプリング法よりも一貫して動作することがわかった。
関連論文リスト
- Federated Learning for UAV-Based Spectrum Sensing: Enhancing Accuracy Through SNR-Weighted Model Aggregation [0.0]
無人航空機(UAV)ネットワークは、3D空間、その課題、そして機会に関して異なる視点を必要とする。
本稿では,その分散特性と計算能力の制限を考慮した,UAVネットワークにおけるスペクトルセンシングのためのFLに基づく手法を提案する。
我々はまた、UAVが観測した信号と雑音の比率を考慮し、グローバルモデルを得るフェデレーションアグリゲーション手法、すなわちFedSNRを開発した。
論文 参考訳(メタデータ) (2024-11-17T19:24:49Z) - One-Dimensional Deep Image Prior for Curve Fitting of S-Parameters from
Electromagnetic Solvers [57.441926088870325]
Deep Image Prior(ディープ・イメージ・プライオリ、ディープ・イメージ・プライオリ、DIP)は、ランダムなd畳み込みニューラルネットワークの重みを最適化し、ノイズや過度な測定値からの信号に適合させる技術である。
本稿では,Vector Fitting (VF) の実装に対して,ほぼすべてのテスト例において優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-06T20:28:37Z) - Multi-channel Speech Separation Using Spatially Selective Deep
Non-linear Filters [21.672683390080106]
複数話者による複数チャンネル分離タスクにおいて、混合音から各音声信号を復元することを目的とする。
本研究では,深層ニューラルネットワークを用いた空間選択的フィルタ(SSF)を提案する。
論文 参考訳(メタデータ) (2023-04-24T11:44:00Z) - FedSDG-FS: Efficient and Secure Feature Selection for Vertical Federated
Learning [21.79965380400454]
Vertical Learning(VFL)は、複数のデータオーナに対して、大きな重複するデータサンプルセットに関する機能のサブセットをそれぞれ保持して、有用なグローバルモデルを共同でトレーニングすることを可能にする。
VFLのために設計された既存のFSは、ノイズの多い特徴の数について事前知識を仮定するか、有用な特徴の訓練後のしきい値について事前知識を仮定する。
本稿では,FedSDG-FS(Federated Dual-Gate Based Feature Selection)アプローチを提案する。
論文 参考訳(メタデータ) (2023-02-21T03:09:45Z) - tSF: Transformer-based Semantic Filter for Few-Shot Learning [34.24179994607278]
FSL(Few-Shot Learning)は、ターゲット認識機能を埋め込むことによって、データ不足の問題を緩和する。
最近のFSL手法におけるほとんどの機能埋め込みモジュールは、対応する学習タスクのために特別に設計されている。
変圧器ベースセマンティックフィルタ (tSF) という軽量で普遍的なモジュールを提案する。
tSFは、ベースセット全体から新しいセットに知識を埋め込むとともに、ターゲットカテゴリのセマンティック機能をフィルタリングする。
論文 参考訳(メタデータ) (2022-11-02T04:39:34Z) - Disentangled Representation Learning for RF Fingerprint Extraction under
Unknown Channel Statistics [77.13542705329328]
本稿では,まず,不整合表現学習(DRL)の枠組みを提案し,入力信号を逆学習によりデバイス関連成分とデバイス関連成分に分解する。
提案フレームワークにおける暗黙的なデータ拡張は、デバイス非関連チャネル統計の過度な適合を避けるために、RFF抽出器に正規化を課す。
実験により、DR-RFFと呼ばれる提案手法は、未知の複雑な伝播環境に対する一般化可能性の観点から従来の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-08-04T15:46:48Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - A Generalizable Model-and-Data Driven Approach for Open-Set RFF
Authentication [74.63333951647581]
高周波指紋(RFF)は、低コストな物理層認証を実現するための有望な解決策である。
RFF抽出と識別のために機械学習に基づく手法が提案されている。
生受信信号からRFFを抽出するエンド・ツー・エンドのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-10T03:59:37Z) - Sparse Multi-Family Deep Scattering Network [14.932318540666543]
DSN(Deep Scattering Network)の解釈可能性を活用した新しいアーキテクチャを提案する。
SMF-DSNは散乱係数の多様性を高めてDSNを強化し、(ii)非定常雑音に対するロバスト性を向上させる。
論文 参考訳(メタデータ) (2020-12-14T16:06:14Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - Fractional Skipping: Towards Finer-Grained Dynamic CNN Inference [82.96877371742532]
本研究では,ディープネットワークのための動的フラクタル・スキッピング(DFS)フレームワークを提案する。
DFSは層ワイド量子化(ビット幅の異なるもの)を、層を完全に活用してスキップする中間的な「ソフト」な選択として仮定する。
入力適応推論中の層の表現力を利用して、よりきめ細かい精度計算コストのトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-01-03T03:12:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。