論文の概要: Upsampling layers for music source separation
- arxiv url: http://arxiv.org/abs/2111.11773v1
- Date: Tue, 23 Nov 2021 10:36:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-24 15:59:36.828644
- Title: Upsampling layers for music source separation
- Title(参考訳): 音源分離のためのアップサンプリング層
- Authors: Jordi Pons, Joan Serr\`a, Santiago Pascual, Giulio Cengarle, Daniel
Arteaga, Davide Scaini
- Abstract要約: アップサンプリングアーティファクトは、トーナルアーティファクト(付加的な高周波ノイズ)またはフィルタリングアーティファクト(サブストアクティブ、一部のバンドを減衰させる)のいずれかである。
異なるアーティファクトがどのように相互作用し、モデルのパフォーマンスに与える影響を評価する。
以上の結果から, アップサンプラーに関連付けられたフィルター工芸品は, 客観的スコアが悪くても, 知覚的に好適であることが示唆された。
- 参考スコア(独自算出の注目度): 12.982998040587665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Upsampling artifacts are caused by problematic upsampling layers and due to
spectral replicas that emerge while upsampling. Also, depending on the used
upsampling layer, such artifacts can either be tonal artifacts (additive
high-frequency noise) or filtering artifacts (substractive, attenuating some
bands). In this work we investigate the practical implications of having
upsampling artifacts in the resulting audio, by studying how different
artifacts interact and assessing their impact on the models' performance. To
that end, we benchmark a large set of upsampling layers for music source
separation: different transposed and subpixel convolution setups, different
interpolation upsamplers (including two novel layers based on stretch and sinc
interpolation), and different wavelet-based upsamplers (including a novel
learnable wavelet layer). Our results show that filtering artifacts, associated
with interpolation upsamplers, are perceptually preferrable, even if they tend
to achieve worse objective scores.
- Abstract(参考訳): アップサンプリングアーティファクトは、問題のあるアップサンプリング層と、アップサンプリング中に発生するスペクトルレプリカによって引き起こされる。
また、使用したアップサンプリング層によっては、これらのアーティファクトは、トーナルアーティファクト(付加高周波ノイズ)またはフィルタリングアーティファクト(サブストアクティブ、一部のバンドの減衰)のいずれかである。
本研究では,様々なアーチファクトがどう相互作用し,モデルの性能に与える影響を評価することにより,結果のオーディオにアーチファクトをサンプリングすることの実際的意義について検討する。
そこで我々は,音楽ソース分離のための大規模アップサンプリング層のベンチマークを行った。異なるトランスポーズおよびサブピクセル畳み込み設定,異なる補間アップサンプラー(ストレッチとシンク補間に基づく2つの新規層を含む),異なるウェーブレットベースのアップサンプラー(新しい学習可能なウェーブレット層を含む)である。
以上の結果から, 補間アップサンプラーに付随するフィルタアーチファクトは, 客観的スコアが悪くても, 知覚的に好適であることが示唆された。
関連論文リスト
- When Semantic Segmentation Meets Frequency Aliasing [14.066404173580864]
我々は、ハードピクセルエラーを包括的に分析し、それらを偽応答、マージミス、変位の3つのタイプに分類する。
その結果, ダウンサンプリング中のフーリエ領域の周波数成分の重なりによる歪みが, ハードピクセルとエイリアシングの定量的な関連性を示した。
本稿では,Nyquist周波数よりも高い周波数を正確に除去・調整することにより,エイリアスを緩和する2つの新しいデエイリアスフィルタ (DAF) と周波数混合 (FreqMix) モジュールを提案する。
論文 参考訳(メタデータ) (2024-03-14T03:12:02Z) - Improving Feature Stability during Upsampling -- Spectral Artifacts and the Importance of Spatial Context [15.351461000403074]
画像復元、画像分割、不均一性推定など、さまざまなタスクにおいて、画素ワイズ予測が求められている。
以前の研究では、再サンプリング操作がエイリアスなどのアーティファクトの対象であることが示されている。
アップサンプリング中に大きな空間的コンテキストが利用できることで,安定かつ高品質な画素ワイズ予測が実現可能であることを示す。
論文 参考訳(メタデータ) (2023-11-29T10:53:05Z) - From Discrete Tokens to High-Fidelity Audio Using Multi-Band Diffusion [84.138804145918]
深層生成モデルは、様々な種類の表現で条件付けられた高忠実度オーディオを生成することができる。
これらのモデルは、条件付けに欠陥がある場合や不完全な場合、可聴アーチファクトを生成する傾向がある。
低ビットレート離散表現から任意の種類のオーディオモダリティを生成する高忠実度マルチバンド拡散ベースフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T22:14:29Z) - BIMS-PU: Bi-Directional and Multi-Scale Point Cloud Upsampling [60.257912103351394]
我々はBIMS-PUと呼ばれる新しいポイント・クラウド・アップサンプリング・パイプラインを開発した。
対象のサンプリング因子を小さな因子に分解することにより,アップ/ダウンサンプリング手順をいくつかのアップ/ダウンサンプリングサブステップに分解する。
提案手法は最先端手法よりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-25T13:13:37Z) - Learning Spatio-Temporal Downsampling for Effective Video Upscaling [20.07194339353278]
本稿では,時空間ダウンサンプリングとアップサンプリングを学習することで,時空間エイリアス問題を解決することを目的とする。
我々のフレームワークは、任意のビデオリサンプリング、ぼやけたフレーム再構築、効率的なビデオストレージなど、様々なアプリケーションを可能にする。
論文 参考訳(メタデータ) (2022-03-15T17:59:00Z) - On the Frequency Bias of Generative Models [61.60834513380388]
我々は、最先端のGANトレーニングにおいて、高周波アーティファクトに対する提案手法を解析した。
既存のアプローチでは、スペクトルアーティファクトを完全に解決できないことが分かっています。
以上の結果から,識別能力の向上に大きな可能性があることが示唆された。
論文 参考訳(メタデータ) (2021-11-03T18:12:11Z) - Designing a Practical Degradation Model for Deep Blind Image
Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。
本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文 参考訳(メタデータ) (2021-03-25T17:40:53Z) - Learning Affinity-Aware Upsampling for Deep Image Matting [83.02806488958399]
アップサンプリングにおける学習親和性は、ディープ・ネットワークにおけるペアワイズ・インタラクションを効果的かつ効率的に利用するためのアプローチであることを示す。
特に、コンポジション1kマッチングデータセットの結果は、A2Uが強いベースラインに対してSAD測定値の14%の相対的な改善を達成していることを示している。
最先端のマッティングネットワークと比較すると、モデル複雑度は40%に過ぎず、8%高いパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-11-29T05:09:43Z) - Weakly- and Semi-Supervised Probabilistic Segmentation and
Quantification of Ultrasound Needle-Reverberation Artifacts to Allow Better
AI Understanding of Tissue Beneath Needles [0.0]
人工物から所望の組織ベースのピクセル値を分離する確率論的ニードル・アンド・レバーベーション・アーティファクトセグメンテーション法を提案する。
提案手法は,最先端のアーティファクトセグメンテーション性能と一致し,アーティファクトの画素ごとのコントリビューションを,基礎となる解剖学に対して推定する新しい標準を設定する。
論文 参考訳(メタデータ) (2020-11-24T08:34:38Z) - Upsampling artifacts in neural audio synthesis [24.409899861477427]
アップサンプリングアーティファクトはコンピュータビジョンで研究されてきたが、オーディオ処理では見過ごされてきた。
アップサンプリングアーティファクトの主なソースは、 (i)問題アップサンプリング演算子によって導入されたトーナルおよびフィルタリングアーティファクト、 (ii)アップサンプリング中に出現するスペクトルレプリカである。
近隣のアップサンプラーは問題のある(しかし最先端の)変換やサブピクセル・コンボリューションの代替となりうることを示す。
論文 参考訳(メタデータ) (2020-10-27T15:09:28Z) - Hierarchical Timbre-Painting and Articulation Generation [92.59388372914265]
本稿では,f0と大音量に基づく高速かつ高忠実な楽曲生成手法を提案する。
合成音声は、対象楽器の音色及び調音を模倣する。
論文 参考訳(メタデータ) (2020-08-30T05:27:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。