論文の概要: LightSAFT: Lightweight Latent Source Aware Frequency Transform for
Source Separation
- arxiv url: http://arxiv.org/abs/2111.12516v1
- Date: Wed, 24 Nov 2021 14:25:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 16:06:31.155997
- Title: LightSAFT: Lightweight Latent Source Aware Frequency Transform for
Source Separation
- Title(参考訳): lightsaft: ソース分離のための軽量な潜在ソース認識周波数変換
- Authors: Yeong-Seok Jeong, Jinsung Kim, Woosung Choi, Jaehwa Chung, Soonyoung
Jung
- Abstract要約: LaSAFT-Netは、条件付きモデルは既存の単一ソース分離モデルと同等の性能を示すことを示した。
LightSAFT-Netは、ISMIR 2021のMusic Demixing Challengeにおいて、十分なSDRパフォーマンスを提供する。
拡張されたLightSAFT-Netは、パラメータが少ない前のものよりも優れています。
- 参考スコア(独自算出の注目度): 0.7192233658525915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conditioned source separations have attracted significant attention because
of their flexibility, applicability and extensionality. Their performance was
usually inferior to the existing approaches, such as the single source
separation model. However, a recently proposed method called LaSAFT-Net has
shown that conditioned models can show comparable performance against existing
single-source separation models. This paper presents LightSAFT-Net, a
lightweight version of LaSAFT-Net. As a baseline, it provided a sufficient SDR
performance for comparison during the Music Demixing Challenge at ISMIR 2021.
This paper also enhances the existing LightSAFT-Net by replacing the LightSAFT
blocks in the encoder with TFC-TDF blocks. Our enhanced LightSAFT-Net
outperforms the previous one with fewer parameters.
- Abstract(参考訳): 条件付きソース分離は、柔軟性、適用性、拡張性のために大きな注目を集めている。
その性能は通常、単一ソース分離モデルのような既存のアプローチよりも劣っていた。
しかし、最近提案されたLaSAFT-Net法は、条件付きモデルが既存の単一ソース分離モデルと同等の性能を示すことを示した。
本稿では,LaSAFT-Netの軽量版であるLightSAFT-Netを提案する。
ベースラインとして、ISMIR 2021のミュージック・デミキシング・チャレンジで比較に十分なSDR性能を提供した。
また、エンコーダのLightSAFTブロックをTFC-TDFブロックに置き換えることで、既存のLightSAFT-Netを強化する。
拡張されたLightSAFT-Netは、パラメータが少ない前のものよりも優れています。
関連論文リスト
- Transforming Image Super-Resolution: A ConvFormer-based Efficient
Approach [63.98380888730723]
本稿では, Convolutional Transformer Layer (ConvFormer) と ConvFormer-based Super-Resolution Network (CFSR) を紹介する。
CFSRは、計算コストの少ない長距離依存と広範囲の受容場を効率的にモデル化する。
これは、x2 SRタスクのUrban100データセットで0.39dB、パラメータが26%、FLOPが31%減少している。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - Taming Latent Diffusion Models to See in the Dark [65.6004750218506]
LDM-SIDは,提案するテーピングモジュールの集合を凍結した事前学習拡散モデルに挿入し,生成過程を制御することを目的としている。
入力されたRAW画像に2次元離散ウェーブレット変換を適用し、LLIEタスクを低周波コンテンツ生成と高周波ディテールメンテナンスという2つの重要な部分に分割する。
論文 参考訳(メタデータ) (2023-12-02T04:31:51Z) - Can SAM Boost Video Super-Resolution? [78.29033914169025]
単純な有効モジュールであるSAM-guidEd refinEment Module (SEEM)を提案する。
この軽量プラグインモジュールは、セマンティック・アウェア機能の生成にアテンションメカニズムを活用するように設計されている。
我々はSEEMをEDVRとBasicVSRの2つの代表的手法に適用し、最小限の実装労力で継続的に性能を向上する。
論文 参考訳(メタデータ) (2023-05-11T02:02:53Z) - Incorporating Transformer Designs into Convolutions for Lightweight
Image Super-Resolution [46.32359056424278]
大規模な畳み込みカーネルは畳み込みニューラルネットワークの設計に人気がある。
カーネルのサイズが大きくなるとパラメータの数が2倍に増加し、計算量やメモリの要求も大きくなる。
本稿では,自己注意機構を付加した標準畳み込みを改良した近傍注意モジュールを提案する。
NAモジュールをベースとして,TSRと呼ばれる軽量単一画像超解像(SISR)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-25T01:32:18Z) - Optimal Condition Training for Target Source Separation [56.86138859538063]
単一チャネルターゲットソース分離のための最適条件学習法を提案する。
多様な意味概念によってもたらされる相補的な情報は、興味の源泉を乱して分離するのに大いに役立ちます。
論文 参考訳(メタデータ) (2022-11-11T00:04:55Z) - Feature Distillation Interaction Weighting Network for Lightweight Image
Super-Resolution [25.50790871331823]
FDIWN(Feature Distillation Interaction Weighted Network)を提案する。
FDIWNは他のモデルよりも優れており、モデルの性能と効率のバランスが良い。
論文 参考訳(メタデータ) (2021-12-16T06:20:35Z) - Middle-level Fusion for Lightweight RGB-D Salient Object Detection [81.43951906434175]
本稿では,新しい軽量RGB-D SODモデルについて述べる。
中層核融合構造に IMFF および L モジュールが組み込まれているため,提案モデルは3.9M のパラメータしか持たず,33 FPS で動作する。
いくつかのベンチマークデータセットによる実験結果から,提案手法の有効性と優位性を検証した。
論文 参考訳(メタデータ) (2021-04-23T11:37:15Z) - LaSAFT: Latent Source Attentive Frequency Transformation for Conditioned
Source Separation [7.002478301291264]
本稿では、ソース依存周波数パターンをキャプチャするLaSAFT(Latent Source Attentive Frequency Transformation)ブロックを提案する。
また,Gated Point-wise Convolutional Modulation (GPoCM) を提案する。
論文 参考訳(メタデータ) (2020-10-22T11:58:23Z) - Residual Feature Distillation Network for Lightweight Image
Super-Resolution [40.52635571871426]
残像蒸留ネットワーク(RFDN)と呼ばれる軽量かつ高精度なSISRモデルを提案する。
RFDNは複数の特徴蒸留接続を用いてより識別的な特徴表現を学習する。
また、RFDNの主ビルディングブロックとして浅層残差ブロック(SRB)を提案し、ネットワークが残差学習の恩恵を受けることができるようにした。
論文 参考訳(メタデータ) (2020-09-24T08:46:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。