論文の概要: Optimal Condition Training for Target Source Separation
- arxiv url: http://arxiv.org/abs/2211.05927v1
- Date: Fri, 11 Nov 2022 00:04:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 17:15:18.684881
- Title: Optimal Condition Training for Target Source Separation
- Title(参考訳): ターゲット源分離のための最適条件訓練
- Authors: Efthymios Tzinis, Gordon Wichern, Paris Smaragdis and Jonathan Le Roux
- Abstract要約: 単一チャネルターゲットソース分離のための最適条件学習法を提案する。
多様な意味概念によってもたらされる相補的な情報は、興味の源泉を乱して分離するのに大いに役立ちます。
- 参考スコア(独自算出の注目度): 56.86138859538063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent research has shown remarkable performance in leveraging multiple
extraneous conditional and non-mutually exclusive semantic concepts for sound
source separation, allowing the flexibility to extract a given target source
based on multiple different queries. In this work, we propose a new optimal
condition training (OCT) method for single-channel target source separation,
based on greedy parameter updates using the highest performing condition among
equivalent conditions associated with a given target source. Our experiments
show that the complementary information carried by the diverse semantic
concepts significantly helps to disentangle and isolate sources of interest
much more efficiently compared to single-conditioned models. Moreover, we
propose a variation of OCT with condition refinement, in which an initial
conditional vector is adapted to the given mixture and transformed to a more
amenable representation for target source extraction. We showcase the
effectiveness of OCT on diverse source separation experiments where it improves
upon permutation invariant models with oracle assignment and obtains
state-of-the-art performance in the more challenging task of text-based source
separation, outperforming even dedicated text-only conditioned models.
- Abstract(参考訳): 近年の研究では、複数の条件付きおよび非相互排他的セマンティックな概念を音源分離に活用することにより、複数の異なるクエリに基づいて所定のターゲットソースを抽出する柔軟性が向上している。
そこで本研究では,与えられた目標源に関する等価条件のうち,最も高い実行条件を用いたグリーディパラメータ更新に基づく,単一チャネルの目標源分離のための最適条件訓練(oct)手法を提案する。
実験の結果,多種多様な意味概念が持つ相補的情報は,単一条件モデルに比べてはるかに効率的に関心の源を絡めて分離するのに役立つことがわかった。
さらに, 初期条件ベクトルを与えられた混合に適合させ, 対象ソース抽出のためのより可換な表現に変換した, 条件の精細化を伴う oct の変種を提案する。
我々は,OCTの多様な音源分離実験における有効性を示し,オラクル代入による置換不変モデルの改善とテキストベース音源分離の課題における最先端性能の獲得について述べる。
関連論文リスト
- CONTRAST: Continual Multi-source Adaptation to Dynamic Distributions [42.293444710522294]
Continual Multi-source Adaptation to Dynamic Distributions (CONTRAST) は、複数のソースモデルを最適に組み合わせて動的テストデータに適応する新しい手法である。
提案手法は,ソースモデルを最適に組み合わせ,モデル更新の優先順位付けを最小限に行うことができることを示す。
論文 参考訳(メタデータ) (2024-01-04T22:23:56Z) - JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。
従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。
本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文 参考訳(メタデータ) (2023-12-20T08:05:57Z) - Improving Diversity in Zero-Shot GAN Adaptation with Semantic Variations [61.132408427908175]
0ショットのGAN適応は、よく訓練されたジェネレータを再利用して、目に見えないターゲットドメインの画像を合成することを目的としている。
実際の画像の代わりに1つの代表的テキスト機能しか持たないため、合成された画像は徐々に多様性を損なう。
そこで本研究では,CLIP空間における対象テキストの意味的変化を見つけるための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T08:12:28Z) - Complete and separate: Conditional separation with missing target source
attribute completion [27.215800308343322]
本稿では、入力混合物と対象ソースに関する部分的意味情報を与えられたモデルを用いて、追加の意味データを抽出する手法を提案する。
次に、この事前学習モデルを用いて、未結合のマルチ条件分離ネットワークの分離性能を改善する。
論文 参考訳(メタデータ) (2023-07-27T03:53:53Z) - Towards Estimating Transferability using Hard Subsets [25.86053764521497]
HASTEは、ターゲットデータのより厳しいサブセットのみを用いて、ソースモデルの特定のターゲットタスクへの転送可能性を推定する新しい戦略である。
HASTEは既存の転送可能性測定値と組み合わせて信頼性を向上させることができることを示す。
複数のソースモデルアーキテクチャ、ターゲットデータセット、トランスファー学習タスクにまたがる実験結果から、HASTEの修正されたメトリクスは、一貫して、あるいは、アートトランスファービリティーメトリクスの状態と同等であることが示された。
論文 参考訳(メタデータ) (2023-01-17T14:50:18Z) - Model ensemble instead of prompt fusion: a sample-specific knowledge
transfer method for few-shot prompt tuning [85.55727213502402]
我々は、ソースタスクのソフトプロンプトから知識を伝達することで、プロンプトチューニングにおける数ショットのパフォーマンスを改善することに集中する。
我々はソースモデル(SESoM)のサンプル固有アンサンブルを提案する。
SESoMは、ソースモデルが出力されるときに、ターゲットの各サンプルに対するソースモデルのコントリビューションを個別に調整することを学ぶ。
論文 参考訳(メタデータ) (2022-10-23T01:33:16Z) - Exploiting Temporal Structures of Cyclostationary Signals for
Data-Driven Single-Channel Source Separation [98.95383921866096]
単一チャネルソース分離(SCSS)の問題点について検討する。
我々は、様々なアプリケーション領域に特に適するサイクロ定常信号に焦点を当てる。
本稿では,最小MSE推定器と競合するU-Netアーキテクチャを用いたディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T14:04:56Z) - Heterogeneous Target Speech Separation [52.05046029743995]
我々は,非相互排他的概念を用いて興味のあるソースを区別できる単一チャネルターゲットソース分離のための新しいパラダイムを提案する。
提案する異種分離フレームワークは,分散シフトが大きいデータセットをシームレスに利用することができる。
論文 参考訳(メタデータ) (2022-04-07T17:14:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。