論文の概要: (Un)paired signal-to-signal translation with 1D conditional GANs
- arxiv url: http://arxiv.org/abs/2403.04800v1
- Date: Tue, 5 Mar 2024 18:52:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 22:03:31.825942
- Title: (Un)paired signal-to-signal translation with 1D conditional GANs
- Title(参考訳): (Un)1次元条件付きGANを用いた信号-信号-信号変換
- Authors: Eric Easthope
- Abstract要約: 対数学習アーキテクチャを持つ条件生成対数ネットワーク(cGAN)は、信号とシグ2シグ(sig2sig)の変換が不可能であることを示す。
本稿では,従来のU-NetモデルやCycleGANとして開発された敵アーキテクチャに大幅な変更を加えることなく,2次元画像から画像への変換タスクを深い畳み込みGANで1次元信号から信号への変換タスクにリキャスト可能であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: I show that a one-dimensional (1D) conditional generative adversarial network
(cGAN) with an adversarial training architecture is capable of unpaired
signal-to-signal ("sig2sig") translation. Using a simplified CycleGAN model
with 1D layers and wider convolutional kernels, mirroring WaveGAN to reframe
two-dimensional (2D) image generation as 1D audio generation, I show that
recasting the 2D image-to-image translation task to a 1D signal-to-signal
translation task with deep convolutional GANs is possible without substantial
modification to the conventional U-Net model and adversarial architecture
developed as CycleGAN. With this I show for a small tunable dataset that noisy
test signals unseen by the 1D CycleGAN model and without paired training
transform from the source domain to signals similar to paired test signals in
the translated domain, especially in terms of frequency, and I quantify these
differences in terms of correlation and error.
- Abstract(参考訳): 1次元(1次元)条件付き生成型対向ネットワーク(cgan)と対向型トレーニングアーキテクチャは、信号対符号変換(sig2sig)が可能となることを示す。
1次元層とより広い畳み込みカーネルを持つ単純化されたCycleGANモデルを用いて、WaveGANを2次元(2次元)画像生成を1次元オーディオ生成として再配置し、2次元画像から画像への変換タスクを深い畳み込みGANで1次元信号から信号への変換タスクに再キャストすることは、従来のU-NetモデルやCycleGANとして開発された敵アーキテクチャに大幅に変更することなく可能であることを示す。
そこで本研究では,1D CycleGANモデルで見つからないノイズの多いテスト信号と,翻訳領域におけるペアテスト信号に似た信号,特に頻度の点で,ソース領域からペアトレーニング信号に変換することなく,これらの差分を相関と誤差で定量化する。
関連論文リスト
- GANFusion: Feed-Forward Text-to-3D with Diffusion in GAN Space [64.82017974849697]
我々は、単一視点2Dデータのみを用いて、人間の文字に対するフィードフォワードテキストから3D拡散生成器を訓練する。
GANFusionは、単一のビュー2DデータのみをトレーニングしたGANアーキテクチャを使用して、3Dデータの無条件トリプレーン機能を生成することから始まる。
論文 参考訳(メタデータ) (2024-12-21T17:59:17Z) - Residual ANODE [0.0]
データ駆動型モデル非依存型共振異常検出のための新しい手法であるR-ANODEを提案する。
R-ANODEの鍵は、正規化フローを小さく未知の信号成分に直接適合させることにより、異常検出タスクの誘導バイアスを高めることである。
本手法は,未知の信号区間が学習されたり固定されたりしても等しく動作し,信号区間の誤識別に対してさえ頑健であることを示す。
論文 参考訳(メタデータ) (2023-12-18T19:00:03Z) - Diffusion with Forward Models: Solving Stochastic Inverse Problems
Without Direct Supervision [76.32860119056964]
本稿では,直接観測されない信号の分布からサンプルを学習する拡散確率モデルを提案する。
コンピュータビジョンの課題3つの課題に対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2023-06-20T17:53:00Z) - Cocktail: Mixing Multi-Modality Controls for Text-Conditional Image
Generation [79.8881514424969]
テキスト条件拡散モデルは多種多様な内容の高忠実度画像を生成することができる。
しかし、言語表現はしばしば、想定された目的像の曖昧な記述を示す。
様々なモダリティを1つの埋め込みに混ぜるパイプラインであるCocktailを提案する。
論文 参考訳(メタデータ) (2023-06-01T17:55:32Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - Signal Reconstruction from Samples at Unknown Locations with Application to 2D Unknown View Tomography [2.284915385433677]
提案手法は, サンプル位置順序の特定において, ある程度の誤差に耐性があることを実証する。
これは2次元UVTの解析を行い、サンプリング理論の進歩と明確に関連付ける最初の作品である。
論文 参考訳(メタデータ) (2023-04-13T10:01:29Z) - Dimensionality-Varying Diffusion Process [52.52681373641533]
拡散モデルは、信号破壊プロセスを逆転して新しいデータを生成することを学習する。
信号分解による前方拡散過程の理論的一般化を行う。
FFHQで訓練された拡散モデルのFIDを,52.40から10.46までの1024Times1024$解像度で改善する。
論文 参考訳(メタデータ) (2022-11-29T09:05:55Z) - An Adaptive Sampling and Edge Detection Approach for Encoding Static
Images for Spiking Neural Networks [0.2519906683279152]
スパイキングニューラルネットワーク(SNN)は、人工ニューラルネットワークの第3世代と考えられている。
本稿では,エッジ検出と適応信号サンプリング手法を用いて,静的画像を時間的スパイク列車に符号化する方法を提案する。
論文 参考訳(メタデータ) (2021-10-19T19:31:52Z) - End-to-end translation of human neural activity to speech with a
dual-dual generative adversarial network [39.014888541156296]
人間の神経活動を直接音声に翻訳するエンド・ツー・エンドモデルを提案する。
参加者の注意を引くための新しい脳波データセット(EEG)を作成します。
提案手法は,ニューラルアクティビティの単語長と文長のシーケンスを音声に翻訳する。
論文 参考訳(メタデータ) (2021-10-13T10:54:41Z) - Deconvolution-and-convolution Networks [9.513595116909197]
2D畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンタスクの事実上の標準となっている。
最近の調査結果はCNNが1Dパターン認識の最良の選択肢ではないことを示唆している。
深層逆畳み込み畳み込みネットワークを学習し,新しい1次元データ処理アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:09Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。