論文の概要: Frequency-Time Diffusion with Neural Cellular Automata
- arxiv url: http://arxiv.org/abs/2401.06291v2
- Date: Mon, 13 May 2024 12:56:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-15 00:33:27.706692
- Title: Frequency-Time Diffusion with Neural Cellular Automata
- Title(参考訳): ニューラルセルオートマタを用いた周波数時間拡散
- Authors: John Kalkhof, Arlene Kühn, Yannik Frisch, Anirban Mukhopadhyay,
- Abstract要約: Diff-NCAとFourierDiff-NCAの2つのニューラルセルオートマタに基づくデノイング拡散モデルを導入する。
CelebAデータセットのような重要なグローバル機能を備えた複雑なイメージの合成に十分な価値がある。
331kパラメータのDiff-NCAでも512x512の病理スライスを生成でき、FourierDiff-NCA(1.1mパラメータ)は128.2の4倍のUNet(3.94mパラメータ)よりも3倍低いFIDスコア43.86に達することを示した。
- 参考スコア(独自算出の注目度): 1.0808810256442274
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite considerable success, large Denoising Diffusion Models (DDMs) with UNet backbone pose practical challenges, particularly on limited hardware and in processing gigapixel images. To address these limitations, we introduce two Neural Cellular Automata (NCA)-based DDMs: Diff-NCA and FourierDiff-NCA. Capitalizing on the local communication capabilities of NCA, Diff-NCA significantly reduces the parameter counts of NCA-based DDMs. Integrating Fourier-based diffusion enables global communication early in the diffusion process. This feature is particularly valuable in synthesizing complex images with important global features, such as the CelebA dataset. We demonstrate that even a 331k parameter Diff-NCA can generate 512x512 pathology slices, while FourierDiff-NCA (1.1m parameters) reaches a three times lower FID score of 43.86, compared to the four times bigger UNet (3.94m parameters) with a score of 128.2. Additionally, FourierDiff-NCA can perform diverse tasks such as super-resolution, out-of-distribution image synthesis, and inpainting without explicit training.
- Abstract(参考訳): 大きなDenoising Diffusion Models (DDM)とUNetのバックボーンは大きな成功にもかかわらず、特に限られたハードウェアやギガピクセル画像の処理において、実用的な課題を提起している。
これらの制約に対処するために、我々は2つのニューラルセルラーオートマタ(NCA)ベースのDDM(Diff-NCAとFourierDiff-NCA)を導入する。
Diff-NCAは、NCAのローカル通信能力を利用して、NCAベースのDDMのパラメータ数を著しく削減する。
フーリエに基づく拡散を統合することで、拡散過程の早い段階でグローバル通信が可能になる。
この機能は、CelebAデータセットのような重要なグローバル機能を備えた複雑なイメージの合成に特に有用である。
331kパラメータのDiff-NCAでも512x512の病理スライスを生成でき、FourierDiff-NCA(1.1mパラメータ)は128.2の4倍のUNet(3.94mパラメータ)よりも3倍低いFIDスコア43.86に達することを示した。
さらに、FourierDiff-NCAは、過分解能、アウト・オブ・ディストリビューション画像合成、塗装などの様々なタスクを明示的なトレーニングなしで実行できる。
関連論文リスト
- Neural Fourier Modelling: A Highly Compact Approach to Time-Series Analysis [9.969451740838418]
時系列解析のためのコンパクトで強力なソリューションであるニューラルフーリエモデリング(NFM)を導入する。
NFM はフーリエ変換 (FT) の2つの重要な性質 (i) 有限長時系列をフーリエ領域の関数としてモデル化する能力 (ii) フーリエ領域内のデータ操作の能力 (ii) に基礎を置いている。
NFMは幅広いタスクで最先端のパフォーマンスを達成しており、テスト時にこれまで見つからなかったサンプリングレートを持つ時系列シナリオに挑戦する。
論文 参考訳(メタデータ) (2024-10-07T02:39:55Z) - Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks [4.499833362998488]
入射神経表現(INR)は、複雑な信号の連続的および分解非依存的な表現を提供するためにニューラルネットワークを使用する。
提案したFKANは、第1層のフーリエ級数としてモデル化された学習可能なアクティベーション関数を用いて、タスク固有の周波数成分を効果的に制御し、学習する。
実験結果から,提案したFKANモデルは,最先端の3つのベースラインスキームよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-09-14T05:53:33Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Versatile Neural Processes for Learning Implicit Neural Representations [57.090658265140384]
本稿では,近似関数の能力を大幅に向上させるVersatile Neural Processs (VNP)を提案する。
具体的には、より少ない情報的コンテキストトークンを生成するボトルネックエンコーダを導入し、高い計算コストを軽減した。
提案したVNPが1D, 2D, 3D信号を含む様々なタスクに対して有効であることを示す。
論文 参考訳(メタデータ) (2023-01-21T04:08:46Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Inception Transformer [151.939077819196]
インセプショントランスフォーマー(iFormer)は、視覚データ中の高周波数情報と低周波情報の両方で包括的特徴を学習する。
我々は、iFormerを一連の視覚タスクでベンチマークし、画像分類、COCO検出、ADE20Kセグメンテーションにおいて優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-05-25T17:59:54Z) - Batch Processing and Data Streaming Fourier-based Convolutional Neural
Network Accelerator [4.7257913147626995]
ナビゲーション、トラッキング、リアルタイムマシンアクションシステムなど、多数のアプリケーションにおいて、最小レイテンシの人工ニューラルネットワークによる決定が最重要である。
これにより、機械学習ハードウェアは、高いスループットで多次元データを処理する必要がある。
本稿では,Fourier Convolutional Neural Network(FCNN)アクセラレータを用いた,ニューマンベースではない機械学習アクセラレーションを実演する。
論文 参考訳(メタデータ) (2021-12-23T01:06:17Z) - Fast and Accurate Optical Fiber Channel Modeling Using Generative
Adversarial Network [2.8821682752466975]
ファイバチャネル伝達関数の分布を学習するために, GAN(Generative Adversarial Network)について検討した。
GANは、異なる光打ち上げ能力、変調フォーマット、入力信号分布の下で堅牢な一般化能力を示す。
論文 参考訳(メタデータ) (2020-02-28T10:54:27Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。