Fugu-MT 論文翻訳(概要): Frequency-Time Diffusion with Neural Cellular Automata

論文の概要: Frequency-Time Diffusion with Neural Cellular Automata

arxiv url: http://arxiv.org/abs/2401.06291v1
Date: Thu, 11 Jan 2024 23:15:25 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-15 20:43:40.810194
Title: Frequency-Time Diffusion with Neural Cellular Automata
Title（参考訳）: ニューラルセルオートマタを用いた周波数時間拡散
Authors: John Kalkhof, Arlene K\"uhn, Yannik Frisch, Anirban Mukhopadhyay
Abstract要約: 拡散モデルのノイズ化は高品質な画像を合成する主要な生成技術となっている。それらは、特定の制限を課すUNetベースのアーキテクチャによって制約されることが多い。これらの課題に対処するために,ニューラルセルオートマタ法(NCA)の2つのバリエーションを提案する。
参考スコア（独自算出の注目度）: 1.1807848705528714
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Denoising Diffusion Models (DDMs) have become the leading generative technique for synthesizing high-quality images but are often constrained by their UNet-based architectures that impose certain limitations. In particular, the considerable size of often hundreds of millions of parameters makes them impractical when hardware resources are limited. However, even with powerful hardware, processing images in the gigapixel range is difficult. This is especially true in fields such as microscopy or satellite imaging, where such challenges arise from the limitation to a predefined generative size and the inefficient scaling to larger images. We present two variations of Neural Cellular Automata (NCA)-based DDM methods to address these challenges and jumpstart NCA-based DDMs: Diff-NCA and FourierDiff-NCA. Diff-NCA performs diffusion by using only local features of the underlying distribution, making it suitable for applications where local features are critical. To communicate global knowledge in image space, naive NCA setups require timesteps that increase with the image scale. We solve this bottleneck of current NCA architectures by introducing FourierDiff-NCA, which advances Diff-NCA by adding a Fourier-based diffusion process and combines the frequency-organized Fourier space with the image space. By initiating diffusion in the Fourier domain and finalizing it in the image space, FourierDiff-NCA accelerates global communication. We validate our techniques by using Diff-NCA (208k parameters) to generate high-resolution digital pathology scans at 576x576 resolution and FourierDiff-NCA (887k parameters) to synthesize CelebA images at 64x64, outperforming VNCA and five times bigger UNet-based DDMs. In addition, we demonstrate FourierDiff-NCA's capabilities in super-resolution, OOD image synthesis, and inpainting without additional training.
Abstract（参考訳）: Denoising Diffusion Models (DDM) は高品質な画像を合成する主要な生成技術となっているが、UNetベースのアーキテクチャによって制約されることが多い。特に、数億のパラメータのかなりのサイズは、ハードウェアリソースが限られている場合に実用的でない。しかし、強力なハードウェアであっても、ギガピクセル範囲での画像処理は困難である。これは顕微鏡や衛星画像といった分野において特に当てはまり、そのような課題は予め定義された生成サイズへの制限とより大きな画像への非効率なスケーリングから生じる。本稿では,これらの課題に対処するニューラルセルオートマタ(NCA)に基づくDDM法と,Diff-NCAとFourierDiff-NCAの2種類のNCAベースのDDM法を提案する。 Diff-NCAは、基礎となる分布の局所的特徴のみを用いることで拡散を行い、局所的特徴が重要となるアプリケーションに適している。画像空間におけるグローバルな知識を伝えるために、NAAセットアップは画像スケールで増加するタイムステップを必要とする。本稿では,Fourier-NCAを導入して現在のNAAアーキテクチャのボトルネックを解消し,Fourier-NCAの拡散プロセスを追加し,周波数構成されたFourier空間と画像空間を結合することでDiff-NCAを進展させる。フーリエ領域で拡散を開始し、画像空間で最終化することにより、フーリエディフNCAはグローバル通信を加速する。我々は、Diff-NCA(208kパラメータ)を用いて576x576解像度の高解像度デジタル病理スキャンとFourierDiff-NCA(887kパラメータ)を用いて、64x64でCelebA画像を合成し、VNCAと5倍のUNetベースのDDMより優れることを示す。さらに,FourierDiff-NCAの超高分解能,OOD画像合成,塗装における機能について,追加のトレーニングを伴わずに示す。

関連論文リスト

STAF: Sinusoidal Trainable Activation Functions for Implicit Neural Representation [7.2888019138115245]
Inlicit Neural Representations (INR) は、連続的な信号をモデリングするための強力なフレームワークとして登場した。 ReLUベースのネットワークのスペクトルバイアスは、十分に確立された制限であり、ターゲット信号の微細な詳細を捕捉する能力を制限する。 Sinusoidal Trainable Function Activation (STAF)について紹介する。 STAFは本質的に周波数成分を変調し、自己適応型スペクトル学習を可能にする。
論文参考訳（メタデータ） (2025-02-02T18:29:33Z)
Enhancing and Accelerating Diffusion-Based Inverse Problem Solving through Measurements Optimization [66.17291150498276]
textbfMeasurements textbfOptimization (MO)は,逆問題解決プロセスの各ステップで計測情報を統合するための,より効率的なプラグイン・アンド・プレイモジュールである。 MOを使用することで、複数のタスクにまたがる最新技術(SOTA)のパフォーマンスを確立することができ、大きな利点があります。
論文参考訳（メタデータ） (2024-12-05T07:44:18Z)
Neural Fourier Modelling: A Highly Compact Approach to Time-Series Analysis [9.969451740838418]
時系列解析のためのコンパクトで強力なソリューションであるニューラルフーリエモデリング(NFM)を導入する。 NFM はフーリエ変換 (FT) の2つの重要な性質 (i) 有限長時系列をフーリエ領域の関数としてモデル化する能力 (ii) フーリエ領域内のデータ操作の能力 (ii) に基礎を置いている。 NFMは幅広いタスクで最先端のパフォーマンスを達成しており、テスト時にこれまで見つからなかったサンプリングレートを持つ時系列シナリオに挑戦する。
論文参考訳（メタデータ） (2024-10-07T02:39:55Z)
Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks [4.499833362998488]
入射神経表現(INR)は、複雑な信号の連続的および分解非依存的な表現を提供するためにニューラルネットワークを使用する。提案したFKANは、第1層のフーリエ級数としてモデル化された学習可能なアクティベーション関数を用いて、タスク固有の周波数成分を効果的に制御し、学習する。実験結果から,提案したFKANモデルは,最先端の3つのベースラインスキームよりも優れていることがわかった。
論文参考訳（メタデータ） (2024-09-14T05:53:33Z)
PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [1.1970409518725493]
本稿では,基本関数から発生する時間的カーネルを含むPLEIA(Lynomial Expansion In Adaptive Distributed Event Systems)というニューラルネットワークのクラスを紹介する。低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
論文参考訳（メタデータ） (2024-05-20T17:06:24Z)
Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。 CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文参考訳（メタデータ） (2023-10-01T05:07:17Z)
Versatile Neural Processes for Learning Implicit Neural Representations [57.090658265140384]
本稿では,近似関数の能力を大幅に向上させるVersatile Neural Processs (VNP)を提案する。具体的には、より少ない情報的コンテキストトークンを生成するボトルネックエンコーダを導入し、高い計算コストを軽減した。提案したVNPが1D, 2D, 3D信号を含む様々なタスクに対して有効であることを示す。
論文参考訳（メタデータ） (2023-01-21T04:08:46Z)
Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文参考訳（メタデータ） (2022-11-26T01:56:05Z)
NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文参考訳（メタデータ） (2022-09-29T04:06:00Z)
Inception Transformer [151.939077819196]
インセプショントランスフォーマー(iFormer)は、視覚データ中の高周波数情報と低周波情報の両方で包括的特徴を学習する。我々は、iFormerを一連の視覚タスクでベンチマークし、画像分類、COCO検出、ADE20Kセグメンテーションにおいて優れた性能を発揮することを示した。
論文参考訳（メタデータ） (2022-05-25T17:59:54Z)
Batch Processing and Data Streaming Fourier-based Convolutional Neural Network Accelerator [4.7257913147626995]
ナビゲーション、トラッキング、リアルタイムマシンアクションシステムなど、多数のアプリケーションにおいて、最小レイテンシの人工ニューラルネットワークによる決定が最重要である。これにより、機械学習ハードウェアは、高いスループットで多次元データを処理する必要がある。本稿では,Fourier Convolutional Neural Network(FCNN)アクセラレータを用いた,ニューマンベースではない機械学習アクセラレーションを実演する。
論文参考訳（メタデータ） (2021-12-23T01:06:17Z)
Fast and Accurate Optical Fiber Channel Modeling Using Generative Adversarial Network [2.8821682752466975]
ファイバチャネル伝達関数の分布を学習するために, GAN(Generative Adversarial Network)について検討した。 GANは、異なる光打ち上げ能力、変調フォーマット、入力信号分布の下で堅牢な一般化能力を示す。
論文参考訳（メタデータ） (2020-02-28T10:54:27Z)
Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。 SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文参考訳（メタデータ） (2020-02-25T14:48:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。