論文の概要: DiffATS: Diffusion in Aligned Tensor Space
- arxiv url: http://arxiv.org/abs/2605.09275v1
- Date: Sun, 10 May 2026 02:53:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.160168
- Title: DiffATS: Diffusion in Aligned Tensor Space
- Title(参考訳): DiffATS: アライメントされたテンソル空間での拡散
- Authors: Jinhua Lyu, Tianmin Yu, Brian Kim, Lizhuo Zhou, Chanwook Park, Naichen Shi,
- Abstract要約: 予め訓練された圧縮オートエンコーダを使わずにデータ依存テンソルプリミティブを構築する。
※空間での拡散*(DiffATS)はテンソルプリミティブ上で拡散モデルを直接訓練する生成フレームワークである。
- 参考スコア(独自算出の注目度): 3.8961572818716768
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Direct diffusion modeling of high-resolution spatiotemporal fields is computationally challenging. Parameter-efficient primitives address this by representing high-dimensional data with a compact set of parameters. In this paper, we construct data-dependent tensor primitives without pretrained compression autoencoders. Our construction starts from Tucker decomposition, which captures low-rank multilinear structure through a core tensor and mode-wise factors. However, Tucker factors are non-unique: the same tensor can be represented by different rotated factors, which complicates generative modeling. We address this issue with orthogonal Procrustes (OP) alignment. Specifically, we select medoid anchor matrices from the data and align the factor matrices to resolve the gauge ambiguity. This yields matrix Grassmannian primitives and tensor Grassmannian primitives that are compact, data-adaptive, and directly decodable by explicit multilinear reconstruction. Theoretically, we prove that the proposed primitive maps are homeomorphisms between low-rank tensors and their corresponding primitive spaces, certifying that the representations are non-degenerate and topologically faithful. Building on these primitives, we propose *Diffusion in Aligned Tensor Space* (DiffATS), a generative framework that trains diffusion models directly on aligned tensor primitives. Across images, videos, and PDE solutions, DiffATS achieves strong unconditional and conditional generation performance while compressing original data by $3.9\times$ to $210\times$, without relying on any pretrained deep compression autoencoders.
- Abstract(参考訳): 高分解能時空間場の直接拡散モデリングは計算的に困難である。
パラメータ効率の良いプリミティブは、パラメータのコンパクトなセットで高次元データを表現することでこの問題に対処する。
本稿では,事前訓練された圧縮オートエンコーダを使わずにデータ依存型テンソルプリミティブを構築する。
我々の構成はTucker分解から始まり、コアテンソルとモードワイドファクタを通して低ランクのマルチ線形構造をキャプチャする。
しかし、タッカー因子は非特異であり、同じテンソルは異なる回転因子で表され、生成的モデリングが複雑になる。
直交プロクリスト(OP)アライメントでこの問題に対処する。
具体的には、データからメドイドアンカー行列を選択し、係数行列を整列させてゲージのあいまいさを解消する。
これにより、行列のグラスマン原始体とテンソルのグラスマン原始体はコンパクトで、データ適応的で、明示的な多重線型再構成によって直接退化可能である。
理論的には、提案された原始写像がローランクテンソルとその対応する原始空間の間の同型であることを証明し、表現が非退化かつ位相的に忠実であることを証明する。
これらのプリミティブの上に構築された *Diffusion in Aligned Tensor Space* (DiffATS) は、アライメントテンソルプリミティブ上で拡散モデルを直接訓練する生成フレームワークである。
画像、ビデオ、PDEソリューション全体で、DiffATSは、事前訓練されたディープ圧縮オートエンコーダに頼ることなく、元のデータを$3.9\times$から$210\times$に圧縮しながら、強い無条件および条件生成性能を達成する。
関連論文リスト
- Rethinking Diffusion Models with Symmetries through Canonicalization with Applications to Molecular Graph Generation [56.361076943802594]
CanonFlowは、挑戦的なGEOM-DRUGデータセット上で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-16T18:58:55Z) - Low-Rank Tensor Recovery via Variational Schatten-p Quasi-Norm and Jacobian Regularization [49.85875869048434]
暗黙的神経表現のためのニューラルネットワークによりパラメータ化されたCPベースの低ランクテンソル関数を提案する。
本研究では、スペーサーCP分解を実現するために、冗長なランク1成分に変分Schatten-p quasi-normを導入する。
滑らか性のために、ヤコビアンとハッチンソンのトレース推定器のスペクトルノルムに基づく正規化項を提案する。
論文 参考訳(メタデータ) (2025-06-27T11:23:10Z) - Orientation-Aware Sparse Tensor PCA for Efficient Unsupervised Feature Selection [7.887782360541216]
非教師付き特徴選択(UFS)に分解(TD)技術を導入する。
この問題を解決するために、スパース特異値分解の向きに依存したテンソルテンソル積を用いる。
提案したテンソルPCAモデルは,所定のモードで間隔を制限し,スパーステンソル主成分を得る。
論文 参考訳(メタデータ) (2024-07-24T04:04:56Z) - Efficient Nonparametric Tensor Decomposition for Binary and Count Data [27.02813234958821]
本稿では、二分数テンソルと数テンソルのアンダーラインデコンポジションとして、アンダーライン効率のアンダーラインNonアンダーラインテンソルであるENTEDを提案する。
論文 参考訳(メタデータ) (2024-01-15T14:27:03Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Non-intrusive reduced order modeling of natural convection in porous
media using convolutional autoencoders: comparison with linear subspace
techniques [0.0]
多孔質媒質中の自然対流は、多くの工学的応用に関連する非常に非線形な多物理問題である。
深部畳み込み自己エンコーダを用いた多孔質媒体における自然対流の非侵襲的縮小秩序モデルを提案する。
論文 参考訳(メタデータ) (2021-07-23T20:58:15Z) - Generative Model without Prior Distribution Matching [26.91643368299913]
変分オートエンコーダ(VAE)とその変分は、いくつかの先行分布を満たすために低次元の潜在表現を学習することによって古典的な生成モデルである。
我々は、先行変数に適合させるのではなく、先行変数が埋め込み分布と一致するように提案する。
論文 参考訳(メタデータ) (2020-09-23T09:33:24Z) - Learning Bijective Feature Maps for Linear ICA [73.85904548374575]
画像データに適した既存の確率的深層生成モデル (DGM) は, 非線形ICAタスクでは不十分であることを示す。
そこで本研究では,2次元特徴写像と線形ICAモデルを組み合わせることで,高次元データに対する解釈可能な潜在構造を学習するDGMを提案する。
画像上のフローベースモデルや線形ICA、変分オートエンコーダよりも、高速に収束し、訓練が容易なモデルを作成し、教師なしの潜在因子発見を実現する。
論文 参考訳(メタデータ) (2020-02-18T17:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。