論文の概要: On the Redundancy of Timestep Embeddings in Diffusion Models
- arxiv url: http://arxiv.org/abs/2606.20416v1
- Date: Thu, 18 Jun 2026 16:01:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.96978
- Title: On the Redundancy of Timestep Embeddings in Diffusion Models
- Title(参考訳): 拡散モデルにおける時間ステップ埋め込みの冗長性について
- Authors: José A. Chávez,
- Abstract要約: 拡散モデルは、様々なノイズスケールにわたる除音過程を変調するために、明示的な時間ステップの埋め込みに大きく依存する。
本研究では, ある条件下では, 時間経過条件を明示することなく, 拡散訓練対象のグローバル最小化を実現することができることを示す理論的枠組みを提案する。
分析の結果、これらのアーキテクチャは、特定の仮定の下で破損した入力から暗黙的にノイズスケールを推測し、明示的な時間的条件付けを冗長にすることができることが示唆された。
- 参考スコア(独自算出の注目度): 3.0458514384586404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models rely heavily on explicit timestep embeddings to modulate the denoising process across various noise scales. In this work, we challenge the necessity of these temporal signals by analyzing their impact on U-Net and Diffusion Transformer architectures. Beyond empirical evidence, we provide a theoretical framework demonstrating that, under certain conditions, the global minimizer of the diffusion training objective can be achieved without explicit timestep conditioning. Our findings reveal a surprising robustness when timestep embeddings are completely removed. Extensive ablation studies on the CelebA and CIFAR-10 datasets show that these time-agnostic models can maintain high structural fidelity and even surpass their conditioned counterparts in competitive metrics, including FID, precision, and recall. Our analysis suggests these architectures can implicitly infer noise scales from the corrupted input under specific assumptions, rendering explicit temporal conditioning redundant. This study challenges long-standing temporal conditioning paradigms and paves the way for more efficient and structurally focused generative architectures.
- Abstract(参考訳): 拡散モデルは、様々なノイズスケールにわたる除音過程を変調するために、明示的な時間ステップの埋め込みに大きく依存する。
本研究では,U-Net および Diffusion Transformer アーキテクチャへの影響を分析することで,これらの時間信号の必要性に挑戦する。
実験的な証拠の他に、ある条件下では、拡散訓練目標のグローバルな最小化を明示的な時間ステップ条件なしで達成できることを実証する理論的な枠組みを提供する。
以上の結果から,時間経過の埋め込みが完全に取り除かれたとき,驚くべき堅牢性を示した。
CelebAとCIFAR-10データセットの大規模なアブレーション研究は、これらの時間非依存モデルが高い構造的忠実性を維持し、FID、精度、リコールなどの競合指標で条件付きモデルを超えていることを示している。
分析の結果、これらのアーキテクチャは、特定の仮定の下で破損した入力から暗黙的にノイズスケールを推測し、明示的な時間的条件付けを冗長にすることができることが示唆された。
本研究は、長期の時間的条件付けパラダイムに挑戦し、より効率的で構造的に焦点を絞った生成的アーキテクチャの道を開く。
関連論文リスト
- AnchorMoE: Interpretable Time Series Classification via Anchor-Routed MoE [51.994752158953084]
AnchorMoEは、解釈可能な構成別分類フレームワークである。
ローカルパッチのマルチビュー表現をエンコードし、専門の専門家にルーティングする。
実世界のベンチマークと合成ベンチマークの実験は、AnchorMoEが非常に競争力のある分類性能を達成することを示した。
論文 参考訳(メタデータ) (2026-06-02T13:30:54Z) - A Representation-Consistent Gated Recurrent Framework for Robust Medical Time-Series Classification [0.0]
隠れ状態表現における時間的一貫性を強制する規則化された正規化戦略を導入するための表現一貫性を持つゲートリカレントフレームワーク(RC-GRF)を提案する。
提案するフレームワークはモデルに依存しないため,内部ゲーティング機構を変更することなく,既存のゲート型リカレントアーキテクチャに統合することができる。
論文 参考訳(メタデータ) (2026-02-10T17:16:49Z) - From Observations to States: Latent Time Series Forecasting [65.98504021691666]
本稿では,TSFを観測回帰から潜時予測に移行する新しいパラダイムであるLatent Time Series Forecasting(LatentTSF)を提案する。
具体的には、LatentTSFはAutoEncoderを使用して、各段階での観測結果を高次元の潜在状態空間に投影する。
提案する潜伏目標は,予測潜伏状態と地道状態と観測値との相互情報を暗黙的に最大化する。
論文 参考訳(メタデータ) (2026-01-30T20:39:44Z) - Spatio-Temporal Hierarchical Causal Models [12.518908171952113]
本稿では,階層因果モデリングを時間領域に拡張する新しいグラフィカルフレームワークである,時空間階層因果モデル(ST-HC-Ms)を紹介する。
我々のアプローチの核となるのは時空間崩壊理論であり、これは複雑なST-HC-Msが、量が増加するにつれて単純な平らな因果モデルに収束することを示している。
我々は、複雑な力学系における堅牢な因果推論の可能性を示すために、合成データセットと実世界のデータセットの両方でフレームワークを検証した。
論文 参考訳(メタデータ) (2025-11-25T17:56:43Z) - Structured Noise Modeling for Enhanced Time-Series Forecasting [0.0]
本研究は、構造的ノイズモデリングによる時間的忠実度を改善する予測ブルーデノエーズフレームワークを導入する。
電気、交通、太陽のデータセットにわたる実験は、マルチ水平精度と安定性において一貫した利得を示している。
このフレームワークは、エネルギー、インフラストラクチャ、その他の時間クリティカルドメインにわたる予測駆動決定サポートに使用される、より信頼性の高いAIシステムに寄与する。
論文 参考訳(メタデータ) (2025-11-24T19:44:46Z) - ReTimeCausal: EM-Augmented Additive Noise Models for Interpretable Causal Discovery in Irregular Time Series [32.21736212737614]
本稿では, 金融, 医療, 気候科学などの高度領域における不規則サンプル時系列における因果発見について検討する。
ReTimeCausalは,物理誘導型データ計算と疎因性推論を統一する付加雑音モデル(ANM)と期待最大化(EM)の新たな統合である。
論文 参考訳(メタデータ) (2025-07-04T05:39:50Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Generalized Diffusion Model with Adjusted Offset Noise [1.7767466724342067]
本稿では,厳密な確率的枠組みの中で自然に付加的な雑音を取り入れた一般化拡散モデルを提案する。
我々は、ある調整でノイズを相殺する理論的等価性を確立し、証拠の低い境界に基づいて損失関数を導出する。
合成データセットの実験により、我々のモデルは輝度に関する課題に効果的に対処し、高次元シナリオにおいて従来の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-12-04T08:57:03Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - Closed-form Continuous-Depth Models [99.40335716948101]
連続深度ニューラルモデルは高度な数値微分方程式解法に依存している。
我々は,CfCネットワークと呼ばれる,記述が簡単で,少なくとも1桁高速な新しいモデル群を提示する。
論文 参考訳(メタデータ) (2021-06-25T22:08:51Z) - Supporting Optimal Phase Space Reconstructions Using Neural Network
Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。
私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文 参考訳(メタデータ) (2020-06-19T21:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。