論文の概要: Watch Your Step: Information Injection in Diffusion Models via Shadow Timestep Embedding
- arxiv url: http://arxiv.org/abs/2605.00935v1
- Date: Fri, 01 May 2026 03:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.494219
- Title: Watch Your Step: Information Injection in Diffusion Models via Shadow Timestep Embedding
- Title(参考訳): シャドウタイムステップ埋め込みによる拡散モデルにおける情報注入
- Authors: An Huang, Junggab Son, Zuobin Xiong,
- Abstract要約: 本稿では,拡散モデルに悪質な情報注入を行うための時間空間の未利用を調査する新しいメカニズムであるシャドータイムステップ埋め込み(STE)を紹介する。
特に、タイムステップ埋め込み空間でズームインすると、異なるタイムステップが、サイドチャネル情報をエンコードできる異なる表現能力を示すことが分かる。
本研究は, 時間次元の理解により, 拡散モデルの時間経過を専用情報を運ぶための強力な側流として明らかにし, 対向生成モデルのための新たな方向を動機づけるものである。
- 参考スコア(独自算出の注目度): 6.490330531143652
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have become the foundation of modern generative systems, with most research focusing primarily on improving generation efficiency and output quality. The timestep embedding component is a crucial part of the diffusion pipeline, which provides a temporal conditioning signal to the denoising network, enabling it to adapt its predictions across different noise levels throughout the process. Despite their potential to contain substantial information, timestep embeddings remain underexplored in current research, especially for security risks and reliable provenance. To fill this gap, we introduce Shadow Timestep Embedding (STE), a novel mechanism that investigates the underutilized temporal space for malicious information injection into diffusion models. In particular, when zooming in on the timestep embedding space, we find that different timesteps exhibit distinct representational capabilities that can encode side-channel information. Moreover, such encoded information can be utilized for attack and defense purposes through the scheduler interface. We present a theoretical analysis of timestep embeddings as position-encoding mappings and derive a mutual coherence evaluation that explains the separability of disjoint timestep intervals. Our findings reveal the diffusion model's timestep as a powerful side channel for carrying dedicated information, motivating new directions for adversarial generative modeling by understanding the temporal dimension.
- Abstract(参考訳): 拡散モデルは近代的な生成システムの基盤となり、ほとんどの研究は生成効率と出力品質の改善に重点を置いている。
タイムステップ埋め込みコンポーネントは拡散パイプラインの重要な部分であり、デノナイジングネットワークに時間条件信号を提供し、プロセス全体を通して異なるノイズレベルにわたって予測を適応できるようにする。
かなりの情報を含む可能性にもかかわらず、現在の研究、特にセキュリティリスクと信頼性の高い前兆について、タイムステップの埋め込みは未調査のままである。
このギャップを埋めるために,拡散モデルに悪意のある情報注入を行うための時間空間の未利用を調査する新しいメカニズムであるShadow Timestep Embedding (STE)を導入する。
特に、タイムステップ埋め込み空間でズームインすると、異なるタイムステップが、サイドチャネル情報をエンコードできる異なる表現能力を示すことが分かる。
さらに、スケジューラインタフェースを介して、このような符号化された情報を攻撃および防御目的に利用することができる。
本稿では,時間ステップの埋め込みを位置符号化マッピングとして理論的に解析し,不連続時間ステップ間隔の分離性を説明する相互コヒーレンス評価を導出する。
本研究は, 時間次元の理解により, 拡散モデルの時間経過を専用情報を運ぶための強力な側流として明らかにし, 対向生成モデルのための新たな方向を動機づけるものである。
関連論文リスト
- Temporal Concept Dynamics in Diffusion Models via Prompt-Conditioned Interventions [70.87254264798341]
PCIは、拡散時間を通して概念力学を解析するためのトレーニング不要でモデルに依存しないフレームワークである。
拡散モデルにまたがる様々な時間的挙動を明らかにしており、同じ概念タイプであっても、軌道の特定の位相は特定の概念に好適である。
論文 参考訳(メタデータ) (2025-12-09T11:05:08Z) - RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion [64.49056527678606]
本稿では,U-Net拡散モデルだけでなく,レーダ時間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高資源コストを発生させることなく,アーキテクチャに注意を集中させる。
実験と評価により,提案手法は複雑な降水予測シナリオにおいて,最先端の手法,ロバストネスの局所的忠実度,一般化,優位性を著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-10-16T17:59:13Z) - Channel-aware Contrastive Conditional Diffusion for Multivariate Probabilistic Time Series Forecasting [19.383395337330082]
本稿では,CCDM(Contrastive Conditional Diffusion)モデルを提案する。
提案したCCDMは,現在最先端の拡散予測器と比較して優れた予測能力を示すことができる。
論文 参考訳(メタデータ) (2024-10-03T03:13:15Z) - A Temporally Disentangled Contrastive Diffusion Model for Spatiotemporal Imputation [35.46631415365955]
C$2$TSDという条件拡散フレームワークを導入する。
実世界の3つのデータセットに対する我々の実験は、最先端のベースラインと比較して、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2024-02-18T11:59:04Z) - APLA: Additional Perturbation for Latent Noise with Adversarial Training Enables Consistency [9.07931905323022]
拡散モデルに基づく新しいテキスト・ツー・ビデオ(T2V)生成ネットワーク構造を提案する。
提案手法では,1本の動画を入力として必要とせず,事前学習した安定拡散ネットワーク上に構築する。
我々は、変換器と畳み込みのハイブリッドアーキテクチャを活用して、時間的複雑さを補償し、ビデオ内の異なるフレーム間の一貫性を向上させる。
論文 参考訳(メタデータ) (2023-08-24T07:11:00Z) - Instructed Diffuser with Temporal Condition Guidance for Offline
Reinforcement Learning [71.24316734338501]
テンポラリ・コンポラブル・ディフューザ(TCD)を用いた実効時間条件拡散モデルを提案する。
TCDは、相互作用シーケンスから時間情報を抽出し、時間条件で生成を明示的にガイドする。
提案手法は,従来のSOTAベースラインと比較して最高の性能を達成または一致させる。
論文 参考訳(メタデータ) (2023-06-08T02:12:26Z) - Diffusion Recommender Model [85.9640416600725]
そこで我々は,DiffRecと呼ばれる新しい拡散レコメンダモデルを提案し,その生成過程を認知的に学習する。
ユーザインタラクションにおけるパーソナライズされた情報を維持するため、DiffRecは追加のノイズを低減し、画像合成のような純粋なノイズに対するユーザのインタラクションを損なうことを避ける。
論文 参考訳(メタデータ) (2023-04-11T04:31:00Z) - Generative Time Series Forecasting with Diffusion, Denoise, and
Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。
実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。
本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2023-01-08T12:20:46Z) - Focus of Attention Improves Information Transfer in Visual Features [80.22965663534556]
本稿では,真のオンライン環境下での視覚情報伝達のための教師なし学習に焦点を当てた。
エントロピー項の計算は、エントロピー項のオンライン推定を行う時間的プロセスによって行われる。
入力確率分布をよりよく構成するために,人間のような注目モデルを用いる。
論文 参考訳(メタデータ) (2020-06-16T15:07:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。