論文の概要: Seeking Physics in Diffusion Noise
- arxiv url: http://arxiv.org/abs/2603.14294v1
- Date: Sun, 15 Mar 2026 09:13:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.728626
- Title: Seeking Physics in Diffusion Noise
- Title(参考訳): 拡散騒音の物理を探る
- Authors: Chujun Tang, Lei Zhong, Fangqiang Ding,
- Abstract要約: 我々は、事前訓練された拡散変換器(DiT)の中間雑音表現を探索する。
物理的に可視で不明瞭なビデオは、ノイズレベルを越えて中間層の特徴空間で部分的に分離可能である。
この分離性は、視覚的品質やジェネレータの同一性によるものではない。
- 参考スコア(独自算出の注目度): 10.775494410304418
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Do video diffusion models encode signals predictive of physical plausibility? We probe intermediate denoising representations of a pretrained Diffusion Transformer (DiT) and find that physically plausible and implausible videos are partially separable in mid-layer feature space across noise levels. This separability cannot be fully attributed to visual quality or generator identity, suggesting recoverable physics-related cues in frozen DiT features. Leveraging this observation, we introduce progressive trajectory selection, an inference-time strategy that scores parallel denoising trajectories at a few intermediate checkpoints using a lightweight physics verifier trained on frozen features, and prunes low-scoring candidates early. Extensive experiments on PhyGenBench demonstrate that our method improves physical consistency while reducing inference cost, achieving comparable results to Best-of-K sampling with substantially fewer denoising steps.
- Abstract(参考訳): 映像拡散モデルは物理可視性を予測する信号を符号化するか?
本研究では,事前訓練した拡散変圧器(DiT)の中間雑音化表現を探索し,物理的に可視かつ不明瞭なビデオは,雑音レベルを越えて中層特徴空間で部分的に分離可能であることを示す。
この分離性は、視覚的品質やジェネレータの同一性によるものではない。
この観測を応用して、進行軌跡選択(progressive trajectory selection)を導入し、凍結した特徴に基づいて訓練された軽量物理検証器を用いて、いくつかの中間チェックポイントで並列デノイング軌跡をスコアする推論時戦略を導入し、早期に低スコア候補を抽出する。
PhyGenBenchの広範囲な実験により,提案手法は推論コストを低減しつつ物理的整合性を向上し,より少ない復調ステップでBest-of-Kサンプリングに匹敵する結果が得られた。
関連論文リスト
- InJecteD: Analyzing Trajectories and Drift Dynamics in Denoising Diffusion Probabilistic Models for 2D Point Cloud Generation [48.55037712252843]
InJecteDは拡散確率モデル(DDPM)を解釈するフレームワーク
このフレームワークをDatasaurus Dozen bullseye, dino, circleの3つのデータセットに適用する。
提案手法は, 変位, 速度, クラスタリング, ドリフト場力学などの軌道特性を定量的に評価する。
論文 参考訳(メタデータ) (2025-09-09T14:53:19Z) - Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - On Equivariance and Fast Sampling in Video Diffusion Models Trained with Warped Noise [27.524057973734145]
入力雑音の空間変換に同値であるように、歪んだ雑音を訓練できることが示される。
これにより、入力ノイズ中の動きは、生成されたビデオ内の動きと自然に一致させることができる。
EquiVDMはサンプリングのステップをはるかに少なくすることで、同等または優れた品質を達成する。
論文 参考訳(メタデータ) (2025-04-14T01:26:29Z) - Learning Provably Robust Estimators for Inverse Problems via Jittering [51.467236126126366]
簡単な正規化手法であるジッタリングが,逆問題に対する最悪ケース頑健な推定器の学習に有効かどうかを検討する。
ジッタリングは最悪の場合のロバスト性を大幅に向上させるが,デノイング以上の逆問題に最適であることを示す。
論文 参考訳(メタデータ) (2023-07-24T14:19:36Z) - Interpreting and Improving Diffusion Models from an Optimization Perspective [4.5993996573872185]
我々はこの観測を用いて、ユークリッド距離関数に適用された近似勾配勾配勾配として拡散モデルを解釈する。
本稿では,理論結果からの洞察を用いてDDIMを一般化した新しい勾配推定サンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T00:56:33Z) - ShiftDDPMs: Exploring Conditional Diffusion Models by Shifting Diffusion
Trajectories [144.03939123870416]
本稿では,前処理に条件を導入することで,新しい条件拡散モデルを提案する。
いくつかのシフト規則に基づいて各条件に対して排他的拡散軌跡を割り当てるために、余剰潜在空間を用いる。
我々は textbfShiftDDPMs と呼ぶメソッドを定式化し、既存のメソッドの統一的な視点を提供する。
論文 参考訳(メタデータ) (2023-02-05T12:48:21Z) - DDPM-CD: Denoising Diffusion Probabilistic Models as Feature Extractors
for Change Detection [31.125812018296127]
Deno Diffusion Probabilistic Model (DDPM) の事前学習による変化検出のための新しいアプローチを提案する。
DDPMは、訓練画像を徐々にマルコフ連鎖を用いてガウス分布に変換することにより、トレーニングデータ分布を学習する。
推論(サンプリング)中に、トレーニング分布に近い多様なサンプルセットを生成することができる。
LEVIR-CD, WHU-CD, DSIFN-CD, CDDデータセットを用いて行った実験により,提案手法は既存の変化検出法よりもF1スコアで大幅に優れており, I。
論文 参考訳(メタデータ) (2022-06-23T17:58:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。