論文の概要: Can We Change the Stroke Size for Easier Diffusion?
- arxiv url: http://arxiv.org/abs/2603.26783v1
- Date: Wed, 25 Mar 2026 06:03:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.603619
- Title: Can We Change the Stroke Size for Easier Diffusion?
- Title(参考訳): ストロークサイズはもっと拡散しやすいか?
- Authors: Yunwei Bai, Ying Kiat Tan, Yao Shu, Tsuhan Chen,
- Abstract要約: 我々は,脳卒中サイズの制御を制御介入として検討し,監督対象の効果的な粗さ,予測,時間経過による摂動を変化させる。
我々は、理論的にも経験的にも介入の利点とトレードオフを分析します。
- 参考スコア(独自算出の注目度): 14.892869542625697
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models can be challenged in the low signal-to-noise regime, where they have to make pixel-level predictions despite the presence of high noise. The geometric intuition is akin to using the finest stroke for oil painting throughout, which may be ineffective. We therefore study stroke-size control as a controlled intervention that changes the effective roughness of the supervised target, predictions and perturbations across timesteps, in an attempt to ease the low signal-to-noise challenge. We analyze the advantages and trade-offs of the intervention both theoretically and empirically. Code will be released.
- Abstract(参考訳): 拡散モデルは低信号対雑音方式では、高いノイズがあるにもかかわらずピクセルレベルの予測を行う必要がある。
幾何学的直観は、油彩画に最も優れたストロークを使うのに似ているが、これは効果がないかもしれない。
そこで我々は,脳卒中サイズの制御を制御介入として検討し,教師対象の効果的な粗さ,時間経過の予測,摂動を変化させ,低信号対雑音課題の緩和を図る。
我々は、理論的にも経験的にも介入の利点とトレードオフを分析します。
コードはリリースされる。
関連論文リスト
- Seeking Physics in Diffusion Noise [10.775494410304418]
我々は、事前訓練された拡散変換器(DiT)の中間雑音表現を探索する。
物理的に可視で不明瞭なビデオは、ノイズレベルを越えて中間層の特徴空間で部分的に分離可能である。
この分離性は、視覚的品質やジェネレータの同一性によるものではない。
論文 参考訳(メタデータ) (2026-03-15T09:13:23Z) - VAGUEGAN: Stealthy Poisoning and Backdoor Attacks on Image Generative Pipelines [0.0]
本研究では,モジュール型摂動ネットワークPoisonerNetとGenerator Discriminatorペアを組み合わせた攻撃パイプラインであるVagGANを紹介した。
実験では、汚染された出力はクリーンな出力よりも視覚的品質が高いことが示され、毒が必ずしも忠実度を低下させるという仮定に挑戦する。
論文 参考訳(メタデータ) (2025-09-29T15:02:31Z) - Rethinking Oversaturation in Classifier-Free Guidance via Low Frequency [7.3604864243987365]
低周波信号に基づく新しい視点を導入する。
これらの信号の冗長な情報の蓄積は、過飽和や非現実的なアーティファクトの背後にある重要な要因である。
実験により,LF-CFGは様々な拡散モデルにおける過飽和や非現実的アーティファクトを効果的に緩和することを示した。
論文 参考訳(メタデータ) (2025-06-26T16:34:00Z) - Divide and Conquer: Heterogeneous Noise Integration for Diffusion-based Adversarial Purification [75.09791002021947]
既存の浄化法は,前向き拡散過程を通じて一定のノイズを発生させ,その後に逆の処理を行い,クリーンな例を回復させることによって,対向的摂動を妨害することを目的としている。
この方法は、前処理の均一な操作が、対向的摂動と闘いながら通常のピクセルを損なうため、根本的な欠陥がある。
ニューラルネットワークの解釈可能性に基づく異種浄化戦略を提案する。
本手法は,被写体モデルが注目する特定の画素に対して高強度雑音を決定的に印加する一方,残りの画素は低強度雑音のみを被写体とする。
論文 参考訳(メタデータ) (2025-03-03T11:00:25Z) - PostCast: Generalizable Postprocessing for Precipitation Nowcasting via Unsupervised Blurriness Modeling [85.56969895866243]
本稿では,ぼやけた予測とそれに対応する土台真実のペアによるトレーニングを必要とせずに,ぼやけを解消するための教師なしポストプロセッシング手法を提案する。
非条件相関を任意のぼかしモードに適応させるため、ゼロショットのぼかしカーネル推定機構とオートスケールの denoise ガイダンス戦略を導入する。
論文 参考訳(メタデータ) (2024-10-08T08:38:23Z) - Adaptive Perturbation for Adversarial Attack [50.77612889697216]
そこで本研究では,新たな逆例に対する勾配に基づく攻撃手法を提案する。
逆方向の摂動を発生させるために,スケーリング係数を用いた正確な勾配方向を用いる。
本手法は, 高い伝達性を示し, 最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-11-27T07:57:41Z) - Adaptive Low-Pass Filtering using Sliding Window Gaussian Processes [71.23286211775084]
ガウス過程回帰に基づく適応型低域通過フィルタを提案する。
本研究では,提案手法の誤差が一様境界であることを示す。
論文 参考訳(メタデータ) (2021-11-05T17:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。