論文の概要: Kuramoto Orientation Diffusion Models
- arxiv url: http://arxiv.org/abs/2509.15328v1
- Date: Thu, 18 Sep 2025 18:18:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.861955
- Title: Kuramoto Orientation Diffusion Models
- Title(参考訳): 倉本配向拡散モデル
- Authors: Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling,
- Abstract要約: 指紋やテクスチャなどのオリエンテーションに富んだ画像は、しばしばコヒーレントな角模様を示す。
生体系における位相同期の役割を動機として,スコアベース生成モデルを提案する。
一般的な画像ベンチマークで競合する結果を実装し,指紋やテクスチャなどの指向性データセットの生成品質を大幅に向上する。
- 参考スコア(独自算出の注目度): 67.0711709825854
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Orientation-rich images, such as fingerprints and textures, often exhibit coherent angular directional patterns that are challenging to model using standard generative approaches based on isotropic Euclidean diffusion. Motivated by the role of phase synchronization in biological systems, we propose a score-based generative model built on periodic domains by leveraging stochastic Kuramoto dynamics in the diffusion process. In neural and physical systems, Kuramoto models capture synchronization phenomena across coupled oscillators -- a behavior that we re-purpose here as an inductive bias for structured image generation. In our framework, the forward process performs \textit{synchronization} among phase variables through globally or locally coupled oscillator interactions and attraction to a global reference phase, gradually collapsing the data into a low-entropy von Mises distribution. The reverse process then performs \textit{desynchronization}, generating diverse patterns by reversing the dynamics with a learned score function. This approach enables structured destruction during forward diffusion and a hierarchical generation process that progressively refines global coherence into fine-scale details. We implement wrapped Gaussian transition kernels and periodicity-aware networks to account for the circular geometry. Our method achieves competitive results on general image benchmarks and significantly improves generation quality on orientation-dense datasets like fingerprints and textures. Ultimately, this work demonstrates the promise of biologically inspired synchronization dynamics as structured priors in generative modeling.
- Abstract(参考訳): 指紋やテクスチャなどのオリエンテーションに富んだ画像は、しばしば、等方的ユークリッド拡散に基づく標準的な生成的アプローチを用いてモデル化することが困難であるコヒーレントな角方向パターンを示す。
生体系における位相同期の役割を動機として, 周期領域上に構築されたスコアベース生成モデルについて, 拡散過程における確率的倉本ダイナミクスを応用して提案する。
ニューラルネットワークと物理システムでは、内蔵元モデルは結合振動子間の同期現象をキャプチャします。
本フレームワークでは, グローバルあるいは局所的に結合した発振器相互作用とグローバル参照位相へのアトラクションを通じて, 位相変数間の‘textit{synchronization’を行い, データを徐々に低エントロピーフォン・ミゼス分布に分解する。
次に、逆プロセスが \textit{desynchronization} を実行し、学習したスコア関数でダイナミクスを反転させることで、多様なパターンを生成する。
このアプローチは、前方拡散中の構造化破壊と、グローバルコヒーレンスを微妙な詳細に段階的に洗練する階層的生成プロセスを可能にする。
円形形状を考慮に入れた包括ガウス遷移カーネルと周期性認識ネットワークを実装した。
本手法は,一般的な画像のベンチマークにおいて競合する結果が得られ,指紋やテクスチャなどの指向性データセットの生成品質が大幅に向上する。
最終的に、この研究は、生成モデリングにおける構造的先行として生物学的にインスパイアされた同期力学の可能性を実証している。
関連論文リスト
- Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - Cross-Modal Diffusion for Biomechanical Dynamical Systems Through Local Manifold Alignment [0.0]
本稿では,相互に協調した生体力学的運動生成のための拡散フレームワークを提案する。
それぞれのモダリティを,共振子力学系の相補的な観測として扱うことにより,各拡散段階における潜在表現を一致させる。
我々のアプローチは、ローカル時間ウィンドウの$X$と$Y$が、基礎となる動的システムの同じフェーズを表しているという事実に動機づけられている。
論文 参考訳(メタデータ) (2025-03-15T17:44:03Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Oscillation Inversion: Understand the structure of Large Flow Model through the Lens of Inversion Method [60.88467353578118]
実世界のイメージを逆転させる固定点インスパイアされた反復的アプローチは収束を達成せず、異なるクラスタ間で振動することを示す。
本稿では,画像強調,ストロークベースのリカラー化,および視覚的プロンプト誘導画像編集を容易にする,シンプルで高速な分布転送手法を提案する。
論文 参考訳(メタデータ) (2024-11-17T17:45:37Z) - How to Bridge Spatial and Temporal Heterogeneity in Link Prediction? A Contrastive Method [11.719027225797037]
我々は,新しいtextbfContrastive Learning-based textbfLink textbfPrediction model, textbfCLPを提案する。
我々のマイモデルは最先端モデルよりも一貫して優れており、AUCとAPで平均10.10%、13.44%の改善が示されている。
論文 参考訳(メタデータ) (2024-11-01T14:20:53Z) - Edge-preserving noise for diffusion models [4.435514696080208]
既存の等方性モデルに対して一般化した新しいエッジ保存拡散モデルを提案する。
モデルの生成過程はより高速に収束し, 対象の分布とより密に一致していることを示す。
我々のエッジ保存拡散プロセスは、非条件画像生成における最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2024-10-02T13:29:52Z) - Dynamic Kernel-Based Adaptive Spatial Aggregation for Learned Image
Compression [63.56922682378755]
本稿では,空間アグリゲーション機能の拡張に焦点をあて,動的カーネルベースの変換符号化を提案する。
提案したアダプティブアグリゲーションはカーネルオフセットを生成し、コンテント条件付き範囲の有効な情報をキャプチャして変換を支援する。
実験により,本手法は,最先端の学習手法と比較して,3つのベンチマークにおいて高い速度歪み性能が得られることを示した。
論文 参考訳(メタデータ) (2023-08-17T01:34:51Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Self-Supervised Learning of Generative Spin-Glasses with Normalizing
Flows [0.0]
一般的な離散問題におけるモデル相関に対する正規化フローを用いた連続スピングラス分布の開発を行う。
スピングラス位相の物理的および計算的特性をうまく学習できることを実証する。
注目すべきは、学習そのものがトレーニングされた正規化フローの層内のスピングラス相転移に対応することである。
論文 参考訳(メタデータ) (2020-01-02T19:00:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。