論文の概要: Time-Correlated Video Bridge Matching
- arxiv url: http://arxiv.org/abs/2510.12453v1
- Date: Tue, 14 Oct 2025 12:35:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 21:19:14.987561
- Title: Time-Correlated Video Bridge Matching
- Title(参考訳): 時間関連ビデオブリッジマッチング
- Authors: Viacheslav Vasilev, Arseny Ivanov, Nikita Gushchin, Maria Kovaleva, Alexander Korotin,
- Abstract要約: Time-Correlated Video Bridge Matching (TCVBM) は、Bridge Matching (BM) をビデオ領域の時間関連データシーケンスに拡張するフレームワークである。
TCVBMは、複数の量的指標にまたがって優れた性能を達成し、生成品質の向上と再構成の忠実性を示す。
- 参考スコア(独自算出の注目度): 49.94768097995648
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models excel in noise-to-data generation tasks, providing a mapping from a Gaussian distribution to a more complex data distribution. However they struggle to model translations between complex distributions, limiting their effectiveness in data-to-data tasks. While Bridge Matching (BM) models address this by finding the translation between data distributions, their application to time-correlated data sequences remains unexplored. This is a critical limitation for video generation and manipulation tasks, where maintaining temporal coherence is particularly important. To address this gap, we propose Time-Correlated Video Bridge Matching (TCVBM), a framework that extends BM to time-correlated data sequences in the video domain. TCVBM explicitly models inter-sequence dependencies within the diffusion bridge, directly incorporating temporal correlations into the sampling process. We compare our approach to classical methods based on bridge matching and diffusion models for three video-related tasks: frame interpolation, image-to-video generation, and video super-resolution. TCVBM achieves superior performance across multiple quantitative metrics, demonstrating enhanced generation quality and reconstruction fidelity.
- Abstract(参考訳): 拡散モデルはノイズ・データ生成タスクに優れ、ガウス分布からより複雑なデータ分布へのマッピングを提供する。
しかし、複雑な分布間の翻訳をモデル化するのに苦労し、データ間タスクの有効性を制限している。
ブリッジマッチング(BM)モデルは、データ分散間の変換を見つけることでこの問題に対処するが、時間関連データシーケンスへのそれらの適用は、まだ探索されていない。
これはビデオ生成と操作タスクにとって重要な制限であり、時間的コヒーレンスを維持することが特に重要である。
このギャップに対処するため、ビデオ領域内の時間関連データシーケンスにBMを拡張するフレームワークであるTime-Correlated Video Bridge Matching (TCVBM)を提案する。
TCVBMは、拡散ブリッジ内のシーケンス間の依存関係を明示的にモデル化し、サンプリングプロセスに時間相関を直接組み込む。
本稿では, フレーム補間, 画像-映像生成, ビデオ超解像の3つの課題に対して, ブリッジマッチングと拡散モデルに基づく古典的手法との比較を行った。
TCVBMは、複数の量的指標にまたがって優れた性能を達成し、生成品質の向上と再構成の忠実性を示す。
関連論文リスト
- Stage-Diff: Stage-wise Long-Term Time Series Generation Based on Diffusion Models [13.345872524896722]
本研究では,拡散モデルに基づく長期時系列のステージ生成モデルであるStageDiffを提案する。
第一に、段階的シーケンス生成と段階間情報転送により、モデルは長期的シーケンス依存を保存する。
第二に、各段階において進行シーケンス分解を適用して、異なる時間スケールでチャネルに依存しないモデリングを行う。
論文 参考訳(メタデータ) (2025-08-29T05:10:10Z) - Packet-Level DDoS Data Augmentation Using Dual-Stream Temporal-Field Diffusion [2.8498570090658726]
DDoS(Distributed Denial of Service)攻撃に対して、最近の研究は機械学習(ML)ベースのソリューションにますます依存している。
現在の合成トレース生成法は、現生のDDoS攻撃で現れる複雑な時間パターンと空間分布を捉えるのに苦労している。
拡散モデルに基づく多視点マルチストリームネットワークトラフィック生成モデルであるDual-Stream Temporal-Field Diffusion (DSTF-Diffusion)を提案する。
論文 参考訳(メタデータ) (2025-07-27T03:40:56Z) - Enhancing Channel-Independent Time Series Forecasting via Cross-Variate Patch Embedding [1.1607669836339873]
チャネル非依存(CI)モデルにクロスバリアントコンテキストを注入する軽量CDモジュールとして,CVPE(Cross-Variate Patch Embeddings)を提案する。
CVPEをマルチモーダルCI予測モデルであるTime-LLMに統合し,その有効性を示す。
論文 参考訳(メタデータ) (2025-05-19T06:41:14Z) - AverageTime: Enhance Long-Term Time Series Forecasting with Simple Averaging [6.125620036017928]
長期の時系列予測は、将来のトレンドを予測するために歴史的なデータを活用することに焦点を当てている。
主な課題は、シーケンスとチャネルの両方で依存関係を効果的にモデリングすることである。
本研究は,シーケンスとチャネルの依存関係をキャプチャするための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-12-30T05:56:25Z) - Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。
画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。
本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文 参考訳(メタデータ) (2023-09-29T03:24:24Z) - Generative Time Series Forecasting with Diffusion, Denoise, and
Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。
実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。
本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2023-01-08T12:20:46Z) - Multi-scale Attention Flow for Probabilistic Time Series Forecasting [68.20798558048678]
マルチスケールアテンション正規化フロー(MANF)と呼ばれる非自己回帰型ディープラーニングモデルを提案する。
我々のモデルは累積誤差の影響を回避し、時間の複雑さを増大させない。
本モデルは,多くの多変量データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-16T07:53:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。