論文の概要: Multi-marginal temporal Schrödinger Bridge Matching for video generation from unpaired data
- arxiv url: http://arxiv.org/abs/2510.01894v1
- Date: Thu, 02 Oct 2025 11:00:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.097788
- Title: Multi-marginal temporal Schrödinger Bridge Matching for video generation from unpaired data
- Title(参考訳): 未ペアデータからの映像生成のためのマルチマージング時空間シュレーディンガーブリッジマッチング
- Authors: Thomas Gravier, Thomas Boyer, Auguste Genovesio,
- Abstract要約: textittextbfMulti-Marginal temporal Schr"odinger Bridge Matching (textbfMMtSBM)を提案する。
我々の研究は、静的データから隠れたダイナミクスを回復するための実用的で原則化されたアプローチとしてMMtSBMを確立している。
実験により,MMtSBMは玩具の例における理論的特性を保ち,実世界のデータセット上での最先端性能を実現し,超高次元画像設定における結合と動的特性の回復を初めて行った。
- 参考スコア(独自算出の注目度): 1.004996690798013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many natural dynamic processes -- such as in vivo cellular differentiation or disease progression -- can only be observed through the lens of static sample snapshots. While challenging, reconstructing their temporal evolution to decipher underlying dynamic properties is of major interest to scientific research. Existing approaches enable data transport along a temporal axis but are poorly scalable in high dimension and require restrictive assumptions to be met. To address these issues, we propose \textit{\textbf{Multi-Marginal temporal Schr\"odinger Bridge Matching}} (\textbf{MMtSBM}) \textit{for video generation from unpaired data}, extending the theoretical guarantees and empirical efficiency of Diffusion Schr\"odinger Bridge Matching (arXiv:archive/2303.16852) by deriving the Iterative Markovian Fitting algorithm to multiple marginals in a novel factorized fashion. Experiments show that MMtSBM retains theoretical properties on toy examples, achieves state-of-the-art performance on real world datasets such as transcriptomic trajectory inference in 100 dimensions, and for the first time recovers couplings and dynamics in very high dimensional image settings. Our work establishes multi-marginal Schr\"odinger bridges as a practical and principled approach for recovering hidden dynamics from static data.
- Abstract(参考訳): 生体内細胞の分化や疾患の進行など、多くの自然な過程は、静的サンプルスナップショットのレンズを通してのみ観察できる。
挑戦的ではあるが、その時間的進化を再構築して、基礎となる動的性質を解読することは、科学研究にとって大きな関心事である。
既存のアプローチは、時間軸に沿ったデータ転送を可能にするが、高次元ではスケーラビリティが低く、満たすべき制限的な仮定を必要とする。
これらの問題に対処するために、我々は、反復マルコフフィッティングアルゴリズムを新しい因数分解方式で複数の辺縁に導出することにより、拡散Schr\"odinger Bridge Matching (arXiv:archive/2303.16852) の理論的保証と経験的効率を拡張して、未ペアデータからビデオを生成するための「textit{\textbf{Multi-Marginal temporal Schr\"odinger Bridge Matching}} (\textbf{MMtSBM}) \textit{for video generation」を提案する。
実験により,MMtSBMは玩具の例における理論的特性を保ち,100次元のトランスクリプト的軌道推定などの実世界のデータセット上での最先端の性能を達成し,超高次元画像設定における結合とダイナミクスの回復を初めて行った。
我々の研究は、静的データから隠れたダイナミクスを回復するための実用的で原則化されたアプローチとして、マルチマージンガルSchr\odingerブリッジを確立する。
関連論文リスト
- Multi-Task Equation Discovery [0.0]
複数のデータセットにまたがる同時パラメータ識別にはマルチタスク学習フレームワークを用いる。
MTL-RVMはタスク間での情報を組み合わせて、弱い、中程度の興奮したデータセットのパラメータリカバリを改善した。
これらの結果は,マルチタスクベイズ推論が過剰適合を緩和し,方程式発見の一般化を促進することを示唆している。
論文 参考訳(メタデータ) (2025-09-29T18:56:40Z) - A Novel Diffusion Model for Pairwise Geoscience Data Generation with Unbalanced Training Dataset [8.453075713579631]
UB-Diff'はマルチモーダルなペア型科学データ生成のための新しい拡散モデルである。
1つの大きな革新は、1対2のエンコーダ・デコーダネットワーク構造であり、コラテント表現からペアのデータを確実に得ることができる。
OpenFWIデータセットの実験結果から,UB-DiffはFr'echet Inception Distance(FID)スコアとペア評価において,既存の技術よりも優れていた。
論文 参考訳(メタデータ) (2025-01-01T19:49:38Z) - Infinite-dimensional Diffusion Bridge Simulation via Operator Learning [1.747623282473278]
本稿では,スコアマッチング手法と演算子学習を融合させて,無限次元橋梁の直接学習を可能にする手法を提案する。
クローズドフォーム解を用いた合成例から、実世界の生物学的形状データの非線形進化まで、一連の実験を行っている。
論文 参考訳(メタデータ) (2024-05-28T16:52:52Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - TimeGraphs: Graph-based Temporal Reasoning [64.18083371645956]
TimeGraphsは階層的時間グラフとして動的相互作用を特徴付ける新しいアプローチである。
提案手法は,コンパクトなグラフベース表現を用いて相互作用をモデル化し,多種多様な時間スケールでの適応推論を可能にする。
我々は,サッカーシミュレータ,抵抗ゲーム,MOMA人間活動データセットなど,複雑でダイナミックなエージェントインタラクションを持つ複数のデータセット上でTimeGraphsを評価する。
論文 参考訳(メタデータ) (2024-01-06T06:26:49Z) - Deep Momentum Multi-Marginal Schr\"odinger Bridge [41.27274841596343]
本稿では,時間的限界制約を満たすシステムに対して,スムーズな測度値アルゴリズムを学習する新しいフレームワークを提案する。
我々のアルゴリズムは、合成データセットと実世界の単一細胞RNAデータセットシーケンスの実験によって証明されたように、ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2023-03-03T07:24:38Z) - Aligned Diffusion Schrödinger Bridges [41.95944857946607]
Diffusion Schr"odinger Bridges (DSBs) は、最近、異なる時間点における限界観測を通してダイナミクスを回復するための強力なフレームワークとして登場した。
これまで、DSBを解くための既存のアルゴリズムは、整列データの構造を活用できなかった。
本稿では,データアライメントを尊重しながらDSBを初めて解決する新しいアルゴリズムフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-22T14:55:57Z) - Exploring Data Augmentation for Multi-Modality 3D Object Detection [82.9988604088494]
ポイントクラウドとイメージに基づくマルチモダリティメソッドは、ポイントクラウドのみを使用するアプローチよりも、わずかに良いか、時には悪いだけである。
トランスフォーメーションフローと呼ばれるパイプラインを提案し、トランスフォーメーションのリバースとリプレイによってシングルモードとマルチモードのデータ拡張のギャップを埋める。
また,本手法は第3回nuScenes検出チャレンジでPKL賞を受賞した。
論文 参考訳(メタデータ) (2020-12-23T15:23:16Z) - Learning Bijective Feature Maps for Linear ICA [73.85904548374575]
画像データに適した既存の確率的深層生成モデル (DGM) は, 非線形ICAタスクでは不十分であることを示す。
そこで本研究では,2次元特徴写像と線形ICAモデルを組み合わせることで,高次元データに対する解釈可能な潜在構造を学習するDGMを提案する。
画像上のフローベースモデルや線形ICA、変分オートエンコーダよりも、高速に収束し、訓練が容易なモデルを作成し、教師なしの潜在因子発見を実現する。
論文 参考訳(メタデータ) (2020-02-18T17:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。