Fugu-MT 論文翻訳(概要): FC-VFI: Faithful and Consistent Video Frame Interpolation for High-FPS Slow Motion Video Generation

論文の概要: FC-VFI: Faithful and Consistent Video Frame Interpolation for High-FPS Slow Motion Video Generation

arxiv url: http://arxiv.org/abs/2603.04899v1
Date: Thu, 05 Mar 2026 07:41:34 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-06 22:06:11.124131
Title: FC-VFI: Faithful and Consistent Video Frame Interpolation for High-FPS Slow Motion Video Generation
Title（参考訳）: FC-VFI:高FPSスローモーション映像生成のための忠実で一貫性のあるビデオフレーム補間
Authors: Ganggui Ding, Hao Chen, Xiaogang Xu,
Abstract要約: 忠実で一貫したビデオフレーム保存のためのFC-VFIを提案し、(4時間)xと(8時間)解像度をサポートした。本稿では,先行列の時間的モデリング手法を導入し,開始フレームと終了フレームから忠実度を継承し,構造認識動作誘導のセマンティックマッチング線を利用する。
参考スコア（独自算出の注目度）: 14.850919655503871
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large pre-trained video diffusion models excel in video frame interpolation but struggle to generate high fidelity frames due to reliance on intrinsic generative priors, limiting detail preservation from start and end frames. Existing methods often depend on motion control for temporal consistency, yet dense optical flow is error-prone, and sparse points lack structural context. In this paper, we propose FC-VFI for faithful and consistent video frame interpolation, supporting \(4\times\)x and \(8\times\) interpolation, boosting frame rates from 30 FPS to 120 and 240 FPS at \(2560\times 1440\)resolution while preserving visual fidelity and motion consistency. We introduce a temporal modeling strategy on the latent sequences to inherit fidelity cues from start and end frames and leverage semantic matching lines for structure-aware motion guidance, improving motion consistency. Furthermore, we propose a temporal difference loss to mitigate temporal inconsistencies. Extensive experiments show FC-VFI achieves high performance and structural integrity across diverse scenarios.
Abstract（参考訳）: ビデオフレーム補間において、大規模な事前学習ビデオ拡散モデルは優れるが、本質的な生成先行に依存して高忠実度フレームの生成に苦慮し、開始フレームと終了フレームの詳細な保存を制限している。既存の手法はしばしば時間的整合性に対する動作制御に依存するが、密度の高い光流はエラーを起こし、スパース点は構造的文脈を欠いている。本稿では,忠実で一貫した映像フレーム補間のためのFC-VFIを提案し,映像の忠実度と動きの整合性を保ちながら,フレームレートを30FPSから120FPS,240FPSまで向上させる。本稿では,先行列の時間的モデリング手法を導入し,開始フレームと終了フレームから忠実度キューを継承し,構造認識動作誘導のセマンティックマッチングラインを活用し,動きの整合性を向上させる。さらに,時間的不整合を軽減するため,時間的差分損失を提案する。 FC-VFIは様々なシナリオで高い性能と構造的整合性を実現する。

関連論文リスト

Towards Holistic Modeling for Video Frame Interpolation with Auto-regressive Diffusion Transformers [95.68243351895107]
我々はtextbfVideo textbfFrame textbfInterpolation (LDF-VFI) のための textbfLocal textbfDiffusion textbfForcing for textbfVideo textbfFrame textbfInterpolation (LDF-VFI) という包括的でビデオ中心のパラダイムを提案する。我々のフレームワークは、ビデオシーケンス全体をモデル化し、長距離時間的コヒーレンスを確保する自動回帰拡散変換器上に構築されている。 LDF-VFIは、挑戦的なロングシーケンスベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2026-01-21T12:58:52Z)
Ouroboros-Diffusion: Exploring Consistent Content Generation in Tuning-free Long Video Diffusion [116.40704026922671]
事前訓練されたテキスト・ツー・ビデオモデルに基づいて構築されたファースト・イン・ファースト・アウト(FIFO)ビデオ拡散は,近年,チューニング不要な長ビデオ生成に有効なアプローチとして浮上している。 We propose Ouroboros-Diffusion, a novel video denoising framework designed to enhance structure and content (ject) consistency。
論文参考訳（メタデータ） (2025-01-15T18:59:15Z)
Generative Inbetweening through Frame-wise Conditions-Driven Video Generation [63.43583844248389]
生成的inbetweeningは、2つのキーフレームを入力として利用することで中間フレームシーケンスを生成することを目的としている。補間ビデオフレームの時間的安定性を著しく向上するフレームワイド・コンディション駆動ビデオ生成法(FCVG)を提案する。 FCVGは線形曲線と非線形曲線の両方を用いて時間的に安定なビデオを生成する能力を示した。
論文参考訳（メタデータ） (2024-12-16T13:19:41Z)
Ada-VE: Training-Free Consistent Video Editing Using Adaptive Motion Prior [13.595032265551184]
ビデオ間合成は、キャラクタ一貫性の維持、スムーズな時間遷移、高速動作時の視覚的品質の維持において大きな課題となる。本稿では,冗長計算を選択的に削減する適応型動き誘導型クロスフレームアテンション機構を提案する。これにより、同じ計算予算内でより多くのフレームにクロスフレームの注意を向けることができる。
論文参考訳（メタデータ） (2024-06-07T12:12:25Z)
Motion-aware Latent Diffusion Models for Video Frame Interpolation [51.78737270917301]
隣接するフレーム間の動き推定は、動きのあいまいさを避ける上で重要な役割を担っている。我々は、新しい拡散フレームワーク、動き認識潜在拡散モデル(MADiff)を提案する。提案手法は,既存手法を著しく上回る最先端性能を実現する。
論文参考訳（メタデータ） (2024-04-21T05:09:56Z)
IDO-VFI: Identifying Dynamics via Optical Flow Guidance for Video Frame Interpolation with Events [14.098949778274733]
イベントカメラは、フレーム間のダイナミクスを極めて高い時間分解能で捉えるのに最適である。 IDO-VFIというイベント・アンド・フレームベースのビデオフレーム方式を提案する。提案手法は,Vimeo90Kデータセット上での計算時間と計算労力をそれぞれ10%と17%削減しつつ,高品質な性能を維持する。
論文参考訳（メタデータ） (2023-05-17T13:22:21Z)
TTVFI: Learning Trajectory-Aware Transformer for Video Frame Interpolation [50.49396123016185]
ビデオフレーム(VFI)は、2つの連続するフレーム間の中間フレームを合成することを目的としている。ビデオフレーム補間用トラジェクトリ対応トランス (TTVFI) を提案する。提案手法は,4つの広く使用されているVFIベンチマークにおいて,他の最先端手法よりも優れている。
論文参考訳（メタデータ） (2022-07-19T03:37:49Z)
Video Frame Interpolation without Temporal Priors [91.04877640089053]
ビデオフレームは、既存の中間フレームをビデオシーケンスで合成することを目的としている。フレーム/秒(FPS)やフレーム露光時間といったビデオの時間的先行は、異なるカメラセンサーによって異なる場合がある。我々は、より良い合成結果を得るために、新しい光フロー改善戦略を考案する。
論文参考訳（メタデータ） (2021-12-02T12:13:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。