Fugu-MT 論文翻訳(概要): VibeFlow: Versatile Video Chroma-Lux Editing through Self-Supervised Learning

論文の概要: VibeFlow: Versatile Video Chroma-Lux Editing through Self-Supervised Learning

arxiv url: http://arxiv.org/abs/2604.13425v1
Date: Wed, 15 Apr 2026 02:51:26 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-16 20:38:32.360983
Title: VibeFlow: Versatile Video Chroma-Lux Editing through Self-Supervised Learning
Title（参考訳）: VibeFlow: 自己監督学習によるビデオクロマ-ルックス編集
Authors: Yifan Li, Pei Cheng, Bin Fu, Shuai Yang, Jiaying Liu,
Abstract要約: 本稿では,クロマックス編集のための自己教師型フレームワークであるVibeFlowを提案する。我々は、ソースビデオから構造を適応的に再結合し、参照画像から色を照らすようにモデルを強制する不整合データパイプラインを導入する。我々のフレームワークは、ビデオのリライティング、リカラー化、低照度化、昼夜翻訳、オブジェクト固有の色編集など、多様な用途にゼロショット方式で一般化する。
参考スコア（独自算出の注目度）: 31.16852887085847
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Video chroma-lux editing, which aims to modify illumination and color while preserving structural and temporal fidelity, remains a significant challenge. Existing methods typically rely on expensive supervised training with synthetic paired data. This paper proposes VibeFlow, a novel self-supervised framework that unleashes the intrinsic physical understanding of pre-trained video generation models. Instead of learning color and light transitions from scratch, we introduce a disentangled data perturbation pipeline that enforces the model to adaptively recombine structure from source videos and color-illumination cues from reference images, enabling robust disentanglement in a self-supervised manner. Furthermore, to rectify discretization errors inherent in flow-based models, we introduce Residual Velocity Fields alongside a Structural Distortion Consistency Regularization, ensuring rigorous structural preservation and temporal coherence. Our framework eliminates the need for costly training resources and generalizes in a zero-shot manner to diverse applications, including video relighting, recoloring, low-light enhancement, day-night translation, and object-specific color editing. Extensive experiments demonstrate that VibeFlow achieves impressive visual quality with significantly reduced computational overhead. Our project is publicly available at https://lyf1212.github.io/VibeFlow-webpage.
Abstract（参考訳）: 構造的・時間的忠実さを保ちながら照明や色を変えることを目的としたビデオクロマックス編集は依然として重要な課題である。既存の手法は通常、合成ペアデータによる高価な教師付きトレーニングに依存している。本稿では,事前学習ビデオ生成モデルの本質的な物理的理解を解き放つ,新たな自己教師型フレームワークであるVibeFlowを提案する。スクラッチから色と光の遷移を学習する代わりに、ソースビデオから構造を適応的に再結合し、参照画像から色を照らすようにモデルを強制する、歪んだデータ摂動パイプラインを導入する。さらに,フローベースモデルに固有の離散化誤差を補正するために,構造歪み整合性規則化とともに残留速度場を導入し,厳密な構造保存と時間的コヒーレンスを確保する。当社のフレームワークは、ビデオリライト、リカラー化、低照度化、昼夜翻訳、オブジェクト固有の色編集など、さまざまなアプリケーションに対して、コストのかかるトレーニングリソースの必要性を排除し、ゼロショット方式で一般化する。大規模な実験により、VibeFlowは計算オーバーヘッドを大幅に削減した印象的な視覚的品質を実現している。私たちのプロジェクトはhttps://lyf1212.github.io/VibeFlow-webpage.comで公開されています。

関連論文リスト

Kiwi-Edit: Versatile Video Editing via Instruction and Reference Guidance [55.32799307123252]
本稿では,既存のビデオ編集ペアを高忠実度トレーニング四重項に変換するスケーラブルなデータ生成パイプラインを提案する。本稿では,学習可能なクエリと参照セマンティックガイダンスのための潜在視覚特徴を相乗化する統合編集アーキテクチャKiwi-Editを提案する。
論文参考訳（メタデータ） (2026-03-02T18:46:28Z)
FlowPortal: Residual-Corrected Flow for Training-Free Video Relighting and Background Replacement [9.038689270820258]
FlowPortalは、トレーニング不要のフローベースのビデオリライトフレームワークである。私たちの中心となるイノベーションは、標準フローベースのモデルを編集モデルに変換するResidual-Corrected Flowメカニズムです。実験により、FlowPortalは時間的コヒーレンス、構造保存、照明リアリズムにおいて優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2025-11-23T08:45:17Z)
UniLumos: Fast and Unified Image and Video Relighting with Physics-Plausible Feedback [31.03901228901908]
画像とビデオの両方に統一されたリライトフレームワークUniLumosを提案する。我々は、照明効果をシーン構造と明確に一致させ、物理的妥当性を高める。実験により、UniLumosは物理的な一貫性を大幅に改善して最先端のリライトを実現している。
論文参考訳（メタデータ） (2025-11-03T15:41:41Z)
Lumen: Consistent Video Relighting and Harmonious Background Replacement with Video Generative Models [18.008901495139717]
本稿では,大規模ビデオ生成モデルを用いたエンドツーエンドのビデオリライトフレームワークであるLumenを提案する。合成ドメインでは、高度な3Dレンダリングエンジンを活用し、多様な環境でビデオペアをキュレートする。現実的な領域では、HDRベースの照明シミュレーションを適用して、ペアの内蔵ビデオの欠如を補う。
論文参考訳（メタデータ） (2025-08-18T14:21:22Z)
TC-Light: Temporally Coherent Generative Rendering for Realistic World Transfer [47.22201704648345]
照明とテクスチャ編集はワールド・トゥ・ワールド・トランスファーにとって重要な次元である。既存の技術は、ビデオのリライティングモデルや条件付き世界生成モデルなどのトランスファーを実現するために、入力ビデオを生成的に再レンダリングする。我々はこれらの問題を克服するための新しい生成計算であるTC-Lightを提案する。
論文参考訳（メタデータ） (2025-06-23T17:59:58Z)
VanGogh: A Unified Multimodal Diffusion-based Framework for Video Colorization [53.35016574938809]
ビデオのカラー化は、時間的一貫性と構造的整合性を維持しながら、グレースケールのビデオを鮮やかな色表現に変換することを目的としている。既存のビデオカラー化法は、しばしば色出血に悩まされ、包括的な制御が欠如している。我々はVanGoghを紹介した。VanGoghはビデオカラー化のためのマルチモーダル拡散に基づく統合フレームワークである。
論文参考訳（メタデータ） (2025-01-16T12:20:40Z)
Video Decomposition Prior: A Methodology to Decompose Videos into Layers [74.36790196133505]
本稿では,プロのビデオ編集の実践からインスピレーションを得た,VDP以前の新しいビデオ分解手法を提案する。 VDPフレームワークは、ビデオシーケンスを複数のRGBレイヤと関連する不透明度レベルに分解する。ビデオオブジェクトのセグメンテーション、デハジング、リライティングといったタスクに対処する。
論文参考訳（メタデータ） (2024-12-06T10:35:45Z)
Temporally Consistent Video Colorization with Deep Feature Propagation and Self-regularization Learning [90.38674162878496]
時間的に一貫した新しいビデオカラー化フレームワーク(TCVC)を提案する。 TCVCは、フレームレベルの深い特徴を双方向的に効果的に伝播し、色付けの時間的一貫性を高める。実験により,本手法は視覚的に満足な色付きビデオを得るだけでなく,最先端の手法よりも時間的整合性が得られることが示された。
論文参考訳（メタデータ） (2021-10-09T13:00:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。