論文の概要: LiveMoments: Reselected Key Photo Restoration in Live Photos via Reference-guided Diffusion
- arxiv url: http://arxiv.org/abs/2604.12286v1
- Date: Tue, 14 Apr 2026 04:59:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.248217
- Title: LiveMoments: Reselected Key Photo Restoration in Live Photos via Reference-guided Diffusion
- Title(参考訳): LiveMoments: 参照誘導拡散によるライブ写真の重要写真の復元
- Authors: Clara Xue, Zizheng Yan, Zhenning Shi, Yuhang Yu, Jingyu Zhuang, Qi Zhang, Jinwei Chen, Qingnan Fan,
- Abstract要約: Live Photoは、高品質なキー写真と短いビデオクリップの両方をキャプチャして、捕獲された瞬間の貴重なダイナミクスを保存する。
ユーザーは、より良い表現やタイミングをキャプチャするためのキー写真として、代替フレームを選択することができるが、これらのフレームは、しばしば顕著な品質劣化を示す。
提案するLiveMomentsは,Live Photosで選択したキー写真に適した参照誘導画像復元フレームワークである。
- 参考スコア(独自算出の注目度): 21.347361954096243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Live Photo captures both a high-quality key photo and a short video clip to preserve the precious dynamics around the captured moment. While users may choose alternative frames as the key photo to capture better expressions or timing, these frames often exhibit noticeable quality degradation, as the photo capture ISP pipeline delivers significantly higher image quality than the video pipeline. This quality gap highlights the need for dedicated restoration techniques to enhance the reselected key photo. To this end, we propose LiveMoments, a reference-guided image restoration framework tailored for the reselected key photo in Live Photos. Our method employs a two-branch neural network: a reference branch that extracts structural and textural information from the original high-quality key photo, and a main branch that restores the reselected frame using the guidance provided by the reference branch. Furthermore, we introduce a unified Motion Alignment module that incorporates motion guidance for spatial alignment at both the latent and image levels. Experiments on real and synthetic Live Photos demonstrate that LiveMoments significantly improves perceptual quality and fidelity over existing solutions, especially in scenes with fast motion or complex structures. Our code is available at https://github.com/OpenVeraTeam/LiveMoments.
- Abstract(参考訳): Live Photoは、高品質なキー写真と短いビデオクリップの両方をキャプチャして、捕獲された瞬間の貴重なダイナミクスを保存する。
ユーザーは、より良い表現やタイミングをキャプチャするためのキー写真として、代替フレームを選択することができるが、これらのフレームは、ビデオパイプラインよりもはるかに高い画質を提供するため、目立った品質劣化を示すことが多い。
この品質差は、選択されたキー写真を強化するための専用の復元技術の必要性を強調している。
この目的のために,Live Photosで選択したキー写真に適した参照誘導画像復元フレームワークであるLiveMomentsを提案する。
提案手法では,従来の高品質なキー写真から構造情報やテクスチャ情報を抽出する参照ブランチと,参照ブランチが提供するガイダンスを用いて再選択されたフレームを復元するメインブランチという,2枝のニューラルネットワークを用いる。
さらに、静止レベルと画像レベルの両方で空間的アライメントのためのモーションガイダンスを組み込んだ、統合されたモーションアライメントモジュールを導入する。
実物と合成されたLive Photosの実験では、LiveMomentsは既存のソリューション、特に速い動きや複雑な構造を持つシーンにおいて、知覚的品質と忠実性を大幅に改善することが示された。
私たちのコードはhttps://github.com/OpenVeraTeam/LiveMoments.comで利用可能です。
関連論文リスト
- Wavelet-Domain Masked Image Modeling for Color-Consistent HDR Video Reconstruction [69.35623794013152]
高ダイナミックレンジ(LDR)ビデオ再構成は、LDRビデオから微妙な明るさ、色、詳細を復元することを目的としている。
既存の方法は、しばしば色の不正確さと時間的不整合に悩まされる。
We propose WMNet, a novel HDR video reconstruction network that leverageing Wavelet domain Masked Image Modeling。
論文 参考訳(メタデータ) (2026-02-07T06:19:23Z) - Extreme Blind Image Restoration via Prompt-Conditioned Information Bottleneck [47.027290803102666]
ブラインド画像復元法(BIR)は目覚ましい成果を上げたが, EBIR(Extreme Blind Image Restoration)に直面するとフェールした。
本稿では,難解なELQ-to-HQ復元プロセスを分解する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-01T10:13:27Z) - RefSTAR: Blind Facial Image Restoration with Reference Selection, Transfer, and Reconstruction [75.00967931348409]
本稿では,参照選択,移動,再構成を考慮した新しいブラインド顔画像復元手法を提案する。
種々のバックボーンモデルによる実験は優れた性能を示し、より優れたアイデンティティ保存能力と参照特徴伝達品質を示す。
論文 参考訳(メタデータ) (2025-07-14T16:50:29Z) - Flux Already Knows -- Activating Subject-Driven Image Generation without Training [25.496237241889048]
バニラフラックスモデルを用いた画像生成のためのゼロショットフレームワークを提案する。
我々は、追加のデータ、トレーニング、推論時の微調整なしで強力なID保存機能を起動する。
論文 参考訳(メタデータ) (2025-04-12T20:41:53Z) - Large Motion Video Autoencoding with Cross-modal Video VAE [52.13379965800485]
ビデオ可変オートエンコーダ(VAE)は、ビデオ冗長性を低減し、効率的なビデオ生成を容易にするために不可欠である。
既存のビデオVAEは時間圧縮に対処し始めているが、しばしば再建性能が不十分である。
本稿では,高忠実度ビデオエンコーディングが可能な,新規で強力なビデオオートエンコーダを提案する。
論文 参考訳(メタデータ) (2024-12-23T18:58:24Z) - Perceptual Quality Improvement in Videoconferencing using
Keyframes-based GAN [28.773037051085318]
本稿では,ビデオ会議における圧縮アーティファクト削減のための新しいGAN手法を提案する。
まず,圧縮および参照フレームからマルチスケールの特徴を抽出する。
そして、私たちのアーキテクチャは、顔のランドマークに従って、これらの特徴を段階的に組み合わせます。
論文 参考訳(メタデータ) (2023-11-07T16:38:23Z) - Prompt-based Ingredient-Oriented All-in-One Image Restoration [0.0]
複数の画像劣化課題に対処する新しいデータ成分指向手法を提案する。
具体的には、エンコーダを用いて特徴をキャプチャし、デコーダを誘導するための劣化情報を含むプロンプトを導入する。
我々の手法は最先端技術と競争的に機能する。
論文 参考訳(メタデータ) (2023-09-06T15:05:04Z) - Burstormer: Burst Image Restoration and Enhancement Transformer [117.56199661345993]
シャッタープレスでは、現代のハンドヘルドカメラが高速に複数の画像をキャプチャし、それらをマージして単一の画像を生成する。
課題は、連続したイメージショットを適切に調整し、その補完的な情報をマージして高品質な出力を達成することである。
バーストラー(Burstormer)はバースト画像の復元と拡張のためのトランスフォーマーをベースとした新しいアーキテクチャである。
論文 参考訳(メタデータ) (2023-04-03T17:58:44Z) - Restoration of Video Frames from a Single Blurred Image with Motion
Understanding [69.90724075337194]
単一モーション赤画像からクリーンな映像フレームを生成するための新しいフレームワークを提案する。
一つのぼやけた画像からの映像復元を逆問題として、クリーンな画像シーケンスとそれぞれの動きを潜伏要因として設定する。
提案手法は,空間トランスフォーマネットワークモジュールを用いたanblur-decoder構造に基づいている。
論文 参考訳(メタデータ) (2021-04-19T08:32:57Z) - Motion-blurred Video Interpolation and Extrapolation [72.3254384191509]
本稿では,映像から鮮明なフレームをエンドツーエンドに切り離し,補間し,外挿する新しい枠組みを提案する。
予測フレーム間の時間的コヒーレンスを確保し,潜在的な時間的あいまいさに対処するために,単純で効果的なフローベースルールを提案する。
論文 参考訳(メタデータ) (2021-03-04T12:18:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。