論文の概要: Neural Image Representations for Multi-Image Fusion and Layer Separation
- arxiv url: http://arxiv.org/abs/2108.01199v1
- Date: Mon, 2 Aug 2021 22:29:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 14:01:44.061943
- Title: Neural Image Representations for Multi-Image Fusion and Layer Separation
- Title(参考訳): マルチイメージ融合と層分離のためのニューラルイメージ表現
- Authors: Seonghyeon Nam, Marcus A. Brubaker, Michael S. Brown
- Abstract要約: 本稿では,複数の画像を1つの座標ベースニューラル表現に整列・融合するフレームワークを提案する。
本フレームワークは,カメラエゴの動きやシーンの微妙な変化が原因で異常が生じたバースト画像を対象としている。
- 参考スコア(独自算出の注目度): 47.06751397162301
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a framework for aligning and fusing multiple images into a single
coordinate-based neural representations. Our framework targets burst images
that have misalignment due to camera ego motion and small changes in the scene.
We describe different strategies for alignment depending on the assumption of
the scene motion, namely, perspective planar (i.e., homography), optical flow
with minimal scene change, and optical flow with notable occlusion and
disocclusion. Our framework effectively combines the multiple inputs into a
single neural implicit function without the need for selecting one of the
images as a reference frame. We demonstrate how to use this multi-frame fusion
framework for various layer separation tasks.
- Abstract(参考訳): 本稿では,複数の画像を1つの座標ベースニューラル表現に調整・融合するフレームワークを提案する。
私たちのフレームワークは、カメラのエゴモーションとシーンの小さな変更による不一致のあるバーストイメージをターゲットにしています。
シーンの動きの仮定によるアライメント戦略,すなわち,視点平面(すなわちホモグラフィ),最小限のシーン変化を伴う光流,および顕著な咬合と解離を伴う光流について述べる。
このフレームワークは、複数の入力を単一の神経暗黙関数に効果的に組み合わせ、参照フレームとして画像を選択する必要がない。
本稿では,このマルチフレーム融合フレームワークを様々な層分離タスクに利用する方法を示す。
関連論文リスト
- Framer: Interactive Frame Interpolation [73.06734414930227]
Framerのターゲットは、ユーザのクリエイティビティに応じて、2つのイメージ間のスムーズな遷移フレームを生成することだ。
提案手法は,選択したキーポイントの軌道を調整し,遷移過程のカスタマイズを支援する。
ここでは,キーポイントと軌道を自動的に推定するモジュールを導入する。
論文 参考訳(メタデータ) (2024-10-24T17:59:51Z) - Neural Spline Fields for Burst Image Fusion and Layer Separation [40.9442467471977]
ニューラルスプライン場を用いた2層α合成画像とフローモデルを用いた多目的中間表現を提案する。
提案手法では, バースト画像を高分解能な再構成に融合し, 透過層と閉塞層に分解することができる。
後処理のステップや事前学習がないため、当社の一般化可能なモデルは、既存の専用イメージやマルチビューの障害物除去アプローチよりも優れています。
論文 参考訳(メタデータ) (2023-12-21T18:54:19Z) - Layered Rendering Diffusion Model for Zero-Shot Guided Image Synthesis [60.260724486834164]
本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
視覚誘導(Vision Guidance)とレイヤーレンダリング拡散(Layered Rendering Diffusion)フレームワーク(Layered Diffusion)という2つの重要なイノベーションを提示します。
本稿では,ボックス・ツー・イメージ,セマンティック・マスク・ツー・イメージ,画像編集の3つの実践的応用に適用する。
論文 参考訳(メタデータ) (2023-11-30T10:36:19Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - Single Stage Virtual Try-on via Deformable Attention Flows [51.70606454288168]
仮想試行は、ショップ内服と基準人物画像が与えられた写真リアルなフィッティング結果を生成することを目的としている。
マルチフロー推定に変形性アテンションスキームを適用した,変形性アテンションフロー(DAFlow)を新たに開発した。
提案手法は,定性的かつ定量的に最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-07-19T10:01:31Z) - Bridging the Visual Gap: Wide-Range Image Blending [16.464837892640812]
広域画像ブレンドを実現するための効果的なディープラーニングモデルを提案する。
提案手法が視覚的に魅力的な結果をもたらすことを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-28T15:07:45Z) - TSIT: A Simple and Versatile Framework for Image-to-Image Translation [103.92203013154403]
画像間翻訳のためのシンプルで多用途なフレームワークを提案する。
新たに提案した特徴変換を用いた2ストリーム生成モデルを提案する。
これにより、マルチスケールのセマンティック構造情報とスタイル表現を効果的に捕捉し、ネットワークに融合させることができる。
体系的な研究は、提案手法をいくつかの最先端タスク固有のベースラインと比較し、知覚的品質と定量的評価の両面での有効性を検証する。
論文 参考訳(メタデータ) (2020-07-23T15:34:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。