論文の概要: Generative Panoramic Image Stitching
- arxiv url: http://arxiv.org/abs/2507.07133v1
- Date: Tue, 08 Jul 2025 22:07:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.133765
- Title: Generative Panoramic Image Stitching
- Title(参考訳): 生成パノラマ画像ストレッチ
- Authors: Mathieu Tuli, Kaveh Kamali, David B. Lindell,
- Abstract要約: 本研究では, シームレスなパノラマ合成を目的としたパノラマ画像縫合作業について紹介する。
従来の画像縫合パイプラインは、パノラマの大きなコヒーレントな領域を合成する際に失敗する。
本稿では,複数の参照画像に基づいてシーンの内容とレイアウトを保存するために,拡散型塗装モデルを微調整する手法を提案する。
- 参考スコア(独自算出の注目度): 10.512280991285893
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce the task of generative panoramic image stitching, which aims to synthesize seamless panoramas that are faithful to the content of multiple reference images containing parallax effects and strong variations in lighting, camera capture settings, or style. In this challenging setting, traditional image stitching pipelines fail, producing outputs with ghosting and other artifacts. While recent generative models are capable of outpainting content consistent with multiple reference images, they fail when tasked with synthesizing large, coherent regions of a panorama. To address these limitations, we propose a method that fine-tunes a diffusion-based inpainting model to preserve a scene's content and layout based on multiple reference images. Once fine-tuned, the model outpaints a full panorama from a single reference image, producing a seamless and visually coherent result that faithfully integrates content from all reference images. Our approach significantly outperforms baselines for this task in terms of image quality and the consistency of image structure and scene layout when evaluated on captured datasets.
- Abstract(参考訳): 本研究では, パララックス効果, 照明, カメラキャプチャ設定, スタイルの強い複数の参照画像の内容に忠実なシームレスなパノラマを合成することを目的としたパノラマ画像縫合作業について紹介する。
この困難な環境では、伝統的な画像ステッチパイプラインが失敗し、ゴーストやその他のアーティファクトで出力を生成する。
最近の生成モデルは、複数の参照画像と整合性のあるコンテンツを表現できるが、パノラマの大きなコヒーレントな領域を合成する作業は失敗する。
これらの制約に対処するために,複数の参照画像に基づいてシーンの内容とレイアウトを保存するための拡散ベースの塗装モデルを微調整する手法を提案する。
一度微調整すると、モデルは単一の参照画像から完全なパノラマを出力し、シームレスで視覚的に一貫性のある結果を生成し、すべての参照画像からのコンテンツを忠実に統合する。
提案手法は,画像の質と画像構造とシーンレイアウトの整合性の観点から,取得したデータセットで評価した場合において,このタスクのベースラインを著しく上回る。
関連論文リスト
- Conditional Panoramic Image Generation via Masked Autoregressive Modeling [35.624070746282186]
本稿では,これらの課題に対処するために,マスク付き自己回帰モデルを活用した統合フレームワークパノラマ自動回帰モデル(PAR)を提案する。
既存の生成モデルに固有の不連続性に対処するため,空間コヒーレンスを高めるために円パディングを導入する。
実験では、テキスト・ツー・イメージ生成とパノラマ・アパインティング・タスクの競争性能を示す。
論文 参考訳(メタデータ) (2025-05-22T16:20:12Z) - Generative Image Layer Decomposition with Visual Effects [49.75021036203426]
LayerDecompは、イメージ層分解のための生成フレームワークである。
清潔な背景と、忠実に保存された視覚効果を持つ高品質な透明な前景を作り出す。
本手法は,オブジェクト除去や空間編集作業において,既存の手法よりも優れた分解特性を実現する。
論文 参考訳(メタデータ) (2024-11-26T20:26:49Z) - DiffPano: Scalable and Consistent Text to Panorama Generation with Spherical Epipolar-Aware Diffusion [60.45000652592418]
本稿では,テキスト駆動型パノラマ生成フレームワークDiffPanoを提案し,拡張性,一貫性,多様なパノラマシーン生成を実現する。
DiffPanoは、不明瞭なテキスト記述とカメラのポーズによって、一貫した多様なパノラマ画像を生成することができることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:57:02Z) - Robust Multi-Modal Image Stitching for Improved Scene Understanding [2.0476854378186102]
私たちはOpenCVのステッチモジュールをタップする、ユニークで包括的なイメージスティッチパイプラインを考案しました。
当社のアプローチでは,機能ベースのマッチング,変換推定,ブレンディング技術を統合して,上位品質のパノラマビューを実現する。
論文 参考訳(メタデータ) (2023-12-28T13:24:48Z) - PanoContext-Former: Panoramic Total Scene Understanding with a
Transformer [37.51637352106841]
パノラマ画像は、周囲の環境についてより深く理解し、より総合的な認識を可能にする。
本稿では,室内環境の総合的理解に先立って深度を用いた新しい手法を提案する。
さらに,写真リアリスティックパノラマ,高忠実度深度画像,正確にアノテートされた部屋レイアウト,配向オブジェクト境界ボックスや形状など,シーン理解のための実世界のデータセットを導入する。
論文 参考訳(メタデータ) (2023-05-21T16:20:57Z) - FPANet: Frequency-based Video Demoireing using Frame-level Post Alignment [10.556848553421158]
FPANetは、周波数領域と空間領域の両方でフィルタを学習する画像-ビデオ復調ネットワークである。
提案手法の有効性を,一般公開された大規模データセットを用いて実証する。
論文 参考訳(メタデータ) (2023-01-18T06:37:24Z) - HORIZON: High-Resolution Semantically Controlled Panorama Synthesis [105.55531244750019]
パノラマ合成は、仮想世界の中心にユーザーを没入させ、360度の視覚的な風景を再現する。
視覚合成の最近の進歩は、2次元平面画像における意味制御の可能性を解き放ったが、これらの手法のパノラマ合成への直接的応用は歪んだ内容を生み出す。
我々は,高分解能パノラマを生成するための革新的な枠組みを公表し,洗練された球面モデリングによる球面歪みとエッジ不連続性の問題に着目した。
論文 参考訳(メタデータ) (2022-10-10T09:43:26Z) - Cylin-Painting: Seamless {360\textdegree} Panoramic Image Outpainting
and Beyond [136.18504104345453]
塗り絵と塗り絵の間に有意義な協調関係を持つキリン塗り絵の枠組みを提示する。
提案アルゴリズムは、オブジェクト検出、深さ推定、画像超解像などの他のパノラマ視覚タスクに効果的に拡張できる。
論文 参考訳(メタデータ) (2022-04-18T21:18:49Z) - In&Out : Diverse Image Outpainting via GAN Inversion [89.84841983778672]
image outpaintingは、利用可能なコンテンツを超えて、入力画像の意味的に一貫した拡張を求める。
本研究では、生成的対向ネットワークの反転の観点から問題を定式化する。
私達の発電機はイメージの彼らの共同潜入コードそして個々の位置で調節されるマイクロ パッチをレンダリングします。
論文 参考訳(メタデータ) (2021-04-01T17:59:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。