論文の概要: RecDiffusion: Rectangling for Image Stitching with Diffusion Models
- arxiv url: http://arxiv.org/abs/2403.19164v1
- Date: Thu, 28 Mar 2024 06:22:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-29 17:12:54.315101
- Title: RecDiffusion: Rectangling for Image Stitching with Diffusion Models
- Title(参考訳): RecDiffusion:拡散モデルによる画像ストッチングのための矩形化
- Authors: Tianhao Zhou, Haipeng Li, Ziyi Wang, Ao Luo, Chen-Lin Zhang, Jiajun Li, Bing Zeng, Shuaicheng Liu,
- Abstract要約: 画像縫合整形のための新しい拡散学習フレームワーク textbfRecDiffusion を提案する。
このフレームワークは運動拡散モデル(MDM)を組み合わせて運動場を生成し、縫合された画像の不規則な境界から幾何学的に修正された中間体へ効果的に遷移する。
- 参考スコア(独自算出の注目度): 53.824503710254206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image stitching from different captures often results in non-rectangular boundaries, which is often considered unappealing. To solve non-rectangular boundaries, current solutions involve cropping, which discards image content, inpainting, which can introduce unrelated content, or warping, which can distort non-linear features and introduce artifacts. To overcome these issues, we introduce a novel diffusion-based learning framework, \textbf{RecDiffusion}, for image stitching rectangling. This framework combines Motion Diffusion Models (MDM) to generate motion fields, effectively transitioning from the stitched image's irregular borders to a geometrically corrected intermediary. Followed by Content Diffusion Models (CDM) for image detail refinement. Notably, our sampling process utilizes a weighted map to identify regions needing correction during each iteration of CDM. Our RecDiffusion ensures geometric accuracy and overall visual appeal, surpassing all previous methods in both quantitative and qualitative measures when evaluated on public benchmarks. Code is released at https://github.com/lhaippp/RecDiffusion.
- Abstract(参考訳): 異なるキャプチャーから画像を縫い合わせると、しばしば正方でない境界線が生じる。
非矩形境界を解決するために、現在のソリューションは、画像内容を捨てる収穫法、無関係なコンテンツを導入できる塗装法、非直線的特徴を歪ませ、アーティファクトを導入することのできるワープを含む。
これらの課題を克服するために、画像縫合整形のための新しい拡散学習フレームワークである \textbf{RecDiffusion} を導入する。
このフレームワークは運動拡散モデル(MDM)を組み合わせて運動場を生成し、縫合された画像の不規則な境界から幾何学的に修正された中間体へ効果的に遷移する。
画像詳細精細化のためのコンテンツ拡散モデル(CDM)による追従。
特に,本プロセスでは重み付きマップを用いて,CDMの各イテレーションで補正が必要な領域を特定する。
我々のRecDiffusionは幾何的精度と全体的な視覚的魅力を保証し、公的なベンチマークで評価した場合の量的および質的な測定において、過去のすべての手法を上回ります。
コードはhttps://github.com/lhaippp/RecDiffusion.comで公開されている。
関連論文リスト
- Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - Towards Coherent Image Inpainting Using Denoising Diffusion Implicit
Models [43.83732051916894]
ミスマッチを伴わずに全体像をコヒーレントに描けるCOPAINTを提案する。
COPAINTはまた、ベイジアンフレームワークを使用して、明らかにされていない領域と未公開領域の両方を共同で修正している。
実験により,COPAINTは,客観的,主観的両方の指標の下で,既存の拡散法よりも優れていることを確認した。
論文 参考訳(メタデータ) (2023-04-06T18:35:13Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - Conditional Injective Flows for Bayesian Imaging [18.561430512510956]
インジェクティビティは、低次元の潜在空間とアーキテクチャの革新とともにメモリフットプリントとトレーニング時間を短縮する。
C-トランペットは、MMSEやMAPのような点推定の高速な近似と、物理的に意味のある不確実性定量化を可能にする。
論文 参考訳(メタデータ) (2022-04-15T22:26:21Z) - Automatic Registration of Images with Inconsistent Content Through
Line-Support Region Segmentation and Geometrical Outlier Removal [17.90609572352273]
本稿では,線支持領域分割と幾何外乱除去(ALRS-GOR)による自動画像登録手法を提案する。
アフィン変形と矛盾した内容を含む画像の登録に関する問題に対処するように設計されている。
提案手法の評価には,アフィン変形を模擬した空中画像など,様々な画像セットが検討されている。
論文 参考訳(メタデータ) (2022-04-02T10:47:16Z) - Deep Rectangling for Image Stitching: A Learning Baseline [57.76737888499145]
我々は不規則な境界やシーンに大きな多様性を持つ最初の画像縫合整形データセットを構築した。
実験では、従来の方法よりも定量的にも質的にも優位性を示す。
論文 参考訳(メタデータ) (2022-03-08T03:34:10Z) - Denoising Diffusion Restoration Models [110.1244240726802]
Denoising Diffusion Restoration Models (DDRM) は効率的で教師なしの後方サンプリング手法である。
DDRMの汎用性を、超高解像度、デブロアリング、インペイント、カラー化のためにいくつかの画像データセットに示す。
論文 参考訳(メタデータ) (2022-01-27T20:19:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。