論文の概要: Pixel-wise Deep Image Stitching
- arxiv url: http://arxiv.org/abs/2112.06171v1
- Date: Sun, 12 Dec 2021 07:28:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 17:11:39.631719
- Title: Pixel-wise Deep Image Stitching
- Title(参考訳): ピクセル単位での奥行き画像のステッチング
- Authors: Hyeokjun Kweon, Hyeonseong Kim, Yoonsu Kang, Youngho Yoon, Wooseong
Jeong and Kuk-Jin Yoon
- Abstract要約: 画像縫いは、異なる視点から撮影された画像をより広い視野で画像に縫い付けることを目的としている。
既存の方法は、推定されたワープ関数を用いて、対象画像を基準画像にワープする。
本稿では,大視差問題に対処するため,画素ワイドワープフィールドを利用した新しい深部画像縫合フレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.824319551526294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image stitching aims at stitching the images taken from different viewpoints
into an image with a wider field of view. Existing methods warp the target
image to the reference image using the estimated warp function, and a
homography is one of the most commonly used warping functions. However, when
images have large parallax due to non-planar scenes and translational motion of
a camera, the homography cannot fully describe the mapping between two images.
Existing approaches based on global or local homography estimation are not free
from this problem and suffer from undesired artifacts due to parallax. In this
paper, instead of relying on the homography-based warp, we propose a novel deep
image stitching framework exploiting the pixel-wise warp field to handle the
large-parallax problem. The proposed deep image stitching framework consists of
two modules: Pixel-wise Warping Module (PWM) and Stitched Image Generating
Module (SIGMo). PWM employs an optical flow estimation model to obtain
pixel-wise warp of the whole image, and relocates the pixels of the target
image with the obtained warp field. SIGMo blends the warped target image and
the reference image while eliminating unwanted artifacts such as misalignments,
seams, and holes that harm the plausibility of the stitched result. For
training and evaluating the proposed framework, we build a large-scale dataset
that includes image pairs with corresponding pixel-wise ground truth warp and
sample stitched result images. We show that the results of the proposed
framework are qualitatively superior to those of the conventional methods,
especially when the images have large parallax. The code and the proposed
dataset will be publicly available soon.
- Abstract(参考訳): 画像ステッチは、異なる視点から撮影された画像をより広い視野で画像に縫い合わせることを目的としている。
既存の手法では、推定されたワープ関数を用いて対象画像を基準画像に警告し、ホモグラフィは最も一般的に使用されるワーピング関数の1つである。
しかし、非平面的なシーンやカメラの翻訳動作による画像の視差が大きい場合、ホモグラフィは2つの画像間のマッピングを完全に記述することはできない。
大域的あるいは局所的ホモグラフィ推定に基づく既存のアプローチは、この問題から自由であり、パララックスによる望ましくないアーティファクトに苦しむ。
本稿では,ホモグラフィに基づくワープに頼らずに,画素方向ワープフィールドを利用して大きなパララックス問題を扱う新しい深部画像縫い付けフレームワークを提案する。
提案手法は,PWM ( Pixel-wise Warping Module) とSIGMo (Stitched Image Generating Module) の2つのモジュールからなる。
PWMは、光学フロー推定モデルを用いて、全画像の画素回りのワープを取得し、得られたワープフィールドで対象画像の画素を移動させる。
SIGMoは、歪んだターゲット画像と参照画像とをブレンドし、縫合された結果の妥当性を損なう、ミスアライメント、縫い目、穴などの不要な成果物を除去する。
提案するフレームワークのトレーニングと評価のために,画像ペアと対応する画素単位の地上真理ワープとサンプル縫合結果画像を含む大規模データセットを構築した。
提案手法は従来の手法よりも質的に優れていることを示し,特に画像の視差が大きい場合について述べる。
コードと提案されたデータセットは近く公開される。
関連論文リスト
- Single-image camera calibration with model-free distortion correction [0.0]
本稿では,センサ全体をカバーする平面スペックルパターンの単一画像から,キャリブレーションパラメータの完全な集合を推定する方法を提案する。
デジタル画像相関を用いて校正対象の画像点と物理点との対応を求める。
プロシージャの最後には、画像全体にわたって、密度が高く均一なモデルフリーな歪みマップが得られる。
論文 参考訳(メタデータ) (2024-03-02T16:51:35Z) - Image Deblurring using GAN [0.0]
本研究は,GAN(Generative Adversarial Network)の画像処理への応用に焦点を当てた。
プロジェクトはGANモデルのインフローを定義し、GoPROデータセットでトレーニングする。
ネットワークは画像のシャープなピクセルを取得でき、平均29.3ピーク信号対雑音比(PSNR)と0.72構造類似度評価(SSIM)を実現している。
論文 参考訳(メタデータ) (2023-12-15T02:43:30Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - CoupAlign: Coupling Word-Pixel with Sentence-Mask Alignments for
Referring Image Segmentation [104.5033800500497]
画像セグメント化の参照は、自然言語文で記述された視覚オブジェクトのすべてのピクセルをローカライズすることを目的としている。
以前の作業では、参照オブジェクトをハイライトするために、文章の埋め込みとピクセルレベルの埋め込みを簡単に調整することを学びました。
単純で効果的なマルチレベル視覚系列アライメント法であるCoupAlignを提案する。
論文 参考訳(メタデータ) (2022-12-04T08:53:42Z) - MC-Blur: A Comprehensive Benchmark for Image Deblurring [127.6301230023318]
ほとんどの実世界の画像では、ブラーは動きやデフォーカスなど様々な要因によって引き起こされる。
我々は,MC-Blurと呼ばれる大規模マルチライク画像デブロアリングデータセットを新たに構築する。
MC-Blurデータセットに基づいて,異なるシナリオにおけるSOTA法の比較を行う。
論文 参考訳(メタデータ) (2021-12-01T02:10:42Z) - Single image deep defocus estimation and its applications [82.93345261434943]
画像パッチを20レベルの曖昧さの1つに分類するために、ディープニューラルネットワークをトレーニングします。
トレーニングされたモデルは、反復重み付きガイドフィルタを適用して改善するパッチのぼかしを決定するために使用される。
その結果、デフォーカスマップは各ピクセルのぼやけた度合いの情報を運ぶ。
論文 参考訳(メタデータ) (2021-07-30T06:18:16Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z) - Deep Contrastive Patch-Based Subspace Learning for Camera Image Signal
Processing [5.678834480723395]
我々は、カメラISPを改良し、異質なアーティファクトに対して堅牢なパッチベースのローカルサブスペースディープニューラルネットワークを提案する。
Patch Subspace Learning Autoencoder (PSL-AE) と呼ぶ。
PSL-AEは、コントラスト学習によって、異なるアーティファクトタイプや歪みレベルを持つ、ノイズの多い第2クリーンイメージペアから抽出されたパッチを符号化する。
論文 参考訳(メタデータ) (2021-04-01T04:40:22Z) - Learning Edge-Preserved Image Stitching from Large-Baseline Deep
Homography [32.28310831466225]
本稿では,大規模なベースライン深部ホログラフィモジュールとエッジ保存変形モジュールからなる画像縫合学習フレームワークを提案する。
本手法は既存の学習方法よりも優れ,最先端の従来の手法と競合する性能を示す。
論文 参考訳(メタデータ) (2020-12-11T08:43:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。