論文の概要: Robust image stitching with multiple registrations
- arxiv url: http://arxiv.org/abs/2011.11784v1
- Date: Mon, 23 Nov 2020 23:08:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 02:36:59.949697
- Title: Robust image stitching with multiple registrations
- Title(参考訳): 複数登録によるロバスト画像縫合
- Authors: Charles Herrmann and Chen Wang and Richard Strong Bowen and Emil
Keyder and Michael Krainin and Ce Liu and Ramin Zabih
- Abstract要約: パノラマ生成はコンピュータビジョンにおいて最も広く使われている技法の1つである。
伝統的に、問題は登録、シーム発見、ブレンディングの3つの段階に分けられる。
ここでは、特に大きな深度変化や物体の動きのあるシーンにおいて、単一の登録を使用することでエラーが発生することが多いことを観察する。
代わりに、複数の登録を使用することにより、異なる深さの画像の領域をより正確にキャプチャすることができる。
- 参考スコア(独自算出の注目度): 22.174139555366505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panorama creation is one of the most widely deployed techniques in computer
vision. In addition to industry applications such as Google Street View, it is
also used by millions of consumers in smartphones and other cameras.
Traditionally, the problem is decomposed into three phases: registration, which
picks a single transformation of each source image to align it to the other
inputs, seam finding, which selects a source image for each pixel in the final
result, and blending, which fixes minor visual artifacts. Here, we observe that
the use of a single registration often leads to errors, especially in scenes
with significant depth variation or object motion. We propose instead the use
of multiple registrations, permitting regions of the image at different depths
to be captured with greater accuracy. MRF inference techniques naturally extend
to seam finding over multiple registrations, and we show here that their energy
functions can be readily modified with new terms that discourage duplication
and tearing, common problems that are exacerbated by the use of multiple
registrations. Our techniques are closely related to layer-based stereo, and
move image stitching closer to explicit scene modeling. Experimental evidence
demonstrates that our techniques often generate significantly better panoramas
when there is substantial motion or parallax.
- Abstract(参考訳): パノラマ生成はコンピュータビジョンにおいて最も広く使われている技術の一つである。
google street viewのような業界アプリケーションに加えて、数百万の消費者がスマートフォンや他のカメラで使用している。
伝統的に、問題は3つのフェーズに分解される: 登録: ソースイメージの1つの変換を選択して他の入力と整合させる シーム検索: 最終的な結果で各ピクセルのソースイメージを選択する ブレンディング: マイナーなビジュアルアーティファクトを修正する 。
ここでは、特に大きな深度変化や物体の動きのあるシーンにおいて、単一の登録を使用することでエラーが発生することが多いことを観察する。
そこで本研究では,画像の奥行きの異なる領域を高い精度でキャプチャできる多重登録方式を提案する。
MRF推論技術は,複数の登録にまたがって海面まで自然に拡張され,そのエネルギー関数は,複数登録の使用によって悪化する一般的な問題である重複や裂けを防止できる新しい用語で容易に変更可能であることを示す。
本手法は,階層型ステレオと密接な関係を持ち,画像のステッチングを明示的なシーンモデリングに近づける。
実験的証拠は,本手法が実質的な運動や視差でパノラマを有意に改善することを示している。
関連論文リスト
- Consolidating Attention Features for Multi-view Image Editing [126.19731971010475]
本研究では,空間制御に基づく幾何学的操作に着目し,様々な視点にまたがって編集プロセスを統合する手法を提案する。
編集画像の内部クエリ機能に基づいて訓練されたニューラルラジアンス場QNeRFを紹介する。
拡散時間の経過とともにクエリをよりよく統合する、プログレッシブで反復的な手法により、プロセスを洗練します。
論文 参考訳(メタデータ) (2024-02-22T18:50:18Z) - Converting Depth Images and Point Clouds for Feature-based Pose
Estimation [0.0]
本稿では,従来の奥行き画像に隠された空間的細部を可視化し,深度データを画像に変換する手法を提案する。
Bearing Angleの画像と比較すると、より鮮やかでコントラストの高い画像が得られる。
論文 参考訳(メタデータ) (2023-10-23T13:29:42Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Masked Transformer for image Anomaly Localization [14.455765147827345]
パッチマスキングを用いたビジョントランスフォーマーアーキテクチャに基づく画像異常検出のための新しいモデルを提案する。
マルチレゾリューションパッチとその集合埋め込みは,モデルの性能を大幅に向上させることを示す。
提案モデルはMVTecや頭部CTなどの一般的な異常検出データセットでテストされている。
論文 参考訳(メタデータ) (2022-10-27T15:30:48Z) - A Multi-modal Registration and Visualization Software Tool for Artworks
using CraquelureNet [11.225641274591101]
本稿では,歴史画におけるひび割れ構造の横断的特徴を抽出して自動登録を行うために,畳み込みニューラルネットワークを組み込んだ登録可視化ソフトウェアツールを提案する。
グラフィカルユーザインタフェースは、ユーザの入力を処理して、登録パラメータを設定し、登録されたペアとイメージオーバーレイで画像ビューをインタラクティブに適応させる。
本評価では,本手法を歴史的印刷物に適用することにより,マルチモーダル絵画における登録性能と短い推測時間と伝達性の観点から,ソフトウェアツールの有効性を質的かつ定量的に示す。
論文 参考訳(メタデータ) (2022-08-18T13:57:37Z) - Real-Time Neural Character Rendering with Pose-Guided Multiplane Images [75.62730144924566]
リアルなシーンでアニマタブルなキャラクタをフォトリアリスティックな画質でレンダリングできるポーズ誘導多面体画像(MPI)合成を提案する。
我々は、移動物体の駆動信号とともに多視点画像をキャプチャするために、ポータブルカメラリグを使用します。
論文 参考訳(メタデータ) (2022-04-25T17:51:38Z) - Translate to Adapt: RGB-D Scene Recognition across Domains [18.40373730109694]
本研究では,マルチモーダルシーン認識データセット内に,潜在的に深刻なドメインシフト問題が存在することを注目する。
本稿では,異なるカメラ領域にまたがって適応可能な自己教師付きモダリティ間翻訳法を提案する。
論文 参考訳(メタデータ) (2021-03-26T18:20:29Z) - Split then Refine: Stacked Attention-guided ResUNets for Blind Single
Image Visible Watermark Removal [69.92767260794628]
従来の透かし除去方法は,ユーザから透かしの位置を取得したり,マルチタスクネットワークをトレーニングして,背景を無差別に復元する必要があった。
本稿では,注目誘導型ResUNetsを積み重ねた新しい2段階フレームワークを提案し,検出・除去・精錬の過程をシミュレートする。
様々な条件下で4つの異なるデータセット上でアルゴリズムを広範囲に評価し,その手法が他の最先端手法をはるかに上回っていることを示す実験を行った。
論文 参考訳(メタデータ) (2020-12-13T09:05:37Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Look here! A parametric learning based approach to redirect visual
attention [49.609412873346386]
画像領域を微妙な画像編集によってより注目度の高いものにするための自動手法を提案する。
我々のモデルは、前景および背景画像領域に適用可能な、異なるグローバルパラメトリック変換セットを予測する。
編集により、任意の画像サイズでインタラクティブなレートでの推論が可能になり、簡単に動画に一般化できる。
論文 参考訳(メタデータ) (2020-08-12T16:08:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。