論文の概要: Robust image stitching with multiple registrations
- arxiv url: http://arxiv.org/abs/2011.11784v1
- Date: Mon, 23 Nov 2020 23:08:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 02:36:59.949697
- Title: Robust image stitching with multiple registrations
- Title(参考訳): 複数登録によるロバスト画像縫合
- Authors: Charles Herrmann and Chen Wang and Richard Strong Bowen and Emil
Keyder and Michael Krainin and Ce Liu and Ramin Zabih
- Abstract要約: パノラマ生成はコンピュータビジョンにおいて最も広く使われている技法の1つである。
伝統的に、問題は登録、シーム発見、ブレンディングの3つの段階に分けられる。
ここでは、特に大きな深度変化や物体の動きのあるシーンにおいて、単一の登録を使用することでエラーが発生することが多いことを観察する。
代わりに、複数の登録を使用することにより、異なる深さの画像の領域をより正確にキャプチャすることができる。
- 参考スコア(独自算出の注目度): 22.174139555366505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panorama creation is one of the most widely deployed techniques in computer
vision. In addition to industry applications such as Google Street View, it is
also used by millions of consumers in smartphones and other cameras.
Traditionally, the problem is decomposed into three phases: registration, which
picks a single transformation of each source image to align it to the other
inputs, seam finding, which selects a source image for each pixel in the final
result, and blending, which fixes minor visual artifacts. Here, we observe that
the use of a single registration often leads to errors, especially in scenes
with significant depth variation or object motion. We propose instead the use
of multiple registrations, permitting regions of the image at different depths
to be captured with greater accuracy. MRF inference techniques naturally extend
to seam finding over multiple registrations, and we show here that their energy
functions can be readily modified with new terms that discourage duplication
and tearing, common problems that are exacerbated by the use of multiple
registrations. Our techniques are closely related to layer-based stereo, and
move image stitching closer to explicit scene modeling. Experimental evidence
demonstrates that our techniques often generate significantly better panoramas
when there is substantial motion or parallax.
- Abstract(参考訳): パノラマ生成はコンピュータビジョンにおいて最も広く使われている技術の一つである。
google street viewのような業界アプリケーションに加えて、数百万の消費者がスマートフォンや他のカメラで使用している。
伝統的に、問題は3つのフェーズに分解される: 登録: ソースイメージの1つの変換を選択して他の入力と整合させる シーム検索: 最終的な結果で各ピクセルのソースイメージを選択する ブレンディング: マイナーなビジュアルアーティファクトを修正する 。
ここでは、特に大きな深度変化や物体の動きのあるシーンにおいて、単一の登録を使用することでエラーが発生することが多いことを観察する。
そこで本研究では,画像の奥行きの異なる領域を高い精度でキャプチャできる多重登録方式を提案する。
MRF推論技術は,複数の登録にまたがって海面まで自然に拡張され,そのエネルギー関数は,複数登録の使用によって悪化する一般的な問題である重複や裂けを防止できる新しい用語で容易に変更可能であることを示す。
本手法は,階層型ステレオと密接な関係を持ち,画像のステッチングを明示的なシーンモデリングに近づける。
実験的証拠は,本手法が実質的な運動や視差でパノラマを有意に改善することを示している。
関連論文リスト
- 3D Multimodal Image Registration for Plant Phenotyping [0.6697966247860049]
植物フェノタイピングのための複合マルチモーダルモニタリングシステムにおける複数のカメラ技術の利用は、有望な利益をもたらす。
クロスモーダルパターンの有効利用は、ピクセル・正確なアライメントを実現するために、正確な画像登録に依存する。
本稿では,飛行時間カメラからの深度情報を登録プロセスに統合することにより,これらの課題に対処する新しいマルチモーダル3D画像登録手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T09:29:46Z) - Zero-shot Image Editing with Reference Imitation [50.75310094611476]
我々は、ユーザーがより便利に創造性を発揮できるように、模倣編集と呼ばれる新しい形態の編集を提示する。
ビデオクリップから2つのフレームをランダムに選択し、あるフレームのいくつかの領域をマスクし、他のフレームからの情報を用いてマスクされた領域を復元する、MimicBrushと呼ばれる生成学習フレームワークを提案する。
各種試験事例における本手法の有効性を実験的に示すとともに,既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-11T17:59:51Z) - Be Yourself: Bounded Attention for Multi-Subject Text-to-Image Generation [60.943159830780154]
本稿では,サンプリングプロセスにおける情報フローをバウンドする訓練不要な手法である境界注意法を紹介する。
提案手法は,与えられたプロンプトとレイアウトの整合性を向上する複数の主題の生成に有効であることを示す。
論文 参考訳(メタデータ) (2024-03-25T17:52:07Z) - Consolidating Attention Features for Multi-view Image Editing [126.19731971010475]
本研究では,空間制御に基づく幾何学的操作に着目し,様々な視点にまたがって編集プロセスを統合する手法を提案する。
編集画像の内部クエリ機能に基づいて訓練されたニューラルラジアンス場QNeRFを紹介する。
拡散時間の経過とともにクエリをよりよく統合する、プログレッシブで反復的な手法により、プロセスを洗練します。
論文 参考訳(メタデータ) (2024-02-22T18:50:18Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Masked Transformer for image Anomaly Localization [14.455765147827345]
パッチマスキングを用いたビジョントランスフォーマーアーキテクチャに基づく画像異常検出のための新しいモデルを提案する。
マルチレゾリューションパッチとその集合埋め込みは,モデルの性能を大幅に向上させることを示す。
提案モデルはMVTecや頭部CTなどの一般的な異常検出データセットでテストされている。
論文 参考訳(メタデータ) (2022-10-27T15:30:48Z) - Real-Time Neural Character Rendering with Pose-Guided Multiplane Images [75.62730144924566]
リアルなシーンでアニマタブルなキャラクタをフォトリアリスティックな画質でレンダリングできるポーズ誘導多面体画像(MPI)合成を提案する。
我々は、移動物体の駆動信号とともに多視点画像をキャプチャするために、ポータブルカメラリグを使用します。
論文 参考訳(メタデータ) (2022-04-25T17:51:38Z) - Translate to Adapt: RGB-D Scene Recognition across Domains [18.40373730109694]
本研究では,マルチモーダルシーン認識データセット内に,潜在的に深刻なドメインシフト問題が存在することを注目する。
本稿では,異なるカメラ領域にまたがって適応可能な自己教師付きモダリティ間翻訳法を提案する。
論文 参考訳(メタデータ) (2021-03-26T18:20:29Z) - Look here! A parametric learning based approach to redirect visual
attention [49.609412873346386]
画像領域を微妙な画像編集によってより注目度の高いものにするための自動手法を提案する。
我々のモデルは、前景および背景画像領域に適用可能な、異なるグローバルパラメトリック変換セットを予測する。
編集により、任意の画像サイズでインタラクティブなレートでの推論が可能になり、簡単に動画に一般化できる。
論文 参考訳(メタデータ) (2020-08-12T16:08:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。