論文の概要: Image Stitching Based on Planar Region Consensus
- arxiv url: http://arxiv.org/abs/2007.02722v1
- Date: Mon, 6 Jul 2020 13:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 02:44:52.855516
- Title: Image Stitching Based on Planar Region Consensus
- Title(参考訳): 平面領域のコンセンサスに基づく画像ステッチング
- Authors: Aocheng Li, Jie Guo, Yanwen Guo
- Abstract要約: 本稿では,マッチングされた支配的な平面領域の集合をアライメントすることで,画像の縫合を行う新しい画像縫合法を提案する。
我々は、RGB画像から直接リッチな意味情報を用いて、深層畳み込みニューラルネットワーク(CNN)を用いて平面画像領域を抽出する。
我々の手法は、異なる状況に対処し、挑戦的な場面で最先端の技術を発揮できる。
- 参考スコア(独自算出の注目度): 22.303750435673752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image stitching for two images without a global transformation between them
is notoriously difficult. In this paper, noticing the importance of planar
structure under perspective geometry, we propose a new image stitching method
which stitches images by allowing for the alignment of a set of matched
dominant planar regions. Clearly different from previous methods resorting to
plane segmentation, the key to our approach is to utilize rich semantic
information directly from RGB images to extract planar image regions with a
deep Convolutional Neural Network (CNN). We specifically design a new module to
make fully use of existing semantic segmentation networks to accommodate planar
segmentation. To train the network, a dataset for planar region segmentation is
contributed. With the planar region knowledge, a set of local transformations
can be obtained by constraining matched regions, enabling more precise
alignment in the overlapping area. We also use planar knowledge to estimate a
transformation field over the whole image. The final mosaic is obtained by a
mesh-based optimization framework which maintains high alignment accuracy and
relaxes similarity transformation at the same time. Extensive experiments with
quantitative comparisons show that our method can deal with different
situations and outperforms the state-of-the-arts on challenging scenes.
- Abstract(参考訳): グローバルな変換なしに2つの画像を縫い合わせることは、非常に難しい。
本稿では,視点幾何学における平面構造の重要性に着目し,マッチングされた平面領域のアライメントを可能にすることにより,画像を縫い合わせる新しい画像縫い付け手法を提案する。
平面分割を利用した従来の手法と明らかに異なるのは、RGB画像から直接リッチな意味情報を利用して、深層畳み込みニューラルネットワーク(CNN)を用いて平面画像領域を抽出することである。
具体的には,既存のセマンティックセグメンテーションネットワークを完全に活用して,平面セグメンテーションに対応する新しいモジュールを設計する。
ネットワークをトレーニングするために、平面領域セグメンテーション用のデータセットを寄贈する。
平面領域知識により、一致した領域を制約し、重なり合う領域をより正確にアライメントすることで、一連の局所変換を得ることができる。
また,平面知識を用いて画像全体の変換フィールドを推定する。
最後のモザイクはメッシュベースの最適化フレームワークで得られ、高いアライメント精度を維持し、類似性変換を同時に緩和する。
定量的比較による広範囲な実験により,本手法は異なる状況に対処でき,課題場面の最先端を上回ることができることを示した。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - ReFit: A Framework for Refinement of Weakly Supervised Semantic
Segmentation using Object Border Fitting for Medical Images [4.945138408504987]
Weakly Supervised Semantic (WSSS)は、画像レベルの監視のみに依存しているため、ネットワークの必要性に対処する上で有望なアプローチである。
本稿では,最新クラスのアクティベーションマップとポストプロセッシング手法を組み合わせたReFitフレームワークを提案する。
本手法をWSSS予測に適用することにより,医用画像の最先端WSSS法に対して最大10%の改善を実現した。
論文 参考訳(メタデータ) (2023-03-14T12:46:52Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Cross-Image Region Mining with Region Prototypical Network for Weakly
Supervised Segmentation [45.39679291105364]
トレーニングセットのクロスイメージオブジェクトの多様性を探索する領域ネットワークRPNetを提案する。
画像にまたがる類似の物体は、地域特徴比較によって識別される。
実験の結果,提案手法はより完全で正確な擬似物体マスクを生成することがわかった。
論文 参考訳(メタデータ) (2021-08-17T02:51:02Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - Region Similarity Representation Learning [94.88055458257081]
Region similarity Representation Learning(ReSim)は、ローカリゼーションベースのタスクに対する自己監視型表現学習の新しいアプローチである。
ReSimはローカリゼーションのための地域表現とセマンティックイメージレベルの表現の両方を学びます。
競合するMoCo-v2ベースラインと比較して、ReSimがローカリゼーションと分類性能を大幅に向上させる表現をどのように学習するかを示します。
論文 参考訳(メタデータ) (2021-03-24T00:42:37Z) - SPAN: Spatial Pyramid Attention Network forImage Manipulation
Localization [24.78951727072683]
本稿では,複数種類の画像操作の検出と位置決定のための新しいフレームワークである空間ピラミッド注意ネットワーク(SPAN)を提案する。
SPANは汎用的な合成データセットでトレーニングされるが、特定のデータセットに対して微調整することもできる。
提案手法は,従来の最先端手法に比べて,標準データセットの性能が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-09-01T21:59:35Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - Split-Merge Pooling [36.2980225204665]
スプリット・マージ・プールはサブサンプリングなしで空間情報を保存するために導入された。
本研究では,CityscapesとGTA-5データセットから得られた大規模画像の高密度なセマンティックセマンティックセマンティックセグメンテーションについて検討した。
論文 参考訳(メタデータ) (2020-06-13T23:20:30Z) - Neural Subdivision [58.97214948753937]
本稿では,データ駆動型粗粒度モデリングの新しいフレームワークであるNeural Subdivisionを紹介する。
すべてのローカルメッシュパッチで同じネットワーク重みのセットを最適化するため、特定の入力メッシュや固定属、カテゴリに制約されないアーキテクチャを提供します。
単一の高分解能メッシュでトレーニングしても,本手法は新規な形状に対して合理的な区分を生成する。
論文 参考訳(メタデータ) (2020-05-04T20:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。