論文の概要: Iterative Geometry-Aware Cross Guidance Network for Stereo Image
Inpainting
- arxiv url: http://arxiv.org/abs/2205.03825v2
- Date: Wed, 11 May 2022 03:22:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 18:47:39.145234
- Title: Iterative Geometry-Aware Cross Guidance Network for Stereo Image
Inpainting
- Title(参考訳): ステレオ画像インパインティングのための反復幾何認識クロスガイダンスネットワーク
- Authors: Ang Li, Shanshan Zhao, Qingjie Zhang, Qiuhong Ke
- Abstract要約: ステレオ画像に欠落した領域を塗布するための反復幾何対応クロスガイダンスネットワーク(IGGNet)を提案する。
IGGNetにはGeometry-Aware Attention (GAA)モジュールとIterative Cross Guidance (ICG)戦略が含まれている。
提案するネットワークは,最新のステレオ画像インペイントモデルと最先端の単一画像インペイントモデルより優れている。
- 参考スコア(独自算出の注目度): 23.56949308737684
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Currently, single image inpainting has achieved promising results based on
deep convolutional neural networks. However, inpainting on stereo images with
missing regions has not been explored thoroughly, which is also a significant
but different problem. One crucial requirement for stereo image inpainting is
stereo consistency. To achieve it, we propose an Iterative Geometry-Aware Cross
Guidance Network (IGGNet). The IGGNet contains two key ingredients, i.e., a
Geometry-Aware Attention (GAA) module and an Iterative Cross Guidance (ICG)
strategy. The GAA module relies on the epipolar geometry cues and learns the
geometry-aware guidance from one view to another, which is beneficial to make
the corresponding regions in two views consistent. However, learning guidance
from co-existing missing regions is challenging. To address this issue, the ICG
strategy is proposed, which can alternately narrow down the missing regions of
the two views in an iterative manner. Experimental results demonstrate that our
proposed network outperforms the latest stereo image inpainting model and
state-of-the-art single image inpainting models.
- Abstract(参考訳): 現在、単一の画像インパインティングは、深い畳み込みニューラルネットワークに基づく有望な結果を達成している。
しかし、欠落領域を持つステレオ画像のインペインティングは、十分に検討されていないため、重要ではあるが異なる問題である。
ステレオ画像インパインティングの重要な要件は、ステレオ一貫性である。
そこで我々は,IGGNet(Iterative Geometry-Aware Cross Guidance Network)を提案する。
IGGNetには、Geometry-Aware Attention (GAA)モジュールとIterative Cross Guidance (ICG)戦略という2つの重要な要素が含まれている。
GAAモジュールは、エピポーラ幾何学の手がかりに依存し、ある視点から別の視点への幾何学的ガイダンスを学ぶ。
しかし、既存の欠落領域からの学習指導は困難である。
この問題に対処するため、ICG戦略が提案され、2つのビューの欠落した領域を反復的に絞り込むことができる。
実験の結果,提案ネットワークは,最新のステレオイメージインペインティングモデルと最先端のシングルイメージインペインティングモデルよりも優れていることがわかった。
関連論文リスト
- Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Deep GAN-Based Cross-Spectral Cross-Resolution Iris Recognition [15.425678759101203]
クロススペクトル虹彩認識は、個人のアイデンティティを確立するための有望な生体計測手法として出現している。
異なるスペクトル帯域で取得した虹彩画像(すなわち、可視(VIS)虹彩プローブと近赤外(NIR)虹彩画像のギャラリーとのマッチング)は、大きな性能劣化を示す。
我々は,クロススペクトル虹彩認識手法の精度を高めるために,深層畳み込み生成対向ネットワーク(DCGAN)アーキテクチャについて検討した。
論文 参考訳(メタデータ) (2021-08-03T15:30:04Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - Geometry-Aware Unsupervised Domain Adaptation for Stereo Matching [0.7233897166339268]
立体クロスアテンション(SCA: Stereoscopic Cross Attention)と呼ばれる,左右の視点で特徴を集約する注意メカニズムを提案する。
SCAは、画像から画像への変換の過程でステレオ画像ペアの幾何学的構造を保存することができる。
SCAによる画像から画像への変換に基づく非監視領域適応の提案の有効性を実証的に実証する。
論文 参考訳(メタデータ) (2021-03-26T08:53:36Z) - Geometry-Guided Street-View Panorama Synthesis from Satellite Imagery [80.6282101835164]
オーバヘッド衛星画像から新しいストリートビューパノラマを合成するための新しいアプローチを提案する。
本手法は,googleの全方位ストリートビュー型パノラマを,衛星パッチの中央と同じ地理的位置から取得したかのように生成する。
論文 参考訳(メタデータ) (2021-03-02T10:27:05Z) - GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D
Object Pose Estimation [71.83992173720311]
単一のRGB画像からの6次元ポーズ推定はコンピュータビジョンの基本課題である。
GDR-Net(Geometry-Guided Direct Regression Network)を用いて6Dポーズをエンドツーエンドで学習する。
提案手法は, LM, LM-O, YCB-Vデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。