論文の概要: ORStereo: Occlusion-Aware Recurrent Stereo Matching for 4K-Resolution
Images
- arxiv url: http://arxiv.org/abs/2103.07798v1
- Date: Sat, 13 Mar 2021 21:46:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 06:54:12.213419
- Title: ORStereo: Occlusion-Aware Recurrent Stereo Matching for 4K-Resolution
Images
- Title(参考訳): ORStereo: Occlusion-Aware Recurrent Stereo Matching for 4K-Resolution Images
- Authors: Yaoyu Hu, Wenshan Wang, Huai Yu, Weikun Zhen, Sebastian Scherer
- Abstract要約: Occlusion-aware Recurrent binocular Stereo matching (ORStereo) を施行した。
ORStereoは、タスクを初期予測の残差更新と改善として定式化し、大きな異なる範囲の高解像度画像を目にしないように一般化する。
合成画像と実世界の高解像度画像の両方でモデルの能力をテストします。
- 参考スコア(独自算出の注目度): 13.508624751092654
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Stereo reconstruction models trained on small images do not generalize well
to high-resolution data. Training a model on high-resolution image size faces
difficulties of data availability and is often infeasible due to limited
computing resources. In this work, we present the Occlusion-aware Recurrent
binocular Stereo matching (ORStereo), which deals with these issues by only
training on available low disparity range stereo images. ORStereo generalizes
to unseen high-resolution images with large disparity ranges by formulating the
task as residual updates and refinements of an initial prediction. ORStereo is
trained on images with disparity ranges limited to 256 pixels, yet it can
operate 4K-resolution input with over 1000 disparities using limited GPU
memory. We test the model's capability on both synthetic and real-world
high-resolution images. Experimental results demonstrate that ORStereo achieves
comparable performance on 4K-resolution images compared to state-of-the-art
methods trained on large disparity ranges. Compared to other methods that are
only trained on low-resolution images, our method is 70% more accurate on
4K-resolution images.
- Abstract(参考訳): 小さな画像でトレーニングされたステレオ再構成モデルは、高解像度データにうまく一般化しない。
高解像度画像サイズでモデルをトレーニングすることは、データ可用性の難しさに直面している。
本研究では,これらの問題に対処すべく,利用可能な低偏差域ステレオ画像のみを訓練するOcclusion-aware Recurrent Binocular Stereo Match (ORStereo) を提案する。
ORStereoは、タスクを初期予測の残差更新と改善として定式化し、大きな異なる範囲の高解像度画像を目にしないように一般化する。
ORStereoは256ピクセルに制限のある画像でトレーニングされているが、4K解像度の入力を1000以上の差分で動作させることができる。
合成画像と実世界の高解像度画像の両方でモデルの能力をテストします。
実験結果は、ORStereoが4K解像度画像に対して比較性能を発揮することを実証した。
低解像度画像でのみ訓練される他の方法と比較して、4K解像度画像でより70%精度が高い。
関連論文リスト
- ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with
Diffusion Models [126.35334860896373]
本研究では,事前学習した拡散モデルから,トレーニング画像サイズよりもはるかに高解像度で画像を生成する能力について検討する。
注意ベースや共同拡散アプローチのような、高分解能な生成のための既存の研究は、これらの問題にうまく対処できない。
本稿では,推論中の畳み込み知覚場を動的に調整できる簡易かつ効果的な再拡張法を提案する。
論文 参考訳(メタデータ) (2023-10-11T17:52:39Z) - Towards Efficient and Scale-Robust Ultra-High-Definition Image
Demoireing [71.62289021118983]
本研究では、4Kモアレ画像に対処する効率的なベースラインモデルESDNetを提案する。
我々の手法は、より軽量でありながら、最先端の手法よりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2022-07-20T14:20:52Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - Image Resolution Susceptibility of Face Recognition Models [8.368543987898732]
まず,画像解像度が顔認証性能に与える影響を,最先端の顔認識モデルを用いて解析する。
合成で5倍の5倍の5倍の5倍になる画像の場合、検証性能は99.23%から約55%に低下する。
論文 参考訳(メタデータ) (2021-07-08T11:30:27Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z) - Contextual Residual Aggregation for Ultra High-Resolution Image
Inpainting [12.839962012888199]
そこで本稿では,CRA(Contextual Residual Aggregation)機構を提案する。
CRA機構は、コンテキストパッチからの残基の重み付けにより、欠落した内容に対して高周波残基を生成する。
提案手法は,解像度512×512の小型画像に対して学習し,高解像度画像に対する推論を行い,良好な塗装品質を実現する。
論文 参考訳(メタデータ) (2020-05-19T18:55:32Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。