論文の概要: PRISE: Demystifying Deep Lucas-Kanade with Strongly Star-Convex
Constraints for Multimodel Image Alignment
- arxiv url: http://arxiv.org/abs/2303.11526v1
- Date: Tue, 21 Mar 2023 01:19:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 16:56:43.390610
- Title: PRISE: Demystifying Deep Lucas-Kanade with Strongly Star-Convex
Constraints for Multimodel Image Alignment
- Title(参考訳): PRISE:マルチモデル画像アライメントのための強い星凸制約付きディープルーカスカネード
- Authors: Yiqing Zhang, Xinming Huang, Ziming Zhang
- Abstract要約: ルーカス・カナーデ法(英語版)(LK)は、画像の古典的反復的ホモグラフィー推定アルゴリズムであるが、画像対に歪みがある場合、特に局所的最適性に悩まされることが多い。
本稿では、画像最適化のための新しいDeep Star-Convexified Lucas-Kanade(RISE)法を提案する。
- 参考スコア(独自算出の注目度): 18.30521162275051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Lucas-Kanade (LK) method is a classic iterative homography estimation
algorithm for image alignment, but often suffers from poor local optimality
especially when image pairs have large distortions. To address this challenge,
in this paper we propose a novel Deep Star-Convexified Lucas-Kanade (PRISE)
method for multimodel image alignment by introducing strongly star-convex
constraints into the optimization problem. Our basic idea is to enforce the
neural network to approximately learn a star-convex loss landscape around the
ground truth give any data to facilitate the convergence of the LK method to
the ground truth through the high dimensional space defined by the network.
This leads to a minimax learning problem, with contrastive (hinge) losses due
to the definition of strong star-convexity that are appended to the original
loss for training. We also provide an efficient sampling based algorithm to
leverage the training cost, as well as some analysis on the quality of the
solutions from PRISE. We further evaluate our approach on benchmark datasets
such as MSCOCO, GoogleEarth, and GoogleMap, and demonstrate state-of-the-art
results, especially for small pixel errors. Code can be downloaded from
https://github.com/Zhang-VISLab.
- Abstract(参考訳): ルーカス・カナード法(lucas-kanade (lk) method)は、画像アライメントのための古典的な反復ホモグラフィ推定アルゴリズムであるが、特に画像ペアが大きな歪みを持つ場合、局所的最適性に乏しい。
この課題に対処するために、最適化問題に強い星凸制約を導入し、多モデル画像アライメントのための新しいDeep Star-Convexified Lucas-Kanade (PRISE)法を提案する。
我々の基本的な考え方は、ニューラルネットワークに、LK法の基底真実への収束を促進するために、ニューラルネットワークによって定義された高次元空間を通じて、地上真実の周囲の星-凸損失景観を概ね学習させることである。
このことがミニマックス学習問題につながり、訓練のための元の損失に追加される強い恒星凸性の定義による対照的な(ヒンジ)損失が生じる。
また、トレーニングコストを活用するための効率的なサンプリングベースアルゴリズムや、PRISEのソリューションの品質分析も提供する。
MSCOCO、GoogleEarth、GoogleMapといったベンチマークデータセットに対するアプローチをさらに評価し、特に小さなピクセルエラーに対して最先端の結果を示す。
コードはhttps://github.com/Zhang-VISLabからダウンロードできる。
関連論文リスト
- Learning from small data sets: Patch-based regularizers in inverse
problems for image reconstruction [1.1650821883155187]
機械学習の最近の進歩は、ネットワークを訓練するために大量のデータとコンピュータ能力を必要とする。
本稿は,ごく少数の画像のパッチを考慮に入れることで,小さなデータセットから学習する問題に対処する。
本稿では,Langevin Monte Carlo法を用いて後部を近似することにより,不確実な定量化を実現する方法を示す。
論文 参考訳(メタデータ) (2023-12-27T15:30:05Z) - Depth Monocular Estimation with Attention-based Encoder-Decoder Network
from Single Image [7.753378095194288]
ビジョンベースのアプローチは最近多くの注目を集めており、これらの欠点を克服することができる。
本研究では,格子状アーチファクトやぼやけたエッジに悩まされている1つの単眼画像から深度マップを推定する。
我々の新しいアプローチは、最小限のオーバーヘッドで現在の画像の焦点を見つけることができ、奥行き特性の損失を避けることができる。
論文 参考訳(メタデータ) (2022-10-24T23:01:25Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - SDAN: Squared Deformable Alignment Network for Learning Misaligned
Optical Zoom [5.202871995038932]
ディープニューラルネットワーク(DNN)に基づく超解像アルゴリズムは、生成した画像の品質を大幅に改善した。
これらのアルゴリズムはしばしば、現実世界の超解像問題を扱う際に重要な成果物をもたらす。
この問題に対処するために、Squared Deformable Alignment Network (SDAN) を紹介します。
論文 参考訳(メタデータ) (2021-04-02T01:58:00Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - LM-Reloc: Levenberg-Marquardt Based Direct Visual Relocalization [54.77498358487812]
LM-Relocは、直接画像アライメントに基づく視覚的再ローカライズのための新しいアプローチである。
本稿では,LM-Net を学習するための古典的レバンス・マルカルトアルゴリズムにインスパイアされた損失定式化を提案する。
論文 参考訳(メタデータ) (2020-10-13T12:15:20Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。