論文の概要: PRISE: Demystifying Deep Lucas-Kanade with Strongly Star-Convex
Constraints for Multimodel Image Alignment
- arxiv url: http://arxiv.org/abs/2303.11526v1
- Date: Tue, 21 Mar 2023 01:19:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 16:56:43.390610
- Title: PRISE: Demystifying Deep Lucas-Kanade with Strongly Star-Convex
Constraints for Multimodel Image Alignment
- Title(参考訳): PRISE:マルチモデル画像アライメントのための強い星凸制約付きディープルーカスカネード
- Authors: Yiqing Zhang, Xinming Huang, Ziming Zhang
- Abstract要約: ルーカス・カナーデ法(英語版)(LK)は、画像の古典的反復的ホモグラフィー推定アルゴリズムであるが、画像対に歪みがある場合、特に局所的最適性に悩まされることが多い。
本稿では、画像最適化のための新しいDeep Star-Convexified Lucas-Kanade(RISE)法を提案する。
- 参考スコア(独自算出の注目度): 18.30521162275051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Lucas-Kanade (LK) method is a classic iterative homography estimation
algorithm for image alignment, but often suffers from poor local optimality
especially when image pairs have large distortions. To address this challenge,
in this paper we propose a novel Deep Star-Convexified Lucas-Kanade (PRISE)
method for multimodel image alignment by introducing strongly star-convex
constraints into the optimization problem. Our basic idea is to enforce the
neural network to approximately learn a star-convex loss landscape around the
ground truth give any data to facilitate the convergence of the LK method to
the ground truth through the high dimensional space defined by the network.
This leads to a minimax learning problem, with contrastive (hinge) losses due
to the definition of strong star-convexity that are appended to the original
loss for training. We also provide an efficient sampling based algorithm to
leverage the training cost, as well as some analysis on the quality of the
solutions from PRISE. We further evaluate our approach on benchmark datasets
such as MSCOCO, GoogleEarth, and GoogleMap, and demonstrate state-of-the-art
results, especially for small pixel errors. Code can be downloaded from
https://github.com/Zhang-VISLab.
- Abstract(参考訳): ルーカス・カナード法(lucas-kanade (lk) method)は、画像アライメントのための古典的な反復ホモグラフィ推定アルゴリズムであるが、特に画像ペアが大きな歪みを持つ場合、局所的最適性に乏しい。
この課題に対処するために、最適化問題に強い星凸制約を導入し、多モデル画像アライメントのための新しいDeep Star-Convexified Lucas-Kanade (PRISE)法を提案する。
我々の基本的な考え方は、ニューラルネットワークに、LK法の基底真実への収束を促進するために、ニューラルネットワークによって定義された高次元空間を通じて、地上真実の周囲の星-凸損失景観を概ね学習させることである。
このことがミニマックス学習問題につながり、訓練のための元の損失に追加される強い恒星凸性の定義による対照的な(ヒンジ)損失が生じる。
また、トレーニングコストを活用するための効率的なサンプリングベースアルゴリズムや、PRISEのソリューションの品質分析も提供する。
MSCOCO、GoogleEarth、GoogleMapといったベンチマークデータセットに対するアプローチをさらに評価し、特に小さなピクセルエラーに対して最先端の結果を示す。
コードはhttps://github.com/Zhang-VISLabからダウンロードできる。
関連論文リスト
- Deep Loss Convexification for Learning Iterative Models [11.36644967267829]
点雲登録のための反復的最近点(ICP)のような反復的手法は、しばしば悪い局所最適性に悩まされる。
我々は,各地真実の周囲に凸景観を形成する学習を提案する。
論文 参考訳(メタデータ) (2024-11-16T01:13:04Z) - Blind Image Deblurring with FFT-ReLU Sparsity Prior [1.179778723980276]
ブラインドイメージデブロアリング(Blind image deblurring)は、ぼやけたカーネルに関する事前知識のないぼやけたイメージからシャープなイメージを復元するプロセスである。
画像の種類を多岐にわたって効果的に劣化させるために,ぼやけたカーネルを対象とする先行処理を利用する手法を提案する。
論文 参考訳(メタデータ) (2024-06-12T15:51:39Z) - GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - Learning from small data sets: Patch-based regularizers in inverse
problems for image reconstruction [1.1650821883155187]
機械学習の最近の進歩は、ネットワークを訓練するために大量のデータとコンピュータ能力を必要とする。
本稿は,ごく少数の画像のパッチを考慮に入れることで,小さなデータセットから学習する問題に対処する。
本稿では,Langevin Monte Carlo法を用いて後部を近似することにより,不確実な定量化を実現する方法を示す。
論文 参考訳(メタデータ) (2023-12-27T15:30:05Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - SDAN: Squared Deformable Alignment Network for Learning Misaligned
Optical Zoom [5.202871995038932]
ディープニューラルネットワーク(DNN)に基づく超解像アルゴリズムは、生成した画像の品質を大幅に改善した。
これらのアルゴリズムはしばしば、現実世界の超解像問題を扱う際に重要な成果物をもたらす。
この問題に対処するために、Squared Deformable Alignment Network (SDAN) を紹介します。
論文 参考訳(メタデータ) (2021-04-02T01:58:00Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - LM-Reloc: Levenberg-Marquardt Based Direct Visual Relocalization [54.77498358487812]
LM-Relocは、直接画像アライメントに基づく視覚的再ローカライズのための新しいアプローチである。
本稿では,LM-Net を学習するための古典的レバンス・マルカルトアルゴリズムにインスパイアされた損失定式化を提案する。
論文 参考訳(メタデータ) (2020-10-13T12:15:20Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。