論文の概要: Learning Local Implicit Fourier Representation for Image Warping
- arxiv url: http://arxiv.org/abs/2207.01831v1
- Date: Tue, 5 Jul 2022 06:30:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 02:07:41.637266
- Title: Learning Local Implicit Fourier Representation for Image Warping
- Title(参考訳): 画像ワープのための局所帰納的フーリエ表現の学習
- Authors: Jaewon Lee, Kwang Pyo Choi, Kyong Hwan Jin
- Abstract要約: 画像ワーピング(LTEW)のための局所的テクスチャ推定器を提案し,次に暗黙のニューラル表現を用いて画像を連続的な形状に変形する。
我々のLTEWベースのニューラル関数は、非対称スケールSRとホモグラフィ変換の既存のワープ手法よりも優れています。
- 参考スコア(独自算出の注目度): 11.526109213908091
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image warping aims to reshape images defined on rectangular grids into
arbitrary shapes. Recently, implicit neural functions have shown remarkable
performances in representing images in a continuous manner. However, a
standalone multi-layer perceptron suffers from learning high-frequency Fourier
coefficients. In this paper, we propose a local texture estimator for image
warping (LTEW) followed by an implicit neural representation to deform images
into continuous shapes. Local textures estimated from a deep super-resolution
(SR) backbone are multiplied by locally-varying Jacobian matrices of a
coordinate transformation to predict Fourier responses of a warped image. Our
LTEW-based neural function outperforms existing warping methods for
asymmetric-scale SR and homography transform. Furthermore, our algorithm well
generalizes arbitrary coordinate transformations, such as homography transform
with a large magnification factor and equirectangular projection (ERP)
perspective transform, which are not provided in training.
- Abstract(参考訳): image warpingは、矩形グリッド上で定義された画像を任意の形状に再構成することを目的としている。
近年,暗黙的神経機能は画像の連続的表現において顕著な性能を示している。
しかし、スタンドアロンの多層パーセプトロンは高周波フーリエ係数の学習に苦しむ。
本稿では,画像ワーピング(LTEW)のための局所テクスチャ推定器を提案し,次に暗黙のニューラル表現を用いて画像を連続的な形状に変形する。
深部超解像(SR)バックボーンから推定される局所テクスチャは、座標変換の局所変化ヤコビ行列によって乗算され、歪んだ画像のフーリエ応答を予測する。
ltewベースの神経機能は、非対称スケールsrおよびホモグラフィ変換の既存のワーピング法を上回っている。
さらに, このアルゴリズムは, 任意の座標変換をうまく一般化する。例えば, 大きな拡大係数を持つホモグラフィ変換や, トレーニングでは提供されない等角射影変換 (ERP) などである。
関連論文リスト
- Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - Entropy Transformer Networks: A Learning Approach via Tangent Bundle
Data Manifold [8.893886200299228]
本稿では,CNNアーキテクチャの設計における画像変換の高精度かつ高速なアプローチについて述べる。
データ多様体分布を補間する新しいエントロピーSTN(ESTN)を提案する。
挑戦的なベンチマークの実験は、提案されたESTNがコンピュータビジョンタスクの範囲で予測精度を向上させることを示している。
論文 参考訳(メタデータ) (2023-07-24T04:21:51Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - AbHE: All Attention-based Homography Estimation [0.0]
本研究では,局所的な特徴を持つ畳み込みニューラルネットワークとグローバルな特徴を持つトランスフォーマーモジュールを組み合わせた,Swin Transformerに基づく強力なベースラインモデルを提案する。
ホモグラフィ回帰段階では、相関ボリュームのチャネルに注意層を導入し、いくつかの弱い相関特徴点を排除できる。
実験の結果,8自由度(DOF)ホモグラフィーでは,我々の手法が最先端の手法をオーバーパフォーマンスすることがわかった。
論文 参考訳(メタデータ) (2022-12-06T15:00:00Z) - DynaST: Dynamic Sparse Transformer for Exemplar-Guided Image Generation [56.514462874501675]
本稿では,動的スパースアテンションに基づくトランスフォーマーモデルを提案する。
このアプローチの核心は、ある位置がフォーカスすべき最適なトークン数の変化をカバーすることに特化した、新しいダイナミックアテンションユニットです。
3つの応用、ポーズ誘導型人物画像生成、エッジベース顔合成、歪みのない画像スタイル転送の実験により、DynaSTは局所的な詳細において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2022-07-13T11:12:03Z) - A training-free recursive multiresolution framework for diffeomorphic
deformable image registration [6.929709872589039]
変形可能な画像登録のための新しい微分型学習自由アプローチを提案する。
提案するアーキテクチャは設計上は単純で,各解像度で移動像を順次ワープし,最終的に固定像に整列する。
システム全体はエンドツーエンドで、スクラッチから各2つのイメージに最適化されている。
論文 参考訳(メタデータ) (2022-02-01T15:17:17Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z) - MDReg-Net: Multi-resolution diffeomorphic image registration using fully
convolutional networks with deep self-supervision [2.0178765779788486]
完全畳み込みネットワーク(FCN)を用いて、登録する画像のペア間の空間変換を学習するための微分型画像登録アルゴリズムを提案する。
このネットワークは、固定された動画像と歪んだ動画像間の画像ワイド類似度メトリックを最大化することにより、一対の画像間の微分同相空間変換を推定するように訓練されている。
高分解能3次元構造脳磁気共鳴(MR)画像の登録実験の結果,本手法で訓練した画像登録ネットワークは,数秒で頑健で微分型画像登録結果が得られることが示された。
論文 参考訳(メタデータ) (2020-10-04T02:00:37Z) - Fast Symmetric Diffeomorphic Image Registration with Convolutional
Neural Networks [11.4219428942199]
本稿では,新しい非教師付き対称画像登録手法を提案する。
大規模脳画像データセットを用いた3次元画像登録法について検討した。
論文 参考訳(メタデータ) (2020-03-20T22:07:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。