Fugu-MT 論文翻訳(概要): Learning Local Implicit Fourier Representation for Image Warping

論文の概要: Learning Local Implicit Fourier Representation for Image Warping

arxiv url: http://arxiv.org/abs/2207.01831v1
Date: Tue, 5 Jul 2022 06:30:17 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-07 02:07:41.637266
Title: Learning Local Implicit Fourier Representation for Image Warping
Title（参考訳）: 画像ワープのための局所帰納的フーリエ表現の学習
Authors: Jaewon Lee, Kwang Pyo Choi, Kyong Hwan Jin
Abstract要約: 画像ワーピング(LTEW)のための局所的テクスチャ推定器を提案し,次に暗黙のニューラル表現を用いて画像を連続的な形状に変形する。我々のLTEWベースのニューラル関数は、非対称スケールSRとホモグラフィ変換の既存のワープ手法よりも優れています。
参考スコア（独自算出の注目度）: 11.526109213908091
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Image warping aims to reshape images defined on rectangular grids into arbitrary shapes. Recently, implicit neural functions have shown remarkable performances in representing images in a continuous manner. However, a standalone multi-layer perceptron suffers from learning high-frequency Fourier coefficients. In this paper, we propose a local texture estimator for image warping (LTEW) followed by an implicit neural representation to deform images into continuous shapes. Local textures estimated from a deep super-resolution (SR) backbone are multiplied by locally-varying Jacobian matrices of a coordinate transformation to predict Fourier responses of a warped image. Our LTEW-based neural function outperforms existing warping methods for asymmetric-scale SR and homography transform. Furthermore, our algorithm well generalizes arbitrary coordinate transformations, such as homography transform with a large magnification factor and equirectangular projection (ERP) perspective transform, which are not provided in training.
Abstract（参考訳）: image warpingは、矩形グリッド上で定義された画像を任意の形状に再構成することを目的としている。近年,暗黙的神経機能は画像の連続的表現において顕著な性能を示している。しかし、スタンドアロンの多層パーセプトロンは高周波フーリエ係数の学習に苦しむ。本稿では,画像ワーピング(LTEW)のための局所テクスチャ推定器を提案し,次に暗黙のニューラル表現を用いて画像を連続的な形状に変形する。深部超解像(SR)バックボーンから推定される局所テクスチャは、座標変換の局所変化ヤコビ行列によって乗算され、歪んだ画像のフーリエ応答を予測する。 ltewベースの神経機能は、非対称スケールsrおよびホモグラフィ変換の既存のワーピング法を上回っている。さらに, このアルゴリズムは, 任意の座標変換をうまく一般化する。例えば, 大きな拡大係数を持つホモグラフィ変換や, トレーニングでは提供されない等角射影変換 (ERP) などである。

関連論文リスト

Unwarping Screen Content Images via Structure-texture Enhancement Network and Transformation Self-estimation [2.404130767806698]
画面コンテンツ画像(SCI)に対する変換自己推定を用いた構造テクスチャ拡張ネットワーク(STEN)を提案する。 STENはB-スプラインの暗黙的ニューラル表現モジュールと変換誤差推定と自己補正アルゴリズムを統合している。パブリックなSCIデータセットの実験は、我々のアプローチが最先端の手法を大きく上回っていることを示している。
論文参考訳（メタデータ） (2025-04-21T13:59:44Z)
Exploring Kernel Transformations for Implicit Neural Representations [57.2225355625268]
入射神経表現(INR)は、ニューラルネットワークを利用して、対応する属性に座標をマッピングすることで、信号を表現する。この研究は、モデル自体を変更せずに入出力のカーネル変換の効果を探求する先駆者となった。我々の発見の副産物は、スケールとシフトを組み合わせて、INRを無視できないオーバーヘッドで著しく向上させる、単純で効果的な方法である。
論文参考訳（メタデータ） (2025-04-07T04:43:50Z)
Variable-size Symmetry-based Graph Fourier Transforms for image compression [65.7352685872625]
可変サイズのグラフフーリエ変換を符号化フレームワークに導入する。提案アルゴリズムは,ノード間の特定の対称接続を追加することにより,グリッド上の対称グラフを生成する。実験により、SBGFTは、明示的な多重変換選択に統合された一次変換よりも優れていることが示された。
論文参考訳（メタデータ） (2024-11-24T13:00:44Z)
Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文参考訳（メタデータ） (2023-12-24T08:42:37Z)
Entropy Transformer Networks: A Learning Approach via Tangent Bundle Data Manifold [8.893886200299228]
本稿では,CNNアーキテクチャの設計における画像変換の高精度かつ高速なアプローチについて述べる。データ多様体分布を補間する新しいエントロピーSTN(ESTN)を提案する。挑戦的なベンチマークの実験は、提案されたESTNがコンピュータビジョンタスクの範囲で予測精度を向上させることを示している。
論文参考訳（メタデータ） (2023-07-24T04:21:51Z)
RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文参考訳（メタデータ） (2023-01-04T15:12:57Z)
AbHE: All Attention-based Homography Estimation [0.0]
本研究では,局所的な特徴を持つ畳み込みニューラルネットワークとグローバルな特徴を持つトランスフォーマーモジュールを組み合わせた,Swin Transformerに基づく強力なベースラインモデルを提案する。ホモグラフィ回帰段階では、相関ボリュームのチャネルに注意層を導入し、いくつかの弱い相関特徴点を排除できる。実験の結果,8自由度(DOF)ホモグラフィーでは,我々の手法が最先端の手法をオーバーパフォーマンスすることがわかった。
論文参考訳（メタデータ） (2022-12-06T15:00:00Z)
DynaST: Dynamic Sparse Transformer for Exemplar-Guided Image Generation [56.514462874501675]
本稿では,動的スパースアテンションに基づくトランスフォーマーモデルを提案する。このアプローチの核心は、ある位置がフォーカスすべき最適なトークン数の変化をカバーすることに特化した、新しいダイナミックアテンションユニットです。 3つの応用、ポーズ誘導型人物画像生成、エッジベース顔合成、歪みのない画像スタイル転送の実験により、DynaSTは局所的な詳細において優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2022-07-13T11:12:03Z)
A training-free recursive multiresolution framework for diffeomorphic deformable image registration [6.929709872589039]
変形可能な画像登録のための新しい微分型学習自由アプローチを提案する。提案するアーキテクチャは設計上は単純で,各解像度で移動像を順次ワープし,最終的に固定像に整列する。システム全体はエンドツーエンドで、スクラッチから各2つのイメージに最適化されている。
論文参考訳（メタデータ） (2022-02-01T15:17:17Z)
CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文参考訳（メタデータ） (2021-12-31T04:37:11Z)
Invariant Deep Compressible Covariance Pooling for Aerial Scene Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文参考訳（メタデータ） (2020-11-11T11:13:07Z)
MDReg-Net: Multi-resolution diffeomorphic image registration using fully convolutional networks with deep self-supervision [2.0178765779788486]
完全畳み込みネットワーク(FCN)を用いて、登録する画像のペア間の空間変換を学習するための微分型画像登録アルゴリズムを提案する。このネットワークは、固定された動画像と歪んだ動画像間の画像ワイド類似度メトリックを最大化することにより、一対の画像間の微分同相空間変換を推定するように訓練されている。高分解能3次元構造脳磁気共鳴(MR)画像の登録実験の結果,本手法で訓練した画像登録ネットワークは,数秒で頑健で微分型画像登録結果が得られることが示された。
論文参考訳（メタデータ） (2020-10-04T02:00:37Z)
Fast Symmetric Diffeomorphic Image Registration with Convolutional Neural Networks [11.4219428942199]
本稿では,新しい非教師付き対称画像登録手法を提案する。大規模脳画像データセットを用いた3次元画像登録法について検討した。
論文参考訳（メタデータ） (2020-03-20T22:07:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。