論文の概要: On the Hidden Waves of Image
- arxiv url: http://arxiv.org/abs/2310.12976v1
- Date: Thu, 19 Oct 2023 17:59:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 13:33:55.605324
- Title: On the Hidden Waves of Image
- Title(参考訳): 隠れた画像の波について
- Authors: Yinpeng Chen and Dongdong Chen and Xiyang Dai and Mengchen Liu and Lu
Yuan and Zicheng Liu and Youzuo Lin
- Abstract要約: 隠れて学習可能な速度を持つ一方向波動方程式の集合を用いて画像の再構成に成功した興味深い現象を紹介する。
個々の画像は、視覚エンコーダを使用して元の画像から計算できるユニークな初期条件の解に対応する。
- 参考スコア(独自算出の注目度): 104.05734286732941
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce an intriguing phenomenon-the successful
reconstruction of images using a set of one-way wave equations with hidden and
learnable speeds. Each individual image corresponds to a solution with a unique
initial condition, which can be computed from the original image using a visual
encoder (e.g., a convolutional neural network). Furthermore, the solution for
each image exhibits two noteworthy mathematical properties: (a) it can be
decomposed into a collection of special solutions of the same one-way wave
equations that are first-order autoregressive, with shared coefficient matrices
for autoregression, and (b) the product of these coefficient matrices forms a
diagonal matrix with the speeds of the wave equations as its diagonal elements.
We term this phenomenon hidden waves, as it reveals that, although the speeds
of the set of wave equations and autoregressive coefficient matrices are
latent, they are both learnable and shared across images. This represents a
mathematical invariance across images, providing a new mathematical perspective
to understand images.
- Abstract(参考訳): 本稿では,隠れて学習可能な速度を持つ一方向波動方程式の集合を用いて,画像の再構成に成功した興味深い現象を紹介する。
個々の画像は、視覚エンコーダ(畳み込みニューラルネットワークなど)を使用して元の画像から計算できるユニークな初期条件の解に対応する。
さらに、各画像に対する解には注目すべき数学的性質が2つある。
(a) 1次自己回帰型である同じ一方向波動方程式の特別な解の集合に分解することができ、自己回帰のための共役係数行列を持つ。
(b)これらの係数行列の積は、波動方程式の速度を対角元とする対角行列を形成する。
この現象を隠れた波と呼び、波動方程式と自己回帰係数行列の集合の速度は潜んでいるが、どちらも学習可能であり、画像間で共有できることを示した。
これは画像間の数学的不変性を表し、画像を理解するための新しい数学的視点を提供する。
関連論文リスト
- Wavelets Are All You Need for Autoregressive Image Generation [1.187456026346823]
本稿では,2つの主成分をベースとした自己回帰画像生成手法を提案する。
1つ目はウェーブレット画像符号化で、画像の視覚的詳細を粗いものから細部までトークン化することができる。
2つ目は、アーキテクチャが再設計され、トークンシーケンスに最適化された言語トランスフォーマーの変種である。
論文 参考訳(メタデータ) (2024-06-28T15:32:59Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Improving Denoising Diffusion Models via Simultaneous Estimation of
Image and Noise [15.702941058218196]
本稿では,逆拡散過程によって生成される画像の速度と品質の向上を目的とした2つの重要なコントリビューションを紹介する。
最初のコントリビューションは、画像と雑音の間の四分円弧上の角度で拡散過程を再パラメータ化することである。
2つ目のコントリビューションは、私たちのネットワークを使ってイメージ(mathbfx_0$)とノイズ(mathbfepsilon$)を直接見積もることです。
論文 参考訳(メタデータ) (2023-10-26T05:43:07Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z) - Alternating Phase Langevin Sampling with Implicit Denoiser Priors for
Phase Retrieval [1.7767466724342065]
本稿では,従来のフレームワークに組み込んだ位相探索問題の解法を提案する。
位相探索のための性能記述に基づくアルゴリズムと比較し、分布内画像と分布外画像の顕著な測定結果と競合する性能を示す。
論文 参考訳(メタデータ) (2022-11-02T05:08:50Z) - Regularization via deep generative models: an analysis point of view [8.818465117061205]
本稿では, イメージングにおける逆問題(例えば, デブロアリングやインペインティング)を, 深部生成ニューラルネットワークを用いて正則化する新しい手法を提案する。
多くの場合、我々の技術はパフォーマンスの明確な改善を実現し、より堅牢であるように思える。
論文 参考訳(メタデータ) (2021-01-21T15:04:57Z) - Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。
私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。
私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文 参考訳(メタデータ) (2020-12-05T10:02:03Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - End-to-end Interpretable Learning of Non-blind Image Deblurring [102.75982704671029]
非ブラインド画像のデブロワーリングは、通常、対応するシャープ画像の勾配に関する自然の先行によって正規化される線形最小二乗問題として定式化される。
本稿では,(既知の)ぼかしと自然像前のカーネルの逆フィルタを用いて,リチャードソン解法を事前条件として提案する。
論文 参考訳(メタデータ) (2020-07-03T15:45:01Z) - Class-Specific Blind Deconvolutional Phase Retrieval Under a Generative
Prior [8.712404218757733]
この問題はフーリエ・プチコグラフィー、X線結晶学、可視光通信など様々な画像モダリティで発生する。
本稿では,事前訓練された2つの深層生成ネットワークの下での交互勾配降下アルゴリズムを用いて,この逆問題の解法を提案する。
提案アルゴリズムは,前向き測定モデルを説明する各前駆体の範囲内で,シャープな画像とぼやけたカーネルを見つけ出そうとする。
論文 参考訳(メタデータ) (2020-02-28T07:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。