論文の概要: Joint Estimation of Image Representations and their Lie Invariants
- arxiv url: http://arxiv.org/abs/2012.02903v2
- Date: Tue, 8 Dec 2020 13:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-22 12:08:02.786681
- Title: Joint Estimation of Image Representations and their Lie Invariants
- Title(参考訳): 画像表現とリー不変量の合同推定
- Authors: Christine Allen-Blanchette and Kostas Daniilidis
- Abstract要約: 画像は世界の状態とコンテンツの両方をエンコードする。
この情報の自動抽出は、画像表現に固有の高次元かつ絡み合った符号化のために困難である。
本稿では,これらの課題の解決を目的とした2つの理論的アプローチを紹介する。
- 参考スコア(独自算出の注目度): 57.3768308075675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Images encode both the state of the world and its content. The former is
useful for tasks such as planning and control, and the latter for
classification. The automatic extraction of this information is challenging
because of the high-dimensionality and entangled encoding inherent to the image
representation. This article introduces two theoretical approaches aimed at the
resolution of these challenges. The approaches allow for the interpolation and
extrapolation of images from an image sequence by joint estimation of the image
representation and the generators of the sequence dynamics. In the first
approach, the image representations are learned using probabilistic PCA
\cite{tipping1999probabilistic}. The linear-Gaussian conditional distributions
allow for a closed form analytical description of the latent distributions but
assumes the underlying image manifold is a linear subspace. In the second
approach, the image representations are learned using probabilistic nonlinear
PCA which relieves the linear manifold assumption at the cost of requiring a
variational approximation of the latent distributions. In both approaches, the
underlying dynamics of the image sequence are modelled explicitly to
disentangle them from the image representations. The dynamics themselves are
modelled with Lie group structure which enforces the desirable properties of
smoothness and composability of inter-image transformations.
- Abstract(参考訳): 画像は世界の状態とその内容の両方を符号化する。
前者は計画や管理といったタスクに、後者は分類に役立ちます。
この情報の自動抽出は、画像表現に固有の高次元と絡み合いエンコーディングのため困難である。
本稿では,これらの課題を解決するための2つの理論的アプローチを紹介する。
このアプローチにより、画像表現とシーケンスダイナミックスのジェネレータとの結合推定により、画像シーケンスからの画像の補間と外挿が可能となる。
最初のアプローチでは、画像表現は確率的PCA \cite{tipping 1999probabilistic} を用いて学習される。
線型ガウス条件分布は、潜在分布の閉形式解析的記述を可能にするが、基礎となる像多様体が線型部分空間であると仮定する。
第2のアプローチでは、画像表現を確率論的非線形PCAを用いて学習し、線形多様体仮定を遅延分布の変動近似を必要とするコストで緩和する。
どちらの手法も、画像列の基盤となるダイナミクスを明示的にモデル化して画像表現から切り離す。
ダイナミクス自体は、画像間の変換の滑らかさと構成可能性の望ましい性質を強制するリー群構造によってモデル化される。
関連論文リスト
- A nonlinear elasticity model in computer vision [0.0]
本研究の目的は,2つの画像を比較するために著者らが以前に導入した非線形弾性モデルを分析することである。
変換の存在は、勾配ベクトル値の強度写像の$値対の微分の中で証明される。
問題は、線形写像によって関連づけられた画像に対して、一意性が与えられるかどうかである。
論文 参考訳(メタデータ) (2024-08-30T12:27:22Z) - Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [50.62725807357586]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - Image Inpainting via Tractable Steering of Diffusion Models [54.13818673257381]
本稿では,トラクタブル確率モデル(TPM)の制約後部を正確に,かつ効率的に計算する能力を活用することを提案する。
具体的には、確率回路(PC)と呼ばれる表現型TPMのクラスを採用する。
提案手法は, 画像の全体的な品質とセマンティックコヒーレンスを, 計算オーバーヘッドを10%加えるだけで一貫的に改善できることを示す。
論文 参考訳(メタデータ) (2023-11-28T21:14:02Z) - Real-World Image Variation by Aligning Diffusion Inversion Chain [53.772004619296794]
生成した画像と実世界の画像の間にはドメインギャップがあり、これは実世界の画像の高品質なバリエーションを生成する上での課題である。
実世界画像のアライメントによる変化(RIVAL)と呼ばれる新しい推論パイプラインを提案する。
我々のパイプラインは、画像生成プロセスとソース画像の反転チェーンを整列させることにより、画像の変動の生成品質を向上させる。
論文 参考訳(メタデータ) (2023-05-30T04:09:47Z) - Object-Centric Relational Representations for Image Generation [18.069747511100132]
本稿では,オブジェクト中心のリレーショナル表現に基づく条件画像生成手法を提案する。
このようなアーキテクチャバイアスには,生成過程の操作と条件付けを容易にする特性が伴うことを示す。
また,関係表現と組み合わせた画像の合成データセットからなる画像生成のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2023-03-26T11:17:17Z) - Tensor Component Analysis for Interpreting the Latent Space of GANs [41.020230946351816]
本稿では,GANの潜在空間における解釈可能な方向を求める問題に対処する。
提案手法では,テンソルの個々のモードに対応する線形編集と,それらの間の乗法的相互作用をモデル化する非線形編集が可能である。
実験により, 前者は幾何に基づく変換から, 後者は拡張可能な変換を生成できることを示す。
論文 参考訳(メタデータ) (2021-11-23T09:14:39Z) - NeurInt : Learning to Interpolate through Neural ODEs [18.104328632453676]
本稿では,2つの画像間の軌跡分布を学習する新しい生成モデルを提案する。
提案手法の有効性を示すとともに,画像の品質向上と,実画像と対象画像の任意のペアに対して,スムーズな軌道上の多様な分布を学習する能力を示す。
論文 参考訳(メタデータ) (2021-11-07T16:31:18Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - A Generalized Asymmetric Dual-front Model for Active Contours and Image
Segmentation [16.651587651843055]
ボロノイ図に基づくデュアルフロントアクティブな輪郭モデルは、画像分割と領域分割の問題に対処するための強力で効率的な方法として知られている。
本稿では,非対称な2次計量双対前モデルを提案する。
提案したデュアルフロントモデルは,各領域をベースとした同質性の項を伴って画像分割に応用できる。
論文 参考訳(メタデータ) (2020-06-14T08:24:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。