論文の概要: Manifold Modeling in Quotient Space: Learning An Invariant Mapping with
Decodability of Image Patches
- arxiv url: http://arxiv.org/abs/2203.05134v1
- Date: Thu, 10 Mar 2022 03:22:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 13:40:14.982604
- Title: Manifold Modeling in Quotient Space: Learning An Invariant Mapping with
Decodability of Image Patches
- Title(参考訳): 商空間における多様体モデリング:画像パッチの可算性を伴う不変写像の学習
- Authors: Tatsuya Yokota and Hidekata Hontani
- Abstract要約: 本研究では同値クラスの概念を用いた画像パッチの多様体学習フレームワークを提案する。
我々は回転-フリップ-等価関係を導入し,新しい多様体に基づく画像モデルを作成する。
さらに、提案した画像モデルを劣化した観察画像に適合させて画像再構成問題を定式化し、その解法を導出するアルゴリズムを導出する。
- 参考スコア(独自算出の注目度): 7.99536002595393
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study proposes a framework for manifold learning of image patches using
the concept of equivalence classes: manifold modeling in quotient space (MMQS).
In MMQS, we do not consider a set of local patches of the image as it is, but
rather the set of their canonical patches obtained by introducing the concept
of equivalence classes and performing manifold learning on their canonical
patches. Canonical patches represent equivalence classes, and their
auto-encoder constructs a manifold in the quotient space. Based on this
framework, we produce a novel manifold-based image model by introducing
rotation-flip-equivalence relations. In addition, we formulate an image
reconstruction problem by fitting the proposed image model to a corrupted
observed image and derive an algorithm to solve it. Our experiments show that
the proposed image model is effective for various self-supervised image
reconstruction tasks, such as image inpainting, deblurring, super-resolution,
and denoising.
- Abstract(参考訳): 本研究は,同値クラスの概念を用いた画像パッチの多様体学習のための枠組みである商空間における多様体モデリング(mmqs)を提案する。
MMQSでは、画像の局所的なパッチの集合をそのまま考えるのではなく、同値クラスの概念を導入し、それらの正準パッチ上で多様体学習を行うことによって得られる正準パッチの集合を考える。
正準パッチは同値類を表し、その自己エンコーダは商空間において多様体を構成する。
この枠組みに基づき、回転フリップ等価関係を導入し、新しい多様体に基づく画像モデルを作成する。
また,提案する画像モデルを劣化した観測画像に適合させて画像再構成問題を定式化し,アルゴリズムを導出して解決する。
提案手法は,画像インパインティング,デブラリング,スーパーレゾリューション,デノジングなど,様々な自己教師あり画像再構成タスクに有効であることを示す。
関連論文リスト
- Generalized Relevance Learning Grassmann Quantization [0.0]
イメージ集合をモデル化する一般的な方法は部分空間であり、グラスマン多様体と呼ばれる多様体を形成する。
一般化関連学習ベクトル量子化の応用を拡張して、グラスマン多様体を扱う。
本稿では,手書き文字認識,顔認識,アクティビティ認識,オブジェクト認識など,いくつかのタスクに適用する。
論文 参考訳(メタデータ) (2024-03-14T08:53:01Z) - Bayesian Intrinsic Groupwise Image Registration: Unsupervised
Disentanglement of Anatomy and Geometry [53.645443644821306]
本稿では,医用画像の集団登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から得られた4つのデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - ARNIQA: Learning Distortion Manifold for Image Quality Assessment [28.773037051085318]
No-Reference Image Quality Assessment (NR-IQA) は、高品質な参照画像を必要としない、人間の知覚に合わせて画像品質を測定する手法を開発することを目的としている。
本研究では、画像歪み多様体をモデル化し、本質的な表現を得るための自己教師型アプローチ ARNIQA を提案する。
論文 参考訳(メタデータ) (2023-10-20T17:22:25Z) - Not All Image Regions Matter: Masked Vector Quantization for
Autoregressive Image Generation [78.13793505707952]
既存の自己回帰モデルは、まず画像再構成のための潜伏空間のコードブックを学習し、学習したコードブックに基づいて自己回帰的に画像生成を完了する2段階生成パラダイムに従っている。
そこで本研究では,Masked Quantization VAE (MQ-VAE) Stackモデルを用いた2段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-23T02:15:53Z) - FewGAN: Generating from the Joint Distribution of a Few Images [95.6635227371479]
本稿では,新しい,高品質で多様な画像を生成するための生成モデルFewGANを紹介する。
FewGANは、第1の粗いスケールで量子化を適用した階層的なパッチGANであり、その後、より微細なスケールで残った完全畳み込みGANのピラミッドが続く。
大規模な実験では、FewGANは定量的にも定性的にも基線より優れていることが示されている。
論文 参考訳(メタデータ) (2022-07-18T07:11:28Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Interpretable Image Clustering via Diffeomorphism-Aware K-Means [20.747301413801843]
一般の変形のクラスを含む画像とセントロイドの類似性の尺度:微分同相性(diffeomorphisms)を開発する。
提案手法は, 各種データセットの最先端手法と競合することを示す。
論文 参考訳(メタデータ) (2020-12-16T16:11:39Z) - Deep Variational Network Toward Blind Image Restoration [55.33102369856991]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Self-Calibration Supported Robust Projective Structure-from-Motion [80.15392629310507]
本稿では,自己校正制約によってマッチングプロセスが支持される統合されたStructure-from-Motion (SfM)法を提案する。
これらの制約を利用して,ロバストなマルチビューマッチングと正確なカメラキャリブレーションを示す実験結果を示す。
論文 参考訳(メタデータ) (2020-07-04T08:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。