Fugu-MT 論文翻訳(概要): Manifold Modeling in Quotient Space: Learning An Invariant Mapping with Decodability of Image Patches

論文の概要: Manifold Modeling in Quotient Space: Learning An Invariant Mapping with Decodability of Image Patches

arxiv url: http://arxiv.org/abs/2203.05134v1
Date: Thu, 10 Mar 2022 03:22:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-11 13:40:14.982604
Title: Manifold Modeling in Quotient Space: Learning An Invariant Mapping with Decodability of Image Patches
Title（参考訳）: 商空間における多様体モデリング:画像パッチの可算性を伴う不変写像の学習
Authors: Tatsuya Yokota and Hidekata Hontani
Abstract要約: 本研究では同値クラスの概念を用いた画像パッチの多様体学習フレームワークを提案する。我々は回転-フリップ-等価関係を導入し,新しい多様体に基づく画像モデルを作成する。さらに、提案した画像モデルを劣化した観察画像に適合させて画像再構成問題を定式化し、その解法を導出するアルゴリズムを導出する。
参考スコア（独自算出の注目度）: 7.99536002595393
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This study proposes a framework for manifold learning of image patches using the concept of equivalence classes: manifold modeling in quotient space (MMQS). In MMQS, we do not consider a set of local patches of the image as it is, but rather the set of their canonical patches obtained by introducing the concept of equivalence classes and performing manifold learning on their canonical patches. Canonical patches represent equivalence classes, and their auto-encoder constructs a manifold in the quotient space. Based on this framework, we produce a novel manifold-based image model by introducing rotation-flip-equivalence relations. In addition, we formulate an image reconstruction problem by fitting the proposed image model to a corrupted observed image and derive an algorithm to solve it. Our experiments show that the proposed image model is effective for various self-supervised image reconstruction tasks, such as image inpainting, deblurring, super-resolution, and denoising.
Abstract（参考訳）: 本研究は,同値クラスの概念を用いた画像パッチの多様体学習のための枠組みである商空間における多様体モデリング(mmqs)を提案する。 MMQSでは、画像の局所的なパッチの集合をそのまま考えるのではなく、同値クラスの概念を導入し、それらの正準パッチ上で多様体学習を行うことによって得られる正準パッチの集合を考える。正準パッチは同値類を表し、その自己エンコーダは商空間において多様体を構成する。この枠組みに基づき、回転フリップ等価関係を導入し、新しい多様体に基づく画像モデルを作成する。また,提案する画像モデルを劣化した観測画像に適合させて画像再構成問題を定式化し,アルゴリズムを導出して解決する。提案手法は,画像インパインティング,デブラリング,スーパーレゾリューション,デノジングなど,様々な自己教師あり画像再構成タスクに有効であることを示す。

関連論文リスト

GloTok: Global Perspective Tokenizer for Image Reconstruction and Generation [51.95701097588426]
トークン化された特徴のより均一な意味分布をモデル化するために,Global Perspective Tokenizer(GloTok)を導入する。量子化による再構成誤差を最小限に抑えるために, 微細な細部を復元するために, 残差学習モジュールを提案する。標準のImageNet-1kベンチマーク実験により,提案手法が最先端の復元性能と生成品質を実現することを確認した。
論文参考訳（メタデータ） (2025-11-18T06:40:26Z)
Equivariant Denoisers for Image Restoration [8.865896660863681]
等変復号器と最適化に基づいて,等変正規化(ERED)と呼ばれる統一フレームワークを提案する。本稿では,このアルゴリズムの収束性を分析し,その実用性について論じる。
論文参考訳（メタデータ） (2024-12-06T10:22:00Z)
Oscillation Inversion: Understand the structure of Large Flow Model through the Lens of Inversion Method [60.88467353578118]
実世界のイメージを逆転させる固定点インスパイアされた反復的アプローチは収束を達成せず、異なるクラスタ間で振動することを示す。本稿では,画像強調,ストロークベースのリカラー化,および視覚的プロンプト誘導画像編集を容易にする,シンプルで高速な分布転送手法を提案する。
論文参考訳（メタデータ） (2024-11-17T17:45:37Z)
Iteratively Refined Image Reconstruction with Learned Attentive Regularizers [14.93489065234423]
本稿では,ディープラーニングの力を活用した画像再構成のための正規化手法を提案する。これは一連の凸問題の最小化に対応するためである。解釈可能性、理論的保証、信頼性、パフォーマンスの両立を約束するバランスを提供します。
論文参考訳（メタデータ） (2024-07-09T07:22:48Z)
Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [50.62725807357586]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文参考訳（メタデータ） (2024-01-04T08:46:39Z)
ARNIQA: Learning Distortion Manifold for Image Quality Assessment [28.773037051085318]
No-Reference Image Quality Assessment (NR-IQA) は、高品質な参照画像を必要としない、人間の知覚に合わせて画像品質を測定する手法を開発することを目的としている。本研究では、画像歪み多様体をモデル化し、本質的な表現を得るための自己教師型アプローチ ARNIQA を提案する。
論文参考訳（メタデータ） (2023-10-20T17:22:25Z)
Not All Image Regions Matter: Masked Vector Quantization for Autoregressive Image Generation [78.13793505707952]
既存の自己回帰モデルは、まず画像再構成のための潜伏空間のコードブックを学習し、学習したコードブックに基づいて自己回帰的に画像生成を完了する2段階生成パラダイムに従っている。そこで本研究では,Masked Quantization VAE (MQ-VAE) Stackモデルを用いた2段階フレームワークを提案する。
論文参考訳（メタデータ） (2023-05-23T02:15:53Z)
FewGAN: Generating from the Joint Distribution of a Few Images [95.6635227371479]
本稿では,新しい,高品質で多様な画像を生成するための生成モデルFewGANを紹介する。 FewGANは、第1の粗いスケールで量子化を適用した階層的なパッチGANであり、その後、より微細なスケールで残った完全畳み込みGANのピラミッドが続く。大規模な実験では、FewGANは定量的にも定性的にも基線より優れていることが示されている。
論文参考訳（メタデータ） (2022-07-18T07:11:28Z)
A Hierarchical Transformation-Discriminating Generative Model for Few Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文参考訳（メタデータ） (2021-04-29T17:49:48Z)
Self-Calibration Supported Robust Projective Structure-from-Motion [80.15392629310507]
本稿では,自己校正制約によってマッチングプロセスが支持される統合されたStructure-from-Motion (SfM)法を提案する。これらの制約を利用して,ロバストなマルチビューマッチングと正確なカメラキャリブレーションを示す実験結果を示す。
論文参考訳（メタデータ） (2020-07-04T08:47:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。