論文の概要: Trajectory-aware Principal Manifold Framework for Data Augmentation and
Image Generation
- arxiv url: http://arxiv.org/abs/2310.07801v1
- Date: Sun, 30 Jul 2023 07:31:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 02:59:45.382512
- Title: Trajectory-aware Principal Manifold Framework for Data Augmentation and
Image Generation
- Title(参考訳): データ拡張と画像生成のための軌道対応主多様体フレームワーク
- Authors: Elvis Han Cui, Bingbin Li, Yanan Li, Weng Kee Wong, Donghui Wang
- Abstract要約: 多くの既存の手法は、ガウス分布のようなパラメトリック分布から新しいサンプルを生成するが、入力空間と特徴空間の両方でデータ多様体に沿ってサンプルを生成することにはほとんど注意を払わない。
そこで,本論文では,多様体のバックボーンを復元し,特定の軌跡に沿ってサンプルを生成するために,新規なトラジェクトリ対応主多様体フレームワークを提案する。
本研究では, よりコンパクトな多様体表現を抽出し, 分類精度を向上し, サンプル間のスムーズな変換を生成できることを示す。
- 参考スコア(独自算出の注目度): 5.31812036803692
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data augmentation for deep learning benefits model training, image
transformation, medical imaging analysis and many other fields. Many existing
methods generate new samples from a parametric distribution, like the Gaussian,
with little attention to generate samples along the data manifold in either the
input or feature space. In this paper, we verify that there are theoretical and
practical advantages of using the principal manifold hidden in the feature
space than the Gaussian distribution. We then propose a novel trajectory-aware
principal manifold framework to restore the manifold backbone and generate
samples along a specific trajectory. On top of the autoencoder architecture, we
further introduce an intrinsic dimension regularization term to make the
manifold more compact and enable few-shot image generation. Experimental
results show that the novel framework is able to extract more compact manifold
representation, improve classification accuracy and generate smooth
transformation among few samples.
- Abstract(参考訳): 深層学習のためのデータ拡張は、モデルトレーニング、画像変換、医療画像解析など多くの分野で有用である。
多くの既存の手法は、ガウス分布のようなパラメトリック分布から新しいサンプルを生成し、入力空間または特徴空間においてデータ多様体に沿ってサンプルを生成するのはほとんど注意を払わない。
本稿では,ガウス分布よりも特徴空間に隠れた主多様体を用いた場合の理論的・実用的利点について検証する。
次に,多様体のバックボーンを復元し,特定の軌道に沿ってサンプルを生成するための,新しい軌道認識主多様体フレームワークを提案する。
オートエンコーダアーキテクチャの上に、多様体をよりコンパクトにし、少数ショット画像生成を可能にする固有次元正規化項を導入する。
実験結果から,本フレームワークはよりコンパクトな多様体表現を抽出し,分類精度を向上し,サンプル間のスムーズな変換を実現できることがわかった。
関連論文リスト
- FAGC:Feature Augmentation on Geodesic Curve in the Pre-Shape Space [2.617962830559083]
本研究では, 形状空間理論に基づく特徴拡張法, すなわち, FAGC と呼ばれるジオデシック曲線上の特徴増強法を提案する。
提案手法は,小サンプルデータセットに対して単純で効果的で無感な手法である。
論文 参考訳(メタデータ) (2023-12-06T07:26:02Z) - RGM: A Robust Generalist Matching Model [53.223624323416914]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - A Geometric Perspective on Variational Autoencoders [0.0]
本稿では、完全に幾何学的な視点から、変分オートエンコーダフレームワークの新たな解釈を提案する。
このスキームを使うことで、バニラVAEと競合し、いくつかのベンチマークデータセットのより高度なバージョンよりも優れていることが示される。
論文 参考訳(メタデータ) (2022-09-15T15:32:43Z) - Explicit Use of Fourier Spectrum in Generative Adversarial Networks [0.0]
真正画像のスペクトルと偽画像の間には相違点があることが示される。
本研究では,実画像と偽画像のスペクトルの相違を低減させる新しいモデルを提案する。
生成した画像の品質向上に有望な改善を実験的に示す。
論文 参考訳(メタデータ) (2022-08-02T06:26:44Z) - FewGAN: Generating from the Joint Distribution of a Few Images [95.6635227371479]
本稿では,新しい,高品質で多様な画像を生成するための生成モデルFewGANを紹介する。
FewGANは、第1の粗いスケールで量子化を適用した階層的なパッチGANであり、その後、より微細なスケールで残った完全畳み込みGANのピラミッドが続く。
大規模な実験では、FewGANは定量的にも定性的にも基線より優れていることが示されている。
論文 参考訳(メタデータ) (2022-07-18T07:11:28Z) - Manifold Topology Divergence: a Framework for Comparing Data Manifolds [109.0784952256104]
本研究では,深部生成モデルの評価を目的としたデータ多様体の比較フレームワークを開発する。
クロスバーコードに基づき,manifold Topology Divergence score(MTop-Divergence)を導入する。
MTop-Divergenceは,様々なモードドロップ,モード内崩壊,モード発明,画像乱れを正確に検出する。
論文 参考訳(メタデータ) (2021-06-08T00:30:43Z) - Flow-based Generative Models for Learning Manifold to Manifold Mappings [39.60406116984869]
本稿では,フローベース生成モデルに類似した,多様体値データに対する可逆層を3種類導入する。
配向分布関数の分野の脳画像を確実にかつ正確に再構築できる有望な結果を示します。
論文 参考訳(メタデータ) (2020-12-18T02:19:18Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。