論文の概要: Interactive Latent Interpolation on MNIST Dataset
- arxiv url: http://arxiv.org/abs/2010.07581v1
- Date: Thu, 15 Oct 2020 08:04:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 05:02:11.995924
- Title: Interactive Latent Interpolation on MNIST Dataset
- Title(参考訳): MNISTデータセット上の対話型潜時補間
- Authors: Mazeyar Moeini Feizabadi, Ali Mohammed Shujjat, Sarah Shahid, Zainab
Hasnain (Habib University)
- Abstract要約: 視覚的適応型サンプルを示し、サンプル間を有意に補間し、潜在ベクトルを用いた線形算術を実行する。
ブラウザの速度を1.2ミリ秒まで向上させるため,Web ベースの新しい GAN を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This paper will discuss the potential of dimensionality reduction with a
web-based use of GANs. Throughout a variety of experiments, we show
synthesizing visually-appealing samples, interpolating meaningfully between
samples, and performing linear arithmetic with latent vectors. GANs have proved
to be a remarkable technique to produce computer-generated images, very similar
to an original image. This is primarily useful when coupled with dimensionality
reduction as an effective application of our algorithm. We proposed a new
architecture for GANs, which ended up not working for mathematical reasons
later explained. We then proposed a new web-based GAN that still takes
advantage of dimensionality reduction to speed generation in the browser to .2
milliseconds. Lastly, we made a modern UI with linear interpolation to present
the work. With the speedy generation, we can generate so fast that we can
create an animation type effect that we have never seen before that works on
both web and mobile.
- Abstract(参考訳): 本稿では,Web を利用した GAN による次元削減の可能性について論じる。
様々な実験を通して、視覚的応用サンプルの合成、サンプル間の有意義な補間、潜在ベクトルを用いた線形算術を行う。
GANは、オリジナルの画像と非常によく似た、コンピュータ生成画像を作成するための驚くべき技術であることが証明された。
これは,本アルゴリズムの有効応用として,次元還元と組み合わせることで主に有用である。
我々はgansの新しいアーキテクチャを提案したが、後に数学的理由のために機能しなかった。
その後、我々は、.2ミリ秒までのブラウザにおける速度生成の次元削減を引き続き活用する、Webベースの新しいGANを提案しました。
最後に、作業を示すために線形補間を備えたモダンなUIを作成しました。
高速な生成では、アニメーションタイプのエフェクトを生成できるので、Webとモバイルの両方で動くのはこれまで見たことがありません。
関連論文リスト
- SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - RAVEN: Rethinking Adversarial Video Generation with Efficient Tri-plane Networks [93.18404922542702]
本稿では,長期的空間的および時間的依存関係に対処する新しいビデオ生成モデルを提案する。
提案手法は,3次元認識型生成フレームワークにインスパイアされた,明示的で単純化された3次元平面のハイブリッド表現を取り入れたものである。
我々のモデルは高精細度ビデオクリップを解像度256時間256$ピクセルで合成し、フレームレート30fpsで5ドル以上まで持続する。
論文 参考訳(メタデータ) (2024-01-11T16:48:44Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - GM-NeRF: Learning Generalizable Model-based Neural Radiance Fields from
Multi-view Images [79.39247661907397]
本稿では,自由視点画像の合成に有効なフレームワークであるGeneralizable Model-based Neural Radiance Fieldsを提案する。
具体的には、多視点2D画像からの出現コードを幾何学的プロキシに登録するための幾何学誘導型アテンション機構を提案する。
論文 参考訳(メタデータ) (2023-03-24T03:32:02Z) - TriPlaneNet: An Encoder for EG3D Inversion [1.9567015559455132]
NeRFをベースとしたGANは、人間の頭部の高分解能かつ高忠実な生成モデリングのための多くのアプローチを導入している。
2D GANインバージョンのための普遍的最適化に基づく手法の成功にもかかわらず、3D GANに適用された手法は、結果を新しい視点に外挿することができないかもしれない。
本稿では,EG3D生成モデルに提示された3面表現を直接利用することにより,両者のギャップを埋める高速な手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T17:56:20Z) - Human Performance Modeling and Rendering via Neural Animated Mesh [40.25449482006199]
従来のメッシュをニューラルレンダリングの新たなクラスでブリッジします。
本稿では,映像から人間の視点をレンダリングする新しい手法を提案する。
我々は、ARヘッドセットにバーチャルヒューマンパフォーマンスを挿入して、さまざまなプラットフォーム上でのアプローチを実証する。
論文 参考訳(メタデータ) (2022-09-18T03:58:00Z) - Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D
Shapes [77.6741486264257]
本稿では,高忠実度ニューラルネットワークSDFのリアルタイムレンダリングを可能にする,効率的なニューラル表現を提案する。
我々の表現は、以前の作品に比べてレンダリング速度の点で2~3桁の効率であることを示す。
論文 参考訳(メタデータ) (2021-01-26T18:50:22Z) - TrackMPNN: A Message Passing Graph Neural Architecture for Multi-Object
Tracking [8.791710193028903]
本研究は,グラフに基づくデータ構造を用いて問題をモデル化する多目的追跡(MOT)への多くの従来のアプローチに従う。
複数のタイムステップにまたがるデータ関連問題を表す動的無方向性グラフに基づくフレームワークを作成する。
また、メモリ効率が高く、リアルタイムなオンラインアルゴリズムを作成するために対処する必要がある計算問題に対するソリューションと提案も提供します。
論文 参考訳(メタデータ) (2021-01-11T21:52:25Z) - Encoding large scale cosmological structure with Generative Adversarial
Networks [0.0]
我々は、予測モデルを構築するための第一歩として、訓練されたGANを使用して単純なオートエンコーダ(AE)を構築します。
GANとAEはどちらも、2Dと3Dという2種類のNボディシミュレーションから発行された画像に基づいて訓練されている。
GANはトレーニングした画像と統計的に一致した新しい画像を生成することに成功した。
論文 参考訳(メタデータ) (2020-11-10T17:11:14Z) - Neural Human Video Rendering by Learning Dynamic Textures and
Rendering-to-Video Translation [99.64565200170897]
本研究では,2次元スクリーン空間に人体を埋め込むことで,時間的コヒーレントな微細な細部を学習することで,人間の映像合成手法を提案する。
我々は,人間の再現やモノクロ映像からの新たなビュー合成などのアプローチの適用例を示し,質的にも定量的にも,芸術の状態を著しく改善した。
論文 参考訳(メタデータ) (2020-01-14T18:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。