論文の概要: Parameter and Data-Efficient Spectral StyleDCGAN
- arxiv url: http://arxiv.org/abs/2404.00597v1
- Date: Sun, 31 Mar 2024 08:08:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 02:50:30.113224
- Title: Parameter and Data-Efficient Spectral StyleDCGAN
- Title(参考訳): パラメータとデータ効率の良いスペクトルスタイルDCGAN
- Authors: Aryan Garg,
- Abstract要約: 非条件の顔生成のための,単純で,パラメータが高く,かつ,データ効率のよい敵ネットワークを提案する。
我々の方法では、Spectral Style-DCGANまたはSSDは、Animal Faces HQデータセットから6,574万のパラメータと4739の犬の顔しか利用していません。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a simple, highly parameter, and data-efficient adversarial network for unconditional face generation. Our method: Spectral Style-DCGAN or SSD utilizes only 6.574 million parameters and 4739 dog faces from the Animal Faces HQ (AFHQ) dataset as training samples while preserving fidelity at low resolutions up to 64x64. Code available at https://github.com/Aryan-Garg/StyleDCGAN.
- Abstract(参考訳): 非条件の顔生成のための,単純で,パラメータが高く,かつ,データ効率のよい敵ネットワークを提案する。
我々の方法では、Spectral Style-DCGANまたはSSDは6,574万のパラメータと4739頭の犬の顔しか使用していない。
コードはhttps://github.com/Aryan-Garg/StyleDCGAN.comで公開されている。
関連論文リスト
- FDLite: A Single Stage Lightweight Face Detector Network [2.5628953713168685]
この研究の斬新さは、一般的に使われている損失関数と学習戦略のみを訓練しながら、軽量検出器の設計にある。
FDLiteは92.3%、89.8%、82.2%の平均精度(AP)をWIDER FACEデータセットの容易、中、硬サブセットで達成している。
論文 参考訳(メタデータ) (2024-06-27T11:34:27Z) - Efficient Verification-Based Face Identification [50.616875565173274]
効率の良いニューラルモデルで顔認証を行う際の問題点を$f$で検討する。
我々のモデルは、23kパラメータと5M浮動小数点演算(FLOPS)しか必要としない、かなり小さな$f$に導かれる。
我々は、6つの顔認証データセットを用いて、我々の手法が最先端のモデルよりも同等か優れていることを示す。
論文 参考訳(メタデータ) (2023-12-20T18:08:02Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - Hyperparameter Optimization through Neural Network Partitioning [11.6941692990626]
本稿では,ニューラルネットワークにおけるハイパーパラメータの最適化をシンプルかつ効率的に行う方法を提案する。
本手法では,トレーニングデータとニューラルネットワークモデルをデータシャードとパラメータ分割に$K$に分割する。
我々は、この目的を単一のトレーニングランで様々なハイパーパラメータを最適化するために適用できることを実証した。
論文 参考訳(メタデータ) (2023-04-28T11:24:41Z) - EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z) - StyleNAT: Giving Each Head a New Perspective [71.84791905122052]
高い効率と柔軟性を備えた高品質な画像生成をターゲットとした,StyleNATと呼ばれる新しいトランスフォーマーベースのフレームワークを提案する。
私たちのモデルの中核となるのは、ローカルおよびグローバルな情報を捉えるために注意を分割する、慎重に設計されたフレームワークです。
StyleNATはFFHQ-256で新たなSOTA FIDスコアを2.046で獲得し、StyleGAN-XLやHITやStyleSwinといったトランスフォーマーのような畳み込みモデルで先行芸術を圧倒した。
論文 参考訳(メタデータ) (2022-11-10T18:55:48Z) - Blind Face Restoration: Benchmark Datasets and a Baseline Model [63.053331687284064]
Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。
EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。
最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
論文 参考訳(メタデータ) (2022-06-08T06:34:24Z) - EvolGAN: Evolutionary Generative Adversarial Networks [7.110311114192367]
そこで本研究では,小型で難解なデータセットで学習した生成的敵ネットワークの潜在空間を,品質推定器と進化的手法を用いて探索することを提案する。
この新しい手法は, 生成元の多様性を保ちながら, 極めて高品質な画像を生成する。
論文 参考訳(メタデータ) (2020-09-28T13:31:13Z) - Freeze the Discriminator: a Simple Baseline for Fine-Tuning GANs [104.85633684716296]
判別器の冷凍下層を有するGANの簡易微調整が驚くほど良好であることを示す。
この単純なベースラインであるFreezeDは、非条件GANと条件GANの両方で使用されている従来の技術よりも大幅に優れている。
論文 参考訳(メタデータ) (2020-02-25T15:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。