論文の概要: Quaternion Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2104.09630v1
- Date: Mon, 19 Apr 2021 20:46:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 13:55:08.131978
- Title: Quaternion Generative Adversarial Networks
- Title(参考訳): 四元数生成逆ネットワーク
- Authors: Eleonora Grassucci, Edoardo Cicero, Danilo Comminiello
- Abstract要約: QGAN(Quaternion-valued adversarial Network)のファミリーを提案する。
QGANは四元環の性質、例えば畳み込みに対するハミルトン積を利用する。
その結果,QGANは視覚的に満足な画像を生成することができ,実値のGANに対して優れたFIDスコアを得ることができることがわかった。
- 参考スコア(独自算出の注目度): 5.156484100374058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Latest Generative Adversarial Networks (GANs) are gathering outstanding
results through a large-scale training, thus employing models composed of
millions of parameters requiring extensive computational capabilities. Building
such huge models undermines their replicability and increases the training
instability. Moreover, multi-channel data, such as images or audio, are usually
processed by real-valued convolutional networks that flatten and concatenate
the input, losing any intra-channel spatial relation. To address these issues,
here we propose a family of quaternion-valued generative adversarial networks
(QGANs). QGANs exploit the properties of quaternion algebra, e.g., the Hamilton
product for convolutions. This allows to process channels as a single entity
and capture internal latent relations, while reducing by a factor of 4 the
overall number of parameters. We show how to design QGANs and to extend the
proposed approach even to advanced models. We compare the proposed QGANs with
real-valued counterparts on multiple image generation benchmarks. Results show
that QGANs are able to generate visually pleasing images and to obtain better
FID scores with respect to their real-valued GANs. Furthermore, QGANs save up
to 75% of the training parameters. We believe these results may pave the way to
novel, more accessible, GANs capable of improving performance and saving
computational resources.
- Abstract(参考訳): 最新のGAN(Generative Adversarial Networks)は大規模なトレーニングを通じて優れた結果を集めており、膨大な計算能力を必要とする数百万のパラメータからなるモデルを採用している。
このような巨大なモデルの構築は、その複製性を損なうとともに、トレーニングの不安定性を高める。
さらに、画像やオーディオなどのマルチチャネルデータは、通常、入力をフラット化し、連結する実数値畳み込みネットワークによって処理され、チャネル内の空間関係は失われる。
本稿では,これらの問題に対処するために,四元価値生成逆ネットワーク(qgans)のファミリーを提案する。
QGANは四元環の性質、例えば畳み込みに対するハミルトン積を利用する。
これにより、チャンネルを単一のエンティティとして処理し、内部の潜伏関係をキャプチャし、パラメータの総数を4倍削減できる。
我々はqganの設計方法を示し,提案手法を先進モデルにも拡張する。
提案したQGANと,複数の画像生成ベンチマークにおける実値との比較を行った。
その結果,QGANは視覚的に満足な画像を生成することができ,実値のGANに対して優れたFIDスコアを得ることができることがわかった。
さらに、QGANはトレーニングパラメータの最大75%を節約する。
これらの結果は、新しい、よりアクセシブルな、パフォーマンスを改善し、計算資源を節約できるGANの道を開くかもしれない。
関連論文リスト
- Noise-Resilient Unsupervised Graph Representation Learning via Multi-Hop Feature Quality Estimation [53.91958614666386]
グラフニューラルネットワーク(GNN)に基づく教師なしグラフ表現学習(UGRL)
マルチホップ特徴量推定(MQE)に基づく新しいUGRL法を提案する。
論文 参考訳(メタデータ) (2024-07-29T12:24:28Z) - U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [48.40120035775506]
Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文 参考訳(メタデータ) (2024-06-05T04:13:03Z) - SMaRt: Improving GANs with Score Matching Regularity [94.81046452865583]
生成的敵ネットワーク(GAN)は通常、基礎となる多様体が複雑である非常に多様なデータから学ぶのに苦労する。
スコアマッチングは、生成したデータポイントを実データ多様体へ持続的にプッシュする能力のおかげで、この問題に対する有望な解決策であることを示す。
スコアマッチング規則性(SMaRt)を用いたGANの最適化を提案する。
論文 参考訳(メタデータ) (2023-11-30T03:05:14Z) - Spider GAN: Leveraging Friendly Neighbors to Accelerate GAN Training [20.03447539784024]
本稿では,画像を入力とするGANの学習手法を提案する。
このプロセスは、密接に関連するデータセットや、ターゲット分布のフレンドリーな近所'を識別することで、効率的に行うことができる。
我々は、スパイダーガンの定式化がより高速な収束をもたらすことを示し、ジェネレータは、一見無関係なデータセットでさえ対応を発見できることを示した。
論文 参考訳(メタデータ) (2023-05-12T17:03:18Z) - Auto-Transfer: Learning to Route Transferrable Representations [77.30427535329571]
本稿では,適切なターゲット表現にソース表現をルートする方法を自動学習する,新しい対向型マルチアームバンディット手法を提案する。
最先端の知識伝達手法と比較すると,5%以上の精度向上が期待できる。
論文 参考訳(メタデータ) (2022-02-02T13:09:27Z) - Quaternion-Based Graph Convolution Network for Recommendation [45.005089037955536]
Graph Convolution Network (GCN) はリコメンデータシステムで広く利用されている。
GCNは実世界でよく見られるノイズや不完全グラフに弱い。
本稿では,Queternion-based Graph Convolution Network (QGCN)レコメンデーションモデルを提案する。
論文 参考訳(メタデータ) (2021-11-20T07:42:18Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Unpaired Image Enhancement with Quality-Attention Generative Adversarial
Network [92.01145655155374]
品質の注意を払わないデータに基づいて訓練された生成敵対ネットワーク(QAGAN)を提案する。
提案されたQAGANの重要な新規性は、ジェネレータの注入されたQAMにある。
提案手法は客観的評価と主観評価の両方において良好な性能を実現する。
論文 参考訳(メタデータ) (2020-12-30T05:57:20Z) - A Quaternion-Valued Variational Autoencoder [15.153617649974263]
可変オートエンコーダ(VAE)は、入力の潜在表現を学習することで、生成過程をモデル化する能力を証明している。
四元数領域で定義された新しいVAEを提案し、四元数代数の特性を利用して性能を向上させる。
論文 参考訳(メタデータ) (2020-10-22T12:33:42Z) - Generative Adversarial Networks (GANs): An Overview of Theoretical
Model, Evaluation Metrics, and Recent Developments [9.023847175654602]
GAN(Generative Adversarial Network)は,大規模データ分散のサンプルを作成する上で有効な手法である。
GANはラベル付きトレーニングデータを広く使用せずにディープ表現を学習する適切な方法を提供する。
GANでは、ジェネレータと識別器のネットワークを同時にトレーニングする競合プロセスを通じて生成モデルを推定する。
論文 参考訳(メタデータ) (2020-05-27T05:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。