論文の概要: SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric
Pattern Generation
- arxiv url: http://arxiv.org/abs/2304.09384v1
- Date: Wed, 19 Apr 2023 02:38:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 15:48:04.048527
- Title: SP-BatikGAN: An Efficient Generative Adversarial Network for Symmetric
Pattern Generation
- Title(参考訳): SP-BatikGAN:対称性パターン生成のための効率的な生成逆ネットワーク
- Authors: Chrystian, Wahyono
- Abstract要約: 我々は幾何学的に対称なパターン生成に興味を持ち、ポルトガル、モロッコのタイル、バティクなどの多くの芸術作品に現れる。
このタスクのために設計ファイルから直接、1,216の高品質な対称パターンを公に提供します。
次に、対称パターン強制(SPE)損失を定式化し、基礎となる対称構造を利用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Following the contention of AI arts, our research focuses on bringing AI for
all, particularly for artists, to create AI arts with limited data and
settings. We are interested in geometrically symmetric pattern generation,
which appears on many artworks such as Portuguese, Moroccan tiles, and Batik, a
cultural heritage in Southeast Asia. Symmetric pattern generation is a complex
problem, with prior research creating too-specific models for certain patterns
only. We provide publicly, the first-ever 1,216 high-quality symmetric patterns
straight from design files for this task. We then formulate symmetric pattern
enforcement (SPE) loss to leverage underlying symmetric-based structures that
exist on current image distributions. Our SPE improves and accelerates training
on any GAN configuration, and, with efficient attention, SP-BatikGAN compared
to FastGAN, the state-of-the-art GAN for limited setting, improves the FID
score from 110.11 to 90.76, an 18% decrease, and model diversity recall score
from 0.047 to 0.204, a 334% increase.
- Abstract(参考訳): AIアートの論争に続き、私たちの研究はAIを、特にアーティストのために、限られたデータと設定でAIアートを作成することに重点を置いています。
我々は幾何学的に対称なパターン生成に興味を持ち、ポルトガル、モロッコのタイル、東南アジアの文化的遺産であるバティクなど多くの美術品に現れる。
対称パターン生成は複雑な問題であり、事前の研究は特定のパターンのみに対して過剰に特定のモデルを作成する。
このタスクのために設計ファイルから直接、1,216の高品質な対称パターンを公に提供します。
次に対称パターン強制(spe)損失を定式化し、現在の画像分布に存在する対称ベースの構造を活用する。
我々のSPEは任意のGAN構成のトレーニングを改善・加速し、SP-BatikGANはFastGANと比較して効率よく注目され、限られた設定のための最先端のGANであり、FIDスコアが110.11から90.76に改善され、18%が減少し、モデルの多様性リコールスコアが0.047から0.204に改善され、334%が増加した。
関連論文リスト
- A Fusion-Driven Approach of Attention-Based CNN-BiLSTM for Protein Family Classification -- ProFamNet [0.8429750290021879]
本研究では1D-CNN, BiLSTM, および注意機構の融合によるタンパク質ファミリーの分類モデルを提案する。
提案したモデル(ProFamNet)は450,953のパラメータと1.72MBのコンパクトサイズで優れたモデル効率を実現した。
論文 参考訳(メタデータ) (2024-10-21T20:33:18Z) - Isomorphic Pruning for Vision Models [56.286064975443026]
構造化プルーニングは、冗長なサブ構造を取り除くことによって、ディープニューラルネットワークの計算オーバーヘッドを低減する。
Isomorphic Pruningは、ネットワークアーキテクチャの範囲で有効性を示すシンプルなアプローチである。
論文 参考訳(メタデータ) (2024-07-05T16:14:53Z) - First Place Solution of 2023 Global Artificial Intelligence Technology Innovation Competition Track 1 [9.915564470970049]
我々は,グローバル人工知能技術革新コンペティショントラック1のチャンピオンソリューションを提示する。
我々はテキスト生成タスクのベースモデルとしてCPT-BASEを選択する。
驚いたことに、我々のシングルモデルはリーダーボードAで2.321点を獲得し、複数のモデル融合スコアはAとBのリーダーボードで2.362点と2.320点である。
論文 参考訳(メタデータ) (2024-07-01T13:22:22Z) - Lory: Fully Differentiable Mixture-of-Experts for Autoregressive Language Model Pre-training [73.90260246781435]
私たちは、このようなアーキテクチャを自動回帰言語モデルに拡張する最初のアプローチであるLoryを紹介します。
パラメータマッチングされた高密度モデルよりも、多種多様な下流タスクにおいて顕著な性能向上を示す。
セグメントレベルのルーティングにもかかわらず、Loryモデルはトークンレベルのルーティングを備えた最先端のMoEモデルと比較して、競合的なパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-05-06T03:06:33Z) - Mixture of Low-rank Experts for Transferable AI-Generated Image Detection [18.631006488565664]
生成モデルは、最小限の専門知識を持つ写真リアリスティック画像の飛躍的な飛躍を見せ、オンライン情報の真正性に対する懸念を喚起している。
本研究の目的は,多様なソースからの画像を識別できる,汎用的なAI生成画像検出器を開発することである。
事前学習された視覚言語モデルのゼロショット転送性に着想を得て、未知の領域を一般化するために、CLIP-ViTの非自明な視覚世界知識と記述的習熟度を活用することを目指す。
論文 参考訳(メタデータ) (2024-04-07T09:01:50Z) - An Empirical Study of Multimodal Model Merging [148.48412442848795]
モデルマージは、異なるタスクでトレーニングされた複数のモデルを融合してマルチタスクソリューションを生成するテクニックである。
我々は、モダリティ固有のアーキテクチャのビジョン、言語、およびクロスモーダルトランスフォーマーをマージできる新しい目標に向けて研究を行っている。
本稿では,重み間の距離を推定し,マージ結果の指標となる2つの指標を提案する。
論文 参考訳(メタデータ) (2023-04-28T15:43:21Z) - ACFD: Asymmetric Cartoon Face Detector [72.60983975604145]
ACFDは2020年のiCartoon Face Challengeで1位を獲得した。
ACFDは、モデルサイズ200MB、画像あたりの推測時間50ms、事前訓練されたモデルなしで、2020年のiCartoon Face Challengeの1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-02T05:57:34Z) - DARTS-ASR: Differentiable Architecture Search for Multilingual Speech
Recognition and Adaptation [64.44349061520671]
本稿では,DARTS-ASRを用いたアーキテクチャ探索手法を提案する。
DARTS-ASRの一般化可能性を検討するために,本手法を多くの言語に応用し,単言語ASRを実行するだけでなく,多言語ASR設定にも適用する。
論文 参考訳(メタデータ) (2020-05-13T11:32:27Z) - Recent Developments Combining Ensemble Smoother and Deep Generative
Networks for Facies History Matching [58.720142291102135]
本研究は、ファシズムモデルのための連続パラメータ化を構築するためのオートエンコーダネットワークの利用に焦点を当てる。
本稿では,VAE,GAN,Wasserstein GAN,変分自動符号化GAN,サイクルGANの主成分分析(PCA),転送スタイルネットワークのPCA,スタイル損失のVAEの7種類の定式化をベンチマークする。
論文 参考訳(メタデータ) (2020-05-08T21:32:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。