論文の概要: Theoretical Insights into the Use of Structural Similarity Index In
Generative Models and Inferential Autoencoders
- arxiv url: http://arxiv.org/abs/2004.01864v1
- Date: Sat, 4 Apr 2020 05:39:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 22:33:41.130440
- Title: Theoretical Insights into the Use of Structural Similarity Index In
Generative Models and Inferential Autoencoders
- Title(参考訳): 生成モデルと推論オートエンコーダにおける構造類似度指標の利用に関する理論的考察
- Authors: Benyamin Ghojogh, Fakhri Karray, Mark Crowley
- Abstract要約: 本稿では,合成モデルと推論オートエンコーダにおける構造類似度指数(SSIM)の使い方を理論的に論じる。
本稿では,SSIMカーネルが汎用カーネルであり,不条件および条件付きモーメントマッチングネットワークで使用できることを示す。
- 参考スコア(独自算出の注目度): 12.323996999894002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative models and inferential autoencoders mostly make use of $\ell_2$
norm in their optimization objectives. In order to generate perceptually better
images, this short paper theoretically discusses how to use Structural
Similarity Index (SSIM) in generative models and inferential autoencoders. We
first review SSIM, SSIM distance metrics, and SSIM kernel. We show that the
SSIM kernel is a universal kernel and thus can be used in unconditional and
conditional generated moment matching networks. Then, we explain how to use
SSIM distance in variational and adversarial autoencoders and unconditional and
conditional Generative Adversarial Networks (GANs). Finally, we propose to use
SSIM distance rather than $\ell_2$ norm in least squares GAN.
- Abstract(参考訳): 生成モデルと推論オートエンコーダは、主に最適化目的に$\ell_2$ normを使用する。
本稿では、知覚的に優れた画像を生成するために、生成モデルや推論オートエンコーダに構造類似度指数(SSIM)を用いる方法について理論的に論じる。
まず,SSIM,SSIM距離測定,SSIMカーネルについて概説する。
本稿では,SSIMカーネルが汎用カーネルであり,不条件および条件付きモーメントマッチングネットワークで使用できることを示す。
次に,ssim距離を変分オートエンコーダと非条件および条件付き生成型adversarial network (gans) で使用する方法を説明する。
最後に、最小二乗 GAN において $\ell_2$ 標準ではなく SSIM 距離を使うことを提案する。
関連論文リスト
- Benchmarking Large Language Models with Integer Sequence Generation Tasks [1.3108652488669736]
本稿では,大規模言語モデル(LLM)がオンラインシーケンス百科事典(OEIS)から整数列を計算するコードを書かなければならない,新たなベンチマークを提案する。
ベンチマークの結果、OpenAI、Anthropic、Meta、Googleの他のフロンティアモデルよりも、簡単かつハードな整数シーケンス間の精度と不正なレートで、o1シリーズのモデルの方が優れていることが判明した。
論文 参考訳(メタデータ) (2024-11-07T02:05:43Z) - Robust kernel-free quadratic surface twin support vector machine with capped $L_1$-norm distance metric [0.46040036610482665]
本稿では,L_normカーネルフリーサーフェスツインサポートベクトルマシン(CL_QTSVM)を提案する。
キャップ付きL_norm距離メートル法を用いることで, モデルのロバスト性をさらに向上する。
提案手法を効率よく解くために反復アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-05-27T09:23:52Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Stochastic Configuration Machines: FPGA Implementation [4.57421617811378]
コンフィグレーションネットワーク(SCN)は、データモデリングのメリットと実現可能性から、産業アプリケーションにおいて主要な選択肢である。
本稿では、フィールドプログラマブルゲートアレイ(FPGA)にSCMモデルを実装し、学習性能を向上させるためにバイナリコード入力を導入することを目的とする。
論文 参考訳(メタデータ) (2023-10-30T02:04:20Z) - FAENet: Frame Averaging Equivariant GNN for Materials Modeling [123.19473575281357]
データ変換による任意のモデルE(3)-同変や不変化を実現するために,フレームアラグリング(SFA)に依存したフレキシブルなフレームワークを導入する。
本手法の有効性を理論的および実験的に証明し, 材料モデリングにおける精度と計算スケーラビリティを実証する。
論文 参考訳(メタデータ) (2023-04-28T21:48:31Z) - A Stable, Fast, and Fully Automatic Learning Algorithm for Predictive
Coding Networks [65.34977803841007]
予測符号化ネットワークは、ベイズ統計学と神経科学の両方にルーツを持つ神経科学にインスパイアされたモデルである。
シナプス重みに対する更新規則の時間的スケジュールを変更するだけで、元の規則よりもずっと効率的で安定したアルゴリズムが得られることを示す。
論文 参考訳(メタデータ) (2022-11-16T00:11:04Z) - Rescoring Sequence-to-Sequence Models for Text Line Recognition with
CTC-Prefixes [0.0]
我々は,S2Sデコード中にCTC-Prefix-Scoreを使用することを提案する。
ビームサーチ中、CTC信頼行列に従って無効となるパスがペナル化される。
IAM, Rimes, StAZHの3つのHTRデータセット上で, この設定を評価する。
論文 参考訳(メタデータ) (2021-10-12T11:40:05Z) - Statistically Meaningful Approximation: a Case Study on Approximating
Turing Machines with Transformers [50.85524803885483]
本研究は,統計的学習性を示すために近似ネットワークを必要とする統計有意(SM)近似の形式的定義を提案する。
回路とチューリングマシンの2つの機能クラスに対するSM近似について検討する。
論文 参考訳(メタデータ) (2021-07-28T04:28:55Z) - Boosting Continuous Sign Language Recognition via Cross Modality
Augmentation [135.30357113518127]
連続手話認識は不整合のビデオテキストペアを扱う。
クロスモーダル拡張を用いた新しいアーキテクチャを提案する。
提案するフレームワークは、既存のCTCベースの連続SLRアーキテクチャに容易に拡張できる。
論文 参考訳(メタデータ) (2020-10-11T15:07:50Z) - Learning Autoencoders with Relational Regularization [89.53065887608088]
データ分散のオートエンコーダを学習するための新しいフレームワークを提案する。
エンフレレーショナル正規化によるモデルと対象分布の差を最小限にする
我々はこのフレームワークを2つのスケーラブルアルゴリズムで実装し、確率的および決定論的オートエンコーダの両方に適用する。
論文 参考訳(メタデータ) (2020-02-07T17:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。