Fugu-MT 論文翻訳(概要): Theoretical Insights into the Use of Structural Similarity Index In Generative Models and Inferential Autoencoders

論文の概要: Theoretical Insights into the Use of Structural Similarity Index In Generative Models and Inferential Autoencoders

arxiv url: http://arxiv.org/abs/2004.01864v1
Date: Sat, 4 Apr 2020 05:39:15 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-16 22:33:41.130440
Title: Theoretical Insights into the Use of Structural Similarity Index In Generative Models and Inferential Autoencoders
Title（参考訳）: 生成モデルと推論オートエンコーダにおける構造類似度指標の利用に関する理論的考察
Authors: Benyamin Ghojogh, Fakhri Karray, Mark Crowley
Abstract要約: 本稿では,合成モデルと推論オートエンコーダにおける構造類似度指数(SSIM)の使い方を理論的に論じる。本稿では,SSIMカーネルが汎用カーネルであり,不条件および条件付きモーメントマッチングネットワークで使用できることを示す。
参考スコア（独自算出の注目度）: 12.323996999894002
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative models and inferential autoencoders mostly make use of $\ell_2$ norm in their optimization objectives. In order to generate perceptually better images, this short paper theoretically discusses how to use Structural Similarity Index (SSIM) in generative models and inferential autoencoders. We first review SSIM, SSIM distance metrics, and SSIM kernel. We show that the SSIM kernel is a universal kernel and thus can be used in unconditional and conditional generated moment matching networks. Then, we explain how to use SSIM distance in variational and adversarial autoencoders and unconditional and conditional Generative Adversarial Networks (GANs). Finally, we propose to use SSIM distance rather than $\ell_2$ norm in least squares GAN.
Abstract（参考訳）: 生成モデルと推論オートエンコーダは、主に最適化目的に$\ell_2$ normを使用する。本稿では、知覚的に優れた画像を生成するために、生成モデルや推論オートエンコーダに構造類似度指数(SSIM)を用いる方法について理論的に論じる。まず,SSIM,SSIM距離測定,SSIMカーネルについて概説する。本稿では,SSIMカーネルが汎用カーネルであり,不条件および条件付きモーメントマッチングネットワークで使用できることを示す。次に,ssim距離を変分オートエンコーダと非条件および条件付き生成型adversarial network (gans) で使用する方法を説明する。最後に、最小二乗 GAN において $\ell_2$ 標準ではなく SSIM 距離を使うことを提案する。

関連論文リスト

Tensor Network Generator-Enhanced Optimization for Traveling Salesman Problem [12.04919729571293]
本稿では、旅行セールスマン問題(TSP)に対するテンソルネットワークジェネレータ強化最適化(TN-GEO)フレームワークの適用について述べる。提案手法では,自動微分可能な行列積状態(MPS)を生成モデルとして,テンソルネットワークのBornマシンを用いる。局所的な相関に注目する$k$-site variantsは、フルMPSの場合よりもよい結果を示す。
論文参考訳（メタデータ） (2026-02-12T21:18:19Z)
Sequential-Parallel Duality in Prefix Scannable Models [68.39855814099997]
近年では Gated Linear Attention (GLA) や Mamba など様々なモデルが開発されている。ニアコンスタント時間並列評価と線形時間、定数空間シーケンシャル推論をサポートするニューラルネットワークモデルの全クラスを特徴付けることができるだろうか?
論文参考訳（メタデータ） (2025-06-12T17:32:02Z)
STree: Speculative Tree Decoding for Hybrid State-Space Models [46.17007054146938]
投機的復号化(英: Speculative decoding)は、大規模自己回帰変換(AR)モデルの効率を改善するためにハードウェアを活用する手法である。状態空間モデル(SSM)とハイブリッドアーキテクチャでツリーベースの投機的復号化を行うための,最初のスケーラブルアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-05-20T23:12:16Z)
Reviving Any-Subset Autoregressive Models with Principled Parallel Sampling and Speculative Decoding [55.2480439325792]
任意の順序言語モデルでは、正しい関節分布からトークンを並列にサンプリングする方法がオープンな問題である。我々は,任意のサブセット自動回帰モデル (AS-ARM) という,異なるモデルのクラスが解を持っていることを発見した。我々は,AS-ARMがベンチマークタスクを埋め込んだ200M未満のパラメータモデル間で最先端の性能を実現し,コード生成における50倍のモデルの性能とほぼ一致していることを示す。
論文参考訳（メタデータ） (2025-04-29T06:33:13Z)
Automatic tuning of communication protocols for vehicular ad hoc networks using metaheuristics [4.734135226897704]
車両用アドホックネットワーク(VANET)は、自発的に相互接続可能な通信車両の集合を扱う。最終のネットワーク展開に先立って,通信プロトコルを最適に設定することが重要である。
論文参考訳（メタデータ） (2025-01-15T14:59:00Z)
Benchmarking Large Language Models with Integer Sequence Generation Tasks [1.3108652488669736]
本稿では,大規模言語モデル(LLM)がオンラインシーケンス百科事典(OEIS)から整数列を計算するコードを書かなければならない,新たなベンチマークを提案する。ベンチマークの結果、OpenAI、Anthropic、Meta、Googleの他のフロンティアモデルよりも、簡単かつハードな整数シーケンス間の精度と不正なレートで、o1シリーズのモデルの方が優れていることが判明した。
論文参考訳（メタデータ） (2024-11-07T02:05:43Z)
Robust kernel-free quadratic surface twin support vector machine with capped $L_1$-norm distance metric [0.46040036610482665]
本稿では,L_normカーネルフリーサーフェスツインサポートベクトルマシン(CL_QTSVM)を提案する。キャップ付きL_norm距離メートル法を用いることで, モデルのロバスト性をさらに向上する。提案手法を効率よく解くために反復アルゴリズムを開発した。
論文参考訳（メタデータ） (2024-05-27T09:23:52Z)
Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。 LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。 LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文参考訳（メタデータ） (2024-03-11T05:35:38Z)
Stochastic Configuration Machines: FPGA Implementation [4.57421617811378]
コンフィグレーションネットワーク(SCN)は、データモデリングのメリットと実現可能性から、産業アプリケーションにおいて主要な選択肢である。本稿では、フィールドプログラマブルゲートアレイ(FPGA)にSCMモデルを実装し、学習性能を向上させるためにバイナリコード入力を導入することを目的とする。
論文参考訳（メタデータ） (2023-10-30T02:04:20Z)
FAENet: Frame Averaging Equivariant GNN for Materials Modeling [123.19473575281357]
データ変換による任意のモデルE(3)-同変や不変化を実現するために,フレームアラグリング(SFA)に依存したフレキシブルなフレームワークを導入する。本手法の有効性を理論的および実験的に証明し, 材料モデリングにおける精度と計算スケーラビリティを実証する。
論文参考訳（メタデータ） (2023-04-28T21:48:31Z)
A Stable, Fast, and Fully Automatic Learning Algorithm for Predictive Coding Networks [65.34977803841007]
予測符号化ネットワークは、ベイズ統計学と神経科学の両方にルーツを持つ神経科学にインスパイアされたモデルである。シナプス重みに対する更新規則の時間的スケジュールを変更するだけで、元の規則よりもずっと効率的で安定したアルゴリズムが得られることを示す。
論文参考訳（メタデータ） (2022-11-16T00:11:04Z)
Rescoring Sequence-to-Sequence Models for Text Line Recognition with CTC-Prefixes [0.0]
我々は,S2Sデコード中にCTC-Prefix-Scoreを使用することを提案する。ビームサーチ中、CTC信頼行列に従って無効となるパスがペナル化される。 IAM, Rimes, StAZHの3つのHTRデータセット上で, この設定を評価する。
論文参考訳（メタデータ） (2021-10-12T11:40:05Z)
Statistically Meaningful Approximation: a Case Study on Approximating Turing Machines with Transformers [50.85524803885483]
本研究は,統計的学習性を示すために近似ネットワークを必要とする統計有意(SM)近似の形式的定義を提案する。回路とチューリングマシンの2つの機能クラスに対するSM近似について検討する。
論文参考訳（メタデータ） (2021-07-28T04:28:55Z)
Boosting Continuous Sign Language Recognition via Cross Modality Augmentation [135.30357113518127]
連続手話認識は不整合のビデオテキストペアを扱う。クロスモーダル拡張を用いた新しいアーキテクチャを提案する。提案するフレームワークは、既存のCTCベースの連続SLRアーキテクチャに容易に拡張できる。
論文参考訳（メタデータ） (2020-10-11T15:07:50Z)
Learning Autoencoders with Relational Regularization [89.53065887608088]
データ分散のオートエンコーダを学習するための新しいフレームワークを提案する。エンフレレーショナル正規化によるモデルと対象分布の差を最小限にする我々はこのフレームワークを2つのスケーラブルアルゴリズムで実装し、確率的および決定論的オートエンコーダの両方に適用する。
論文参考訳（メタデータ） (2020-02-07T17:27:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。