Fugu-MT 論文翻訳(概要): Paired Image-to-Image Translation Quality Assessment Using Multi-Method Fusion

論文の概要: Paired Image-to-Image Translation Quality Assessment Using Multi-Method Fusion

arxiv url: http://arxiv.org/abs/2205.04186v1
Date: Mon, 9 May 2022 11:05:15 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-10 13:27:22.393897
Title: Paired Image-to-Image Translation Quality Assessment Using Multi-Method Fusion
Title（参考訳）: 多方法融合による画像間翻訳品質評価
Authors: Stefan Borasinski, Esin Yavuz, S\'ebastien B\'ehuret
Abstract要約: 本稿では,画像品質の信号のペア化と変換を併用して,後者の類似性と仮説的基底真理を推定する手法を提案する。我々は,深部画像構造とテクスチャ類似性(DISTS)を予測するために,勾配型回帰器のアンサンブルを用いたマルチメソッドフュージョン(MMF)モデルを訓練した。分析の結果,測定時間と予測精度の間にトレードオフが生じ,特徴制約を課すことが判明した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: How best to evaluate synthesized images has been a longstanding problem in image-to-image translation, and to date remains largely unresolved. This paper proposes a novel approach that combines signals of image quality between paired source and transformation to predict the latter's similarity with a hypothetical ground truth. We trained a Multi-Method Fusion (MMF) model via an ensemble of gradient-boosted regressors using Image Quality Assessment (IQA) metrics to predict Deep Image Structure and Texture Similarity (DISTS), enabling models to be ranked without the need for ground truth data. Analysis revealed the task to be feature-constrained, introducing a trade-off at inference between metric computation time and prediction accuracy. The MMF model we present offers an efficient way to automate the evaluation of synthesized images, and by extension the image-to-image translation models that generated them.
Abstract（参考訳）: 合成画像の最良の評価は、画像から画像への翻訳における長年の問題であり、現在に至るまでほとんど未解決のままである。本稿では,ペアソースと変換間の画像品質の信号を組み合わせて,後者の類似性と仮定的基底真理を予測する新しい手法を提案する。我々は、画像品質評価(IQA)メトリクスを用いて、勾配付き回帰器のアンサンブルを用いてマルチメソッドフュージョン(MMF)モデルを訓練し、深部画像構造とテクスチャ類似度(DISTS)を予測する。分析の結果, 計算時間と予測精度の相関関係を考慮し, 特徴制約を課すことが判明した。本稿では,合成画像の評価を効率よく自動化し,生成した画像から画像への変換モデルを拡張したMMFモデルを提案する。

関連論文リスト

MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.09238330331195]
本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。離散化の手法とは異なり、MMARは情報損失を避けるために連続的に評価された画像トークンを取り入れる。 MMARは他のジョイントマルチモーダルモデルよりもはるかに優れた性能を示す。
論文参考訳（メタデータ） (2024-10-14T17:57:18Z)
Attention Down-Sampling Transformer, Relative Ranking and Self-Consistency for Blind Image Quality Assessment [17.04649536069553]
非参照画像品質評価は、元の参照なしで画像品質を推定する難しい領域である。変換器エンコーダとCNNを用いて,画像から局所的および非局所的情報を抽出する機構を改良した。非参照画像品質評価(NR-IQA)モデルの劣化に対処し,自己超越に対する自己整合性アプローチを提案する。
論文参考訳（メタデータ） (2024-09-11T09:08:43Z)
Semantic Approach to Quantifying the Consistency of Diffusion Model Image Generation [0.40792653193642503]
拡散モデルにおける画像生成の再現性、あるいは一貫性の解釈可能な定量的スコアの必要性を同定する。セマンティック・コンセンサス・スコアとしてペア平均CLIPスコアを用いるセマンティック・アプローチを提案する。
論文参考訳（メタデータ） (2024-04-12T20:16:03Z)
InVA: Integrative Variational Autoencoder for Harmonization of Multi-modal Neuroimaging Data [3.792342522967013]
本稿では、異なるソースから得られた複数の画像から情報を借りて、画像の予測推論を行う、積分変分自動符号化(textttInVA)手法を提案する。数値的な結果は、通常入力画像間での情報を借りることができないVAEに対して、textttInVAのかなりの利点を示す。
論文参考訳（メタデータ） (2024-02-05T05:26:17Z)
Corner-to-Center Long-range Context Model for Efficient Learned Image Compression [70.0411436929495]
学習された画像圧縮のフレームワークでは、コンテキストモデルは潜在表現間の依存関係をキャプチャする上で重要な役割を果たす。本研究では,textbfCorner-to-Center 変換器を用いたコンテキストモデル (C$3$M) を提案する。また,解析および合成変換における受容場を拡大するために,エンコーダ/デコーダのLong-range Crossing Attention Module (LCAM) を用いる。
論文参考訳（メタデータ） (2023-11-29T21:40:28Z)
Uncertainty Estimation in Contrast-Enhanced MR Image Translation with Multi-Axis Fusion [6.727287631338148]
我々は,新しいモデル不確実性定量化手法であるマルチ軸核融合(MAF)を提案する。提案手法は,T1,T2,T2-FLAIRスキャンに基づくコントラスト強調T1強調画像の合成に応用される。
論文参考訳（メタデータ） (2023-11-20T20:09:48Z)
ARNIQA: Learning Distortion Manifold for Image Quality Assessment [28.773037051085318]
No-Reference Image Quality Assessment (NR-IQA) は、高品質な参照画像を必要としない、人間の知覚に合わせて画像品質を測定する手法を開発することを目的としている。本研究では、画像歪み多様体をモデル化し、本質的な表現を得るための自己教師型アプローチ ARNIQA を提案する。
論文参考訳（メタデータ） (2023-10-20T17:22:25Z)
Bridging the Gap between Synthetic and Authentic Images for Multimodal Machine Translation [51.37092275604371]
マルチモーダル機械翻訳(MMT)は、ソース文と関連する画像を同時に翻訳の入力とする。近年の研究では、画像入力のための強力なテキスト・画像生成モデルが提案されている。しかし、これらのモデルによって生成された合成画像は、実際の画像と比較して異なる分布を辿ることが多い。
論文参考訳（メタデータ） (2023-10-20T09:06:30Z)
Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文参考訳（メタデータ） (2023-03-06T11:51:28Z)
Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文参考訳（メタデータ） (2022-06-30T18:31:51Z)
Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文参考訳（メタデータ） (2021-10-25T21:01:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。