Fugu-MT 論文翻訳(概要): Collaborative Auto-encoding for Blind Image Quality Assessment

論文の概要: Collaborative Auto-encoding for Blind Image Quality Assessment

arxiv url: http://arxiv.org/abs/2305.14684v1
Date: Wed, 24 May 2023 03:45:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-25 20:11:32.249138
Title: Collaborative Auto-encoding for Blind Image Quality Assessment
Title（参考訳）: ブラインド画像品質評価のための協調的自動エンコーディング
Authors: Zehong Zhou, Fei Zhou, Guoping Qiu
Abstract要約: ブラインド画像品質評価(BIQA)は、重要な現実世界のアプリケーションにおいて難しい問題である。近年、ディープニューラルネットワーク(DNN)による強力な表現を活用しようとする試みは、主観的な注釈付きデータの欠如によって妨げられている。本稿では,この基本的な障害を克服する新しいBIQA法を提案する。
参考スコア（独自算出の注目度）: 17.081262827258943
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Blind image quality assessment (BIQA) is a challenging problem with important real-world applications. Recent efforts attempting to exploit powerful representations by deep neural networks (DNN) are hindered by the lack of subjectively annotated data. This paper presents a novel BIQA method which overcomes this fundamental obstacle. Specifically, we design a pair of collaborative autoencoders (COAE) consisting of a content autoencoder (CAE) and a distortion autoencoder (DAE) that work together to extract content and distortion representations, which are shown to be highly descriptive of image quality. While the CAE follows a standard codec procedure, we introduce the CAE-encoded feature as an extra input to the DAE's decoder for reconstructing distorted images, thus effectively forcing DAE's encoder to extract distortion representations. The self-supervised learning framework allows the COAE including two feature extractors to be trained by almost unlimited amount of data, thus leaving limited samples with annotations to finetune a BIQA model. We will show that the proposed BIQA method achieves state-of-the-art performance and has superior generalization capability over other learning based models. The codes are available at: https://github.com/Macro-Zhou/NRIQA-VISOR/.
Abstract（参考訳）: ブラインド画像品質評価(BIQA)は、重要な現実世界のアプリケーションにおいて難しい問題である。近年、ディープニューラルネットワーク(DNN)による強力な表現を活用しようとする試みは、主観的な注釈付きデータの欠如によって妨げられている。本稿では,この基本的な障害を克服する新しいBIQA法を提案する。具体的には、コンテントオートエンコーダ(CAE)とコンテントオートエンコーダ(DAE)からなる協調オートエンコーダ(COAE)のペアを設計し、コンテントと歪み表現を抽出する。 CAEは標準のコーデック手順に従っているが,DAEのデコーダに付加的な入力としてCAE符号化機能を導入して歪み画像の再構成を行い,DAEのエンコーダに歪み表現を抽出させる。自己教師付き学習フレームワークにより、2つの特徴抽出器を含むCOAEは、ほぼ無制限のデータで訓練され、BIQAモデルを微調整するためのアノテーション付きの限られたサンプルが残される。提案手法は最先端性能を実現し,他の学習モデルよりも優れた一般化能力を有することを示す。コードは、https://github.com/Macro-Zhou/NRIQA-VISOR/で入手できる。

関連論文リスト

Q-Former Autoencoder: A Modern Framework for Medical Anomaly Detection [12.245379864678291]
本稿では,最新のオートエンコーダベースのフレームワークであるQ-Former Autoencoderを提案する。凍結した視覚基盤モデルを特徴抽出器として直接利用し、ドメイン固有の微調整なしでリッチで多段階な高レベル表現を可能にする。本研究は,視覚基盤モデルエンコーダが自然画像に基づいて事前訓練され,医用画像解析タスクに効果的に応用できる可能性を強調した。
論文参考訳（メタデータ） (2025-07-24T14:55:33Z)
Comparison of Autoencoders for tokenization of ASL datasets [0.0]
本研究では,ASL画像データセットのためのエンコーダ・デコーダアーキテクチャの開発と評価に焦点をあてる。フィードフォワードオートエンコーダ、畳み込みオートエンコーダ、拡散オートエンコーダの3つのアプローチを比較した。 Diffusion Autoencoderは他より優れており、最小平均二乗誤差(MSE)と最高平均オピニオンスコア(MOS)を達成する。
論文参考訳（メタデータ） (2025-01-12T21:39:06Z)
DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [54.139923409101044]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文参考訳（メタデータ） (2024-05-30T12:32:35Z)
Large Multi-modality Model Assisted AI-Generated Image Quality Assessment [53.182136445844904]
本稿では,AI生成画像品質評価モデル(MA-AGIQA)を提案する。セマンティックインフォームドガイダンスを使用して意味情報を感知し、慎重に設計されたテキストプロンプトを通してセマンティックベクターを抽出する。最先端のパフォーマンスを実現し、AI生成画像の品質を評価する上で優れた一般化能力を示す。
論文参考訳（メタデータ） (2024-04-27T02:40:36Z)
Transformer-based No-Reference Image Quality Assessment via Supervised Contrastive Learning [36.695247860715874]
本稿では,新しいコントラスト学習 (Contrastive Learning, SCL) と NR-IQA モデル SaTQA を提案する。まず、SCLによる大規模合成データセット上にモデルをトレーニングし、様々な歪みタイプとレベルの画像の劣化特徴を抽出する。画像から歪み情報を抽出するために,CNNインダクティブバイアスとTransformerの長期依存性モデリング機能を組み合わせることで,マルチストリームブロック(MSB)を組み込んだバックボーンネットワークを提案する。 7つの標準IQAデータセットの実験結果から、SaTQAは合成データセットと認証データセットの両方において最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2023-12-12T06:01:41Z)
Dual Associated Encoder for Face Restoration [68.49568459672076]
低品質(LQ)画像から顔の詳細を復元するために,DAEFRという新しいデュアルブランチフレームワークを提案する。提案手法では,LQ入力から重要な情報を抽出する補助的なLQ分岐を導入する。合成と実世界の両方のデータセットに対するDAEFRの有効性を評価する。
論文参考訳（メタデータ） (2023-08-14T17:58:33Z)
An Image captioning algorithm based on the Hybrid Deep Learning Technique (CNN+GRU) [0.0]
本稿では,CNN-GRUエンコーダデコーダのキャプション・ツー・イメージ・コンストラクタ用デコーダフレームワークを提案する。意味的なコンテキストと時間の複雑さを考慮に入れます。提案モデルでは,画像キャプションのための最先端のLSTM-A5モデルよりも,時間的複雑性と精度が優れている。
論文参考訳（メタデータ） (2023-01-06T10:00:06Z)
Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文参考訳（メタデータ） (2021-10-25T21:01:00Z)
Neural Distributed Source Coding [59.630059301226474]
相関構造に依存せず,高次元までスケール可能な損失DSCのためのフレームワークを提案する。提案手法は,複数のデータセット上で評価し,複雑な相関関係と最先端PSNRを扱えることを示す。
論文参考訳（メタデータ） (2021-06-05T04:50:43Z)
Hierarchical Variational Autoencoder for Visual Counterfactuals [79.86967775454316]
条件変量オート(VAE)は、説明可能な人工知能(XAI)ツールとして注目されている。本稿では, 後部の効果がいかに緩和され, 対物的効果が成功するかを示す。本稿では,アプリケーション内の分類器を視覚的に監査できる階層型VAEについて紹介する。
論文参考訳（メタデータ） (2021-02-01T14:07:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。