Fugu-MT 論文翻訳(概要): Bridging the Gap Between Saliency Prediction and Image Quality Assessment

論文の概要: Bridging the Gap Between Saliency Prediction and Image Quality Assessment

arxiv url: http://arxiv.org/abs/2405.04997v1
Date: Wed, 8 May 2024 12:04:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-09 14:35:00.679577
Title: Bridging the Gap Between Saliency Prediction and Image Quality Assessment
Title（参考訳）: 塩分濃度予測と画像品質評価のギャップを埋める
Authors: Kirillov Alexey, Andrey Moskalenko, Dmitriy Vatolin,
Abstract要約: 深部神経モデルでは画像品質評価(IQA)が大幅に進歩している我々はIQAとSaliency Predictionタスクの関係を明らかにする実証的研究を行った。本稿では,サリエンシ対応圧縮画像の新たなSACIDデータセットを導入し,従来のIQA法とニューラルベースIQA法の大規模比較を行う。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Over the past few years, deep neural models have made considerable advances in image quality assessment (IQA). However, the underlying reasons for their success remain unclear, owing to the complex nature of deep neural networks. IQA aims to describe how the human visual system (HVS) works and to create its efficient approximations. On the other hand, Saliency Prediction task aims to emulate HVS via determining areas of visual interest. Thus, we believe that saliency plays a crucial role in human perception. In this work, we conduct an empirical study that reveals the relation between IQA and Saliency Prediction tasks, demonstrating that the former incorporates knowledge of the latter. Moreover, we introduce a novel SACID dataset of saliency-aware compressed images and conduct a large-scale comparison of classic and neural-based IQA methods. All supplementary code and data will be available at the time of publication.
Abstract（参考訳）: 過去数年間、ディープ・ニューラル・モデルは画像品質評価(IQA)に大きな進歩を遂げてきた。しかし、ディープニューラルネットワークの複雑な性質のため、その成功の根底にある理由はいまだ不明である。 IQAは、人間の視覚システム(HVS)がどのように機能するかを説明し、その効率的な近似を作成することを目的としている。一方、Saliency Prediction taskは、視覚的関心領域を決定することで、HVSをエミュレートすることを目的としている。したがって、サリエンシは人間の知覚において重要な役割を担っていると信じている。本研究では、IQAとSaliency Predictionタスクの関係を明らかにする実証的研究を行い、後者の知識を前者が取り入れたことを示す。さらに、サリエンシ対応圧縮画像の新しいSACIDデータセットを導入し、古典的およびニューラルベースIQA法を大規模に比較する。追加のコードとデータは、公開時点で利用可能になる。

関連論文リスト

WhiSQA: Non-Intrusive Speech Quality Prediction Using Whisper Encoder Features [17.29709755230273]
ASRモデルから抽出した特徴表現に基づいて,新規でロバストなSQ予測器を提案する。提案手法は,NISQA テストセットの最近の手法よりも,ヒトの MOS 評価との相関性が高い。
論文参考訳（メタデータ） (2025-08-04T09:01:07Z)
TRIQA: Image Quality Assessment by Contrastive Pretraining on Ordered Distortion Triplets [31.2422359004089]
No-Reference (NR) IQA は参照画像がないため、特に困難である。本稿では,限られた数の参照コンテンツ画像を用いて,カスタムデータセットを構築する新しい手法を提案する。対照的な三重項学習を用いて品質認識モデルを訓練し、より少ないサンプルで効率的なトレーニングを可能にする。
論文参考訳（メタデータ） (2025-07-16T23:43:12Z)
AI-generated Image Quality Assessment in Visual Communication [72.11144790293086]
AIGI-VCは、視覚コミュニケーションにおけるAI生成画像の品質評価データベースである。データセットは、14の広告トピックと8つの感情タイプにまたがる2500のイメージで構成されている。粗い人間の嗜好アノテーションときめ細かい嗜好記述を提供し、選好予測、解釈、推論におけるIQAメソッドの能力をベンチマークする。
論文参考訳（メタデータ） (2024-12-20T08:47:07Z)
Sliced Maximal Information Coefficient: A Training-Free Approach for Image Quality Assessment Enhancement [12.628718661568048]
我々は,人間の品質評価の過程を模倣する,一般化された視覚的注意度推定戦略を検討することを目的とする。特に、劣化画像と参照画像の統計的依存性を測定することによって、人間の注意生成をモデル化する。既存のIQAモデルのアテンションモジュールを組み込んだ場合、既存のIQAモデルの性能を一貫して改善できることを示す実験結果が得られた。
論文参考訳（メタデータ） (2024-08-19T11:55:32Z)
Understanding and Evaluating Human Preferences for AI Generated Images with Instruction Tuning [58.41087653543607]
我々はまず,AIGCIQA2023+と呼ばれるAIGIのための画像品質評価(IQA)データベースを構築した。本稿では,AIGIに対する人間の嗜好を評価するためのMINT-IQAモデルを提案する。
論文参考訳（メタデータ） (2024-05-12T17:45:11Z)
Large Multi-modality Model Assisted AI-Generated Image Quality Assessment [53.182136445844904]
本稿では,AI生成画像品質評価モデル(MA-AGIQA)を提案する。セマンティックインフォームドガイダンスを使用して意味情報を感知し、慎重に設計されたテキストプロンプトを通してセマンティックベクターを抽出する。最先端のパフォーマンスを実現し、AI生成画像の品質を評価する上で優れた一般化能力を示す。
論文参考訳（メタデータ） (2024-04-27T02:40:36Z)
Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文参考訳（メタデータ） (2024-04-23T11:45:32Z)
Perceptual Attacks of No-Reference Image Quality Models with Human-in-the-Loop [113.75573175709573]
NR-IQAモデルの知覚的堅牢性を調べるための最初の試みの1つを行う。我々は,4つの完全参照IQAモデルの下で,知識駆動のNR-IQA法とデータ駆動のNR-IQA法を検証した。 4つのNR-IQAモデルは全て、提案した知覚的攻撃に対して脆弱であることがわかった。
論文参考訳（メタデータ） (2022-10-03T13:47:16Z)
Going the Extra Mile in Face Image Quality Assessment: A Novel Database and Model [42.05084438912876]
現在までに開発された最大のアノテートIQAデータベースについて紹介する。本稿では,顔画像の品質を正確に予測する新しいディープラーニングモデルを提案する。
論文参考訳（メタデータ） (2022-07-11T14:28:18Z)
Continual Learning for Blind Image Quality Assessment [80.55119990128419]
ブラインド画像品質評価(BIQA)モデルは、サブポピュレーションシフトに継続的に適応できない。最近の研究では、利用可能なすべての人間評価のIQAデータセットの組み合わせに関するBIQAメソッドのトレーニングが推奨されている。モデルがIQAデータセットのストリームから継続的に学習するBIQAの継続的学習を策定する。
論文参考訳（メタデータ） (2021-02-19T03:07:01Z)
Neuro-Symbolic Visual Reasoning: Disentangling "Visual" from "Reasoning" [49.76230210108583]
本稿では,視覚的質問応答(VQA)の推論的側面をその知覚から分離し,評価する枠組みを提案する。また,不完全な知覚においても,モデルが推論問題に答えられるような,新しいトップダウンキャリブレーション手法を提案する。難易度の高いGQAデータセットでは、このフレームワークがよく知られたVQAモデル間の深い非絡み合いの比較に使用される。
論文参考訳（メタデータ） (2020-06-20T08:48:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。