論文の概要: Apples and Oranges? Assessing Image Quality over Content Recognition
- arxiv url: http://arxiv.org/abs/2301.09190v1
- Date: Sun, 22 Jan 2023 19:51:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 14:37:42.690254
- Title: Apples and Oranges? Assessing Image Quality over Content Recognition
- Title(参考訳): リンゴとオレンジ?
コンテンツ認識による画質評価
- Authors: Junyong You
- Abstract要約: 本稿では,2つのタスクがマルチタスク学習方式で実行可能であるかを検討する。
視覚的注意とコントラスト感度のメカニズムをシミュレートするために,逐次的空間チャネルアテンションモジュールを提案する。
実験により,提案した一様モデルが品質評価とコンテンツ認識の両タスクにおいて有望な性能を達成できることが実証された。
- 参考スコア(独自算出の注目度): 5.584060970507507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image recognition and quality assessment are two important viewing tasks,
while potentially following different visual mechanisms. This paper
investigates if the two tasks can be performed in a multitask learning manner.
A sequential spatial-channel attention module is proposed to simulate the
visual attention and contrast sensitivity mechanisms that are crucial for
content recognition and quality assessment. Spatial attention is shared between
content recognition and quality assessment, while channel attention is solely
for quality assessment. Such attention module is integrated into Transformer to
build a uniform model for the two viewing tasks. The experimental results have
demonstrated that the proposed uniform model can achieve promising performance
for both quality assessment and content recognition tasks.
- Abstract(参考訳): 画像認識と品質評価は2つの重要な課題であり、異なる視覚メカニズムに従う可能性がある。
本稿では,2つのタスクがマルチタスク学習方式で実行可能であるかを検討する。
コンテンツ認識と品質評価に不可欠な視覚的注意とコントラスト感度のメカニズムをシミュレートするために,逐次的空間チャネルアテンションモジュールを提案する。
空間的注意はコンテンツ認識と品質評価の間で共有され、チャンネルの注意は品質評価専用である。
このような注目モジュールはTransformerに統合され、2つのビュータスクの統一モデルを構築する。
実験により,提案した一様モデルが品質評価とコンテンツ認識の両タスクにおいて有望な性能を達成できることが実証された。
関連論文リスト
- AI-Generated Image Quality Assessment Based on Task-Specific Prompt and Multi-Granularity Similarity [62.00987205438436]
本稿では,TSP-MGSというAIGIの品質評価手法を提案する。
タスク固有のプロンプトを設計し、AIGIとプロンプトの多粒度類似度を測定する。
一般的に使用されるAGIQA-1KとAGIQA-3Kベンチマークの実験は、提案されたTSP-MGSの優位性を示している。
論文 参考訳(メタデータ) (2024-11-25T04:47:53Z) - VQA$^2$: Visual Question Answering for Video Quality Assessment [76.81110038738699]
ビデオ品質アセスメント(VQA)は、低レベルの視覚知覚において古典的な分野である。
画像領域における最近の研究は、視覚質問応答(VQA)が視覚的品質を著しく低レベルに評価できることを示した。
VQA2インストラクションデータセットは,ビデオ品質評価に焦点をあてた最初の視覚的質問応答インストラクションデータセットである。
VQA2シリーズは、ビデオにおける空間的時間的品質の詳細の知覚を高めるために、視覚的および運動的トークンをインターリーブする。
論文 参考訳(メタデータ) (2024-11-06T09:39:52Z) - QPT V2: Masked Image Modeling Advances Visual Scoring [14.494394623916714]
Masked Image Modeling (MIM)は、様々なハイレベルなタスクにおいて注目すべき進歩を遂げた。
本研究は,品質と美学の両面からその能力を検討するために,新しい視点を採っている。
品質・美学評価に統一的なソリューションを提供するMIMに基づく最初の事前学習フレームワークであるQPT V2を提案する。
論文 参考訳(メタデータ) (2024-07-23T14:53:47Z) - Joint Quality Assessment and Example-Guided Image Processing by Disentangling Picture Appearance from Content [30.939589712281684]
ディープラーニングは、スタイル/ドメイン転送、強化/復元、視覚的品質評価といった低レベルの画像処理タスクに影響を与えている。
我々はこの観察を利用して、入力をコンテンツや外観特徴に分解する新しい非絡み合い表現学習法を開発した。
本研究では,DisQUEが品質予測タスクや歪みタイプにまたがって精度を達成できることを示す。
論文 参考訳(メタデータ) (2024-04-20T23:02:57Z) - Blind Image Quality Assessment Using Multi-Stream Architecture with Spatial and Channel Attention [4.983104446206061]
BIQA(Blind Image Quality Assessment)は、画像を自動的に評価する重要な研究分野である。
ほとんどのアルゴリズムは重要な関心領域を強調せずに品質を生成する。
この問題を解決するために,マルチストリーム空間およびチャネルアテンションに基づくアルゴリズムが提案されている。
論文 参考訳(メタデータ) (2023-07-19T09:36:08Z) - Let's ViCE! Mimicking Human Cognitive Behavior in Image Generation
Evaluation [96.74302670358145]
生成/編集された画像と対応するプロンプト/インストラクションの整合性を評価するために,視覚概念評価(ViCE)の自動手法を提案する。
ViCEは、Large Language Models(LLM)とVisual Question Answering(VQA)の強みを統合パイプラインに統合し、品質評価において人間の認知プロセスを再現することを目指している。
論文 参考訳(メタデータ) (2023-07-18T16:33:30Z) - Assessor360: Multi-sequence Network for Blind Omnidirectional Image
Quality Assessment [50.82681686110528]
Blind Omnidirectional Image Quality Assessment (BOIQA)は、全方位画像(ODI)の人間の知覚品質を客観的に評価することを目的としている。
ODIの品質評価は、既存のBOIQAパイプラインがオブザーバのブラウジングプロセスのモデリングを欠いているという事実によって著しく妨げられている。
Assessor360と呼ばれるBOIQAのための新しいマルチシーケンスネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-18T13:55:28Z) - Object-QA: Towards High Reliable Object Quality Assessment [71.71188284059203]
オブジェクト認識アプリケーションでは、オブジェクトイメージは通常、異なる品質レベルで表示される。
本稿では,オブジェクト画像の信頼性の高い品質スコアを評価するために,Object-QAという効果的手法を提案する。
論文 参考訳(メタデータ) (2020-05-27T01:46:58Z) - Exploring Self-attention for Image Recognition [151.12000247183636]
画像認識における自己注意の2つの形態について考察する。
ひとつは、標準的なドット積の注意を一般化する、ペアワイズな自己注意である。
もう1つはパッチワイドな自己認識であり、畳み込みよりも厳格に強力です。
論文 参考訳(メタデータ) (2020-04-28T16:01:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。