論文の概要: Apples and Oranges? Assessing Image Quality over Content Recognition
- arxiv url: http://arxiv.org/abs/2301.09190v1
- Date: Sun, 22 Jan 2023 19:51:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 14:37:42.690254
- Title: Apples and Oranges? Assessing Image Quality over Content Recognition
- Title(参考訳): リンゴとオレンジ?
コンテンツ認識による画質評価
- Authors: Junyong You
- Abstract要約: 本稿では,2つのタスクがマルチタスク学習方式で実行可能であるかを検討する。
視覚的注意とコントラスト感度のメカニズムをシミュレートするために,逐次的空間チャネルアテンションモジュールを提案する。
実験により,提案した一様モデルが品質評価とコンテンツ認識の両タスクにおいて有望な性能を達成できることが実証された。
- 参考スコア(独自算出の注目度): 5.584060970507507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image recognition and quality assessment are two important viewing tasks,
while potentially following different visual mechanisms. This paper
investigates if the two tasks can be performed in a multitask learning manner.
A sequential spatial-channel attention module is proposed to simulate the
visual attention and contrast sensitivity mechanisms that are crucial for
content recognition and quality assessment. Spatial attention is shared between
content recognition and quality assessment, while channel attention is solely
for quality assessment. Such attention module is integrated into Transformer to
build a uniform model for the two viewing tasks. The experimental results have
demonstrated that the proposed uniform model can achieve promising performance
for both quality assessment and content recognition tasks.
- Abstract(参考訳): 画像認識と品質評価は2つの重要な課題であり、異なる視覚メカニズムに従う可能性がある。
本稿では,2つのタスクがマルチタスク学習方式で実行可能であるかを検討する。
コンテンツ認識と品質評価に不可欠な視覚的注意とコントラスト感度のメカニズムをシミュレートするために,逐次的空間チャネルアテンションモジュールを提案する。
空間的注意はコンテンツ認識と品質評価の間で共有され、チャンネルの注意は品質評価専用である。
このような注目モジュールはTransformerに統合され、2つのビュータスクの統一モデルを構築する。
実験により,提案した一様モデルが品質評価とコンテンツ認識の両タスクにおいて有望な性能を達成できることが実証された。
関連論文リスト
- On the Effects of Image Quality Degradation on Minutiae- and Ridge-Based
Automatic Fingerprint Recognition [61.81926091202142]
画像品質の異なるミツイア情報とリッジ情報に基づく2つの指紋照合器の性能について検討した。
リッジベースシステムは、多くの異なる画像品質基準のために、ミヌチアベースシステムよりも画像品質劣化に対してより堅牢であることが判明した。
論文 参考訳(メタデータ) (2022-07-12T10:28:36Z) - Deep Neural Network for Blind Visual Quality Assessment of 4K Content [37.70643043547502]
既存のブラインド画像品質評価法(BIQA)は、オリジナルおよびアップスケールの4Kコンテンツには適していない。
本研究では、4Kコンテンツに対する深層学習に基づくBIQAモデルを提案する。
提案手法はマルチタスク学習方式を用いて学習し,分類タスクと回帰タスクの損失のバランスをとる不確実性原理を導入する。
論文 参考訳(メタデータ) (2022-06-09T09:10:54Z) - Quality-Aware Multimodal Biometric Recognition [30.322429033099688]
弱教師付き方式で評価された品質スコアを重み付けすることで,入力モダリティの表現を融合する品質認識フレームワークを開発する。
このフレームワークは2つの融合ブロックを利用し、それぞれが品質認識ネットワークと集約ネットワークのセットで表される。
顔,虹彩,指紋モダリティからなる3つのマルチモーダルデータセットについて検討し,その性能評価を行った。
論文 参考訳(メタデータ) (2021-12-10T20:48:55Z) - Self-Regulated Learning for Egocentric Video Activity Anticipation [147.9783215348252]
自己制御学習(SRL)は、中間表現を連続的に制御し、現在のタイムスタンプのフレームにおける新しい情報を強調する表現を作り出すことを目的としている。
SRLは2つのエゴセントリックなビデオデータセットと2つの第三者のビデオデータセットにおいて、既存の最先端技術よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-11-23T03:29:18Z) - A Multi-task convolutional neural network for blind stereoscopic image
quality assessment using naturalness analysis [9.168683125043936]
本稿では,新しいマルチタスク深層学習手法を用いた視線立体視画像品質評価(NR-SIQA)の問題に対処する。
本稿では,これらの特徴を統合して,畳み込みニューラルネットワークによる参照のない立体画像の品質を推定する。
本手法は,ステレオ画像に適応した自然度解析に基づく特徴量予測と,その品質予測の2つのタスクを主課題とする。
論文 参考訳(メタデータ) (2021-06-17T08:13:51Z) - More Than Just Attention: Learning Cross-Modal Attentions with
Contrastive Constraints [63.08768589044052]
本稿では,コントラストコンテンツリソーシング (CCR) とコントラストコンテンツスワッピング (CCS) の制約を提案する。
CCRとCCSの制約は、明示的な注意アノテーションを必要とせず、対照的な学習方法で注意モデルのトレーニングを監督する。
Flickr30kとMS-COCOのデータセットの実験は、これらの注意制約を2つの最先端の注意ベースモデルに統合することで、モデルのパフォーマンスが向上することを示した。
論文 参考訳(メタデータ) (2021-05-20T08:48:10Z) - Audiovisual Highlight Detection in Videos [78.26206014711552]
本研究は,タスク上の単一特徴の有効性研究と,一つの特徴を一度に残すアブレーション研究の2つの実験の結果である。
映像要約作業では,視覚的特徴がほとんどの情報を持ち,視覚的特徴を含む視覚的特徴が視覚のみの情報よりも向上することが示唆された。
その結果,映像要約タスクからハイライト検出タスクに特化して訓練されたモデルに知識を伝達できることが示唆された。
論文 参考訳(メタデータ) (2021-02-11T02:24:00Z) - Object-QA: Towards High Reliable Object Quality Assessment [71.71188284059203]
オブジェクト認識アプリケーションでは、オブジェクトイメージは通常、異なる品質レベルで表示される。
本稿では,オブジェクト画像の信頼性の高い品質スコアを評価するために,Object-QAという効果的手法を提案する。
論文 参考訳(メタデータ) (2020-05-27T01:46:58Z) - Exploring Self-attention for Image Recognition [151.12000247183636]
画像認識における自己注意の2つの形態について考察する。
ひとつは、標準的なドット積の注意を一般化する、ペアワイズな自己注意である。
もう1つはパッチワイドな自己認識であり、畳み込みよりも厳格に強力です。
論文 参考訳(メタデータ) (2020-04-28T16:01:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。