論文の概要: Image quality prediction using synthetic and natural codebooks:
comparative results
- arxiv url: http://arxiv.org/abs/2212.10319v2
- Date: Wed, 21 Dec 2022 14:26:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 14:54:03.600635
- Title: Image quality prediction using synthetic and natural codebooks:
comparative results
- Title(参考訳): 合成及び自然なコードブックを用いた画像品質予測:比較結果
- Authors: Maxim Koroteev, Kirill Aistov, Valeriy Berezovskiy, Pavel Frolov
- Abstract要約: コードブック構築手法を解析し,その修正を提案する。
コードブック構築のための合成画像を使用すると,品質評価の精度が向上することが実証された。
- 参考スコア(独自算出の注目度): 3.058685580689605
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We investigate a model for image/video quality assessment based on building a
set of codevectors representing in a sense some basic properties of images,
similar to well-known CORNIA model. We analyze the codebook building method and
propose some modifications for it. Also the algorithm is investigated from the
point of inference time reduction. Both natural and synthetic images are used
for building codebooks and some analysis of synthetic images used for codebooks
is provided. It is demonstrated the results on quality assessment may be
improves with the use if synthetic images for codebook construction. We also
demonstrate regimes of the algorithm in which real time execution on CPU is
possible for sufficiently high correlations with mean opinion score (MOS).
Various pooling strategies are considered as well as the problem of metric
sensitivity to bitrate.
- Abstract(参考訳): 本研究では,画像の基本的な特性を表わすコーデクタのセットを構築することにより,画像/映像品質評価のためのモデルについて検討する。
コードブック構築手法を解析し,その修正を提案する。
また,推定時間短縮の観点から,このアルゴリズムについて検討した。
コードブックの構築には自然画像と合成画像の両方が使用され、コードブックに使用される合成画像のいくつかの分析が提供される。
コードブック構築のための合成画像を用いた場合,品質評価の結果は改善される可能性がある。
また,CPU上でのリアルタイム実行が,平均世論スコア(MOS)と十分に高い相関関係を持つアルゴリズムの体系を実証する。
様々なプーリング戦略は、ビットレートに対するメトリック感度の問題と同様に考慮される。
関連論文リスト
- Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - A Sanity Check for AI-generated Image Detection [49.08585395873425]
本稿では,AIによる画像検出の課題が解決されたかどうかの検査を行う。
既存の手法の一般化を定量化するために,Chameleonデータセット上で,既製のAI生成画像検出器を9つ評価した。
複数の専門家が同時に視覚的アーチファクトやノイズパターンを抽出するAI生成画像検出装置(AID)を提案する。
論文 参考訳(メタデータ) (2024-06-27T17:59:49Z) - Generalizable Synthetic Image Detection via Language-guided Contrastive
Learning [22.4158195581231]
偽ニュースの拡散や偽のプロフィールの作成などの合成画像の真偽の使用は、画像の真正性に関する重要な懸念を提起する。
本稿では,言語指導によるコントラスト学習と検出問題の新たな定式化による,シンプルで効果的な合成画像検出手法を提案する。
提案したLanguAge-guided SynThEsis Detection (LASTED) モデルでは,画像生成モデルに対する一般化性が大幅に向上していることが示されている。
論文 参考訳(メタデータ) (2023-05-23T08:13:27Z) - Benchmarking Robustness to Text-Guided Corruptions [0.0]
拡散モデルを用いて異なる領域の画像を編集する。
我々は、元のImageNet階層に基づいてプロンプト階層を定義し、異なるドメインで編集を適用する。
畳み込みモデルはトランスフォーマーアーキテクチャよりも堅牢である。
論文 参考訳(メタデータ) (2023-04-06T09:40:02Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - RTIC: Residual Learning for Text and Image Composition using Graph
Convolutional Network [19.017377597937617]
画像検索のための画像とテキストの構成学習について検討する。
本稿では,グラフ畳み込みネットワーク(gcn)と既存の合成手法を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2021-04-07T09:41:52Z) - Swapping Autoencoder for Deep Image Manipulation [94.33114146172606]
画像操作に特化して設計されたディープモデルであるSwapping Autoencoderを提案する。
キーとなるアイデアは、2つの独立したコンポーネントで画像をエンコードし、交換された組み合わせをリアルなイメージにマップするように強制することだ。
複数のデータセットの実験により、我々のモデルはより良い結果が得られ、最近の生成モデルと比較してかなり効率が良いことが示されている。
論文 参考訳(メタデータ) (2020-07-01T17:59:57Z) - Temporal signals to images: Monitoring the condition of industrial
assets with deep learning image processing algorithms [3.9023554886892438]
本稿では,文献に見られる画像符号化手法の信号について概説する。
我々は、大規模なデータセットの変動性に対してより堅牢になるように、元の定式化のいくつかを変更することを提案する。
選択された符号化方法は、Gramian Angular Field、Markov Transition Field、Recurrentence plot、グレイスケールエンコーディング、Spectrogram、 scalogramである。
論文 参考訳(メタデータ) (2020-05-14T14:42:06Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。