論文の概要: Advancing Zero-Shot Digital Human Quality Assessment through
Text-Prompted Evaluation
- arxiv url: http://arxiv.org/abs/2307.02808v1
- Date: Thu, 6 Jul 2023 06:55:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 14:52:43.671042
- Title: Advancing Zero-Shot Digital Human Quality Assessment through
Text-Prompted Evaluation
- Title(参考訳): テキストプロンプト評価によるゼロショットデジタル品質評価の改善
- Authors: Zicheng Zhang, Wei Sun, Yingjie Zhou, Haoning Wu, Chunyi Li, Xiongkuo
Min, Xiaohong Liu, Guangtao Zhai, Weisi Lin
- Abstract要約: SJTU-H3Dは、フルボディのデジタル人間向けに設計された主観的品質評価データベースである。
高品質なデジタル人間40人と、7種類の歪みで生成された1,120個のラベル付き歪曲した人物からなる。
- 参考スコア(独自算出の注目度): 60.873105678086404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital humans have witnessed extensive applications in various domains,
necessitating related quality assessment studies. However, there is a lack of
comprehensive digital human quality assessment (DHQA) databases. To address
this gap, we propose SJTU-H3D, a subjective quality assessment database
specifically designed for full-body digital humans. It comprises 40
high-quality reference digital humans and 1,120 labeled distorted counterparts
generated with seven types of distortions. The SJTU-H3D database can serve as a
benchmark for DHQA research, allowing evaluation and refinement of processing
algorithms. Further, we propose a zero-shot DHQA approach that focuses on
no-reference (NR) scenarios to ensure generalization capabilities while
mitigating database bias. Our method leverages semantic and distortion features
extracted from projections, as well as geometry features derived from the mesh
structure of digital humans. Specifically, we employ the Contrastive
Language-Image Pre-training (CLIP) model to measure semantic affinity and
incorporate the Naturalness Image Quality Evaluator (NIQE) model to capture
low-level distortion information. Additionally, we utilize dihedral angles as
geometry descriptors to extract mesh features. By aggregating these measures,
we introduce the Digital Human Quality Index (DHQI), which demonstrates
significant improvements in zero-shot performance. The DHQI can also serve as a
robust baseline for DHQA tasks, facilitating advancements in the field. The
database and the code are available at https://github.com/zzc-1998/SJTU-H3D.
- Abstract(参考訳): デジタル人間は様々な領域で広範囲の応用を目撃し、関連する品質評価研究を必要としている。
しかし、包括的なデジタル人間質評価(DHQA)データベースは存在しない。
このギャップに対処するため,本研究では,全身デジタル人間を対象とした主観的品質評価データベースsjtu-h3dを提案する。
40人の高品質の基準デジタル人間と、1,120個のラベル付き歪みが7種類の歪みで生成される。
SJTU-H3DデータベースはDHQA研究のベンチマークとして機能し、処理アルゴリズムの評価と改善を可能にする。
さらに、データベースバイアスを緩和しながら一般化機能を確保するため、ノン参照(NR)シナリオに焦点を当てたゼロショットDHQAアプローチを提案する。
提案手法は,投影から抽出した意味的・歪み的特徴と,デジタル人間のメッシュ構造から抽出した幾何学的特徴を利用する。
具体的には,コントラスト言語-画像事前学習(clip)モデルを用いて意味親和性を測定し,自然性画像品質評価器(niqe)モデルを用いて低レベルの歪み情報を取り込む。
さらに,ディヘドラル角度を幾何ディスクリプタとしてメッシュ特徴を抽出する。
これらの指標を集約することにより、ゼロショット性能の大幅な改善を示すDHQI(Digital Human Quality Index)を導入する。
DHQIはDHQAタスクの堅牢なベースラインとしても機能し、この分野の進歩を促進する。
データベースとコードはhttps://github.com/zzc-1998/SJTU-H3Dで入手できる。
関連論文リスト
- A No-Reference Quality Assessment Method for Digital Human Head [56.17852258306602]
我々は、デジタルヒューマン品質評価(DHQA)を扱うトランスフォーマーに基づく新しいノリフレクション(NR)手法を開発した。
具体的には、デジタル人間の前方2次元投影を入力として描画し、特徴抽出に視覚変換器(ViT)を用いる。
次に,歪み型を共同分類し,デジタル人間の知覚品質レベルを予測するマルチタスクモジュールを設計する。
論文 参考訳(メタデータ) (2023-10-25T16:01:05Z) - Geometry-Aware Video Quality Assessment for Dynamic Digital Human [56.17852258306602]
DDH-QAチャレンジのための新しい非参照(NR)幾何対応ビデオ品質評価手法を提案する。
提案手法はDDH-QAデータベース上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-24T16:34:03Z) - AGIQA-3K: An Open Database for AI-Generated Image Quality Assessment [62.8834581626703]
我々はこれまでに最も包括的な主観的品質データベース AGIQA-3K を構築している。
このデータベース上でベンチマーク実験を行い、現在の画像品質評価(IQA)モデルと人間の知覚との整合性を評価する。
我々は、AGIQA-3Kの微粒な主観的スコアが、その後のAGI品質モデルにヒトの主観的知覚機構に適合するよう促すと信じている。
論文 参考訳(メタデータ) (2023-06-07T18:28:21Z) - DDH-QA: A Dynamic Digital Humans Quality Assessment Database [55.69700918818879]
多様な動作内容と複数の歪みを有する大規模デジタル人文品質評価データベースを構築した。
DDHを駆動するために10種類の共通運動が使用され、最後に合計800個のDDHが生成される。
論文 参考訳(メタデータ) (2022-12-24T13:35:31Z) - Perceptual Quality Assessment for Digital Human Heads [35.801468849447126]
3次元走査型デジタルヒューマンヘッド(DHHs)のための最初の大規模品質評価データベースを提案する。
構築されたデータベースは、55の参照DHHと1,540の歪んだDHHと、主観的知覚評価からなる。
実験の結果,本手法は主要なFR測定値の最先端性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-09-20T06:02:57Z) - Blind Quality Assessment of 3D Dense Point Clouds with Structure Guided
Resampling [71.68672977990403]
本研究では,3次元高密度点雲の知覚的視覚的品質を自動評価するために,Structure Guided Resampling (SGR) を用いた客観的点雲品質指標を提案する。
提案するSGRは,参照情報の不要な汎用ブラインド品質評価手法である。
論文 参考訳(メタデータ) (2022-08-31T02:42:55Z) - No-Reference Quality Assessment for Colored Point Cloud and Mesh Based
on Natural Scene Statistics [36.017914479449864]
色付き3次元モデルに対するNASに基づくノン参照品質評価指標を提案する。
本手法は主に,カラーポイントクラウド品質評価データベース (SJTU-PCQA) とカラーメッシュ品質評価データベース (CMDM) で検証されている。
論文 参考訳(メタデータ) (2021-07-05T14:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。