論文の概要: TDMD: A Database for Dynamic Color Mesh Subjective and Objective Quality
Explorations
- arxiv url: http://arxiv.org/abs/2308.01499v1
- Date: Thu, 3 Aug 2023 01:50:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 15:26:06.227813
- Title: TDMD: A Database for Dynamic Color Mesh Subjective and Objective Quality
Explorations
- Title(参考訳): TDMD:動的カラーメッシュの主観的および客観的品質探索のためのデータベース
- Authors: Qi Yang, Joel Jung, Timon Deschamps, Xiaozhong Xu, and Shan Liu
- Abstract要約: 私たちは8つの参照DCMオブジェクトと6つの典型的な歪みを持つTencent-Dynamic Color Mesh Database(TDMD)を作成します。
その結果,303個のDCMサンプルが平均スコアで歪んだ結果,大規模な主観評価実験を行った。
TDMDでは,画像ベース,ポイントベース,ビデオベースなど,最先端の客観的指標を3種類評価する。
- 参考スコア(独自算出の注目度): 20.62957719513793
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic colored meshes (DCM) are widely used in various applications;
however, these meshes may undergo different processes, such as compression or
transmission, which can distort them and degrade their quality. To facilitate
the development of objective metrics for DCMs and study the influence of
typical distortions on their perception, we create the Tencent - dynamic
colored mesh database (TDMD) containing eight reference DCM objects with six
typical distortions. Using processed video sequences (PVS) derived from the
DCM, we have conducted a large-scale subjective experiment that resulted in 303
distorted DCM samples with mean opinion scores, making the TDMD the largest
available DCM database to our knowledge. This database enabled us to study the
impact of different types of distortion on human perception and offer
recommendations for DCM compression and related tasks. Additionally, we have
evaluated three types of state-of-the-art objective metrics on the TDMD,
including image-based, point-based, and video-based metrics, on the TDMD. Our
experimental results highlight the strengths and weaknesses of each metric, and
we provide suggestions about the selection of metrics in practical DCM
applications. The TDMD will be made publicly available at the following
location: https://multimedia.tencent.com/resources/tdmd.
- Abstract(参考訳): ダイナミックカラーメッシュ(dcm)は様々な用途で広く使われているが、圧縮や伝達などの異なるプロセスを経て、それらを歪め、品質を低下させることがある。
DCMの客観的指標の開発を容易にし、典型的な歪みが知覚に与える影響を研究するために、典型的歪みを6つ含む8つの参照DCMオブジェクトを含むTencent-Dynamic Color Mesh Database(TDMD)を作成する。
DCMから派生したプロセッシングビデオシーケンス(PVS)を用いて大規模な主観的実験を行い、303個の歪みDCMサンプルを平均評価スコアで分析し、TDMDが我々の知る限り最大のDCMデータベースとなった。
本データベースは,異なる種類の歪みが人間の知覚に与える影響を調査し,DCM圧縮および関連タスクの推奨を行う。
さらに,TDMDでは画像ベース,ポイントベース,ビデオベースなど,最先端の客観的指標を3種類評価した。
実験結果は,それぞれの指標の長所と短所を強調し,実用的DCMアプリケーションにおけるメトリクスの選択について提案する。
TDMDは以下の場所で公開される。 https://multimedia.tencent.com/resources/tdmd。
関連論文リスト
- Enhancing Angular Resolution via Directionality Encoding and Geometric Constraints in Brain Diffusion Tensor Imaging [70.66500060987312]
拡散強調画像(DWI)は、水分子の拡散率に感応した磁気共鳴イメージング(MRI)の一種である。
本研究はDirGeo-DTIを提案する。DirGeo-DTIは、勾配方向の最小理論数(6)で得られたDWIの集合からでも、信頼できるDTIメトリクスを推定する深層学習に基づく手法である。
論文 参考訳(メタデータ) (2024-09-11T11:12:26Z) - Med-MoE: Mixture of Domain-Specific Experts for Lightweight Medical Vision-Language Models [17.643421997037514]
差別的, 生成的両マルチモーダル医療課題に対処する新しい枠組みを提案する。
Med-MoEの学習は、マルチモーダル医療アライメント、命令チューニングとルーティング、ドメイン固有のMoEチューニングの3つのステップで構成されている。
我々のモデルは最先端のベースラインに匹敵する性能を達成できる。
論文 参考訳(メタデータ) (2024-04-16T02:35:17Z) - Images in Discrete Choice Modeling: Addressing Data Isomorphism in
Multi-Modality Inputs [77.54052164713394]
本稿では,離散選択モデリング(DCM)と機械学習の交わりについて考察する。
本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。
論文 参考訳(メタデータ) (2023-12-22T14:33:54Z) - A New Benchmark and Model for Challenging Image Manipulation Detection [20.324623756176674]
本稿では,編集ベースおよび圧縮ベースIMD手法の評価を行うための,CIMD(Challenging Image Manipulation Detection)ベンチマークデータセットを提案する。
データセットのイメージは手動で撮影され、高品質なアノテーションで改ざんされた。
さらに,HRNetに基づく新たな2分岐ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2023-11-23T22:27:31Z) - SAM-Med3D: Towards General-purpose Segmentation Models for Volumetric Medical Images [35.83393121891959]
ボリューム医療画像の汎用セグメンテーションのためのSAM-Med3Dを提案する。
SAM-Med3Dは様々な解剖学的構造と病変を正確に分類することができる。
提案手法は,医療資源を多用した汎用医療AIの開発に活用できることを実証するものである。
論文 参考訳(メタデータ) (2023-10-23T17:57:36Z) - MedAugment: Universal Automatic Data Augmentation Plug-in for Medical Image Analysis [9.724228319915609]
データ拡張(DA)は、データ不足を軽減するためにコンピュータビジョンで広く活用されている。
医学画像解析(MIA)におけるDAは、複数の課題に直面している。
我々はMedAugmentと呼ばれる効率的かつ効果的な自動DA手法を提案する。
論文 参考訳(メタデータ) (2023-06-30T08:22:48Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - BMAD: Benchmarks for Medical Anomaly Detection [51.22159321912891]
異常検出(AD)は、機械学習とコンピュータビジョンの基本的な研究課題である。
医用画像では、ADはまれな疾患や病態を示す可能性のある異常の検出と診断に特に重要である。
医用画像の異常検出方法を評価するための総合評価ベンチマークを導入する。
論文 参考訳(メタデータ) (2023-06-20T20:23:46Z) - DDH-QA: A Dynamic Digital Humans Quality Assessment Database [55.69700918818879]
多様な動作内容と複数の歪みを有する大規模デジタル人文品質評価データベースを構築した。
DDHを駆動するために10種類の共通運動が使用され、最後に合計800個のDDHが生成される。
論文 参考訳(メタデータ) (2022-12-24T13:35:31Z) - "My nose is running.""Are you also coughing?": Building A Medical
Diagnosis Agent with Interpretable Inquiry Logics [80.55587329326046]
本稿では,DSMDの対話マネージャを実装するための,より解釈可能な意思決定プロセスを提案する。
推論を行うために、非常に透明なコンポーネントを持つモデルを考案する。
実験の結果,診断精度は7.7%,10.0%,3.0%向上した。
論文 参考訳(メタデータ) (2022-04-29T09:02:23Z) - Bridging 2D and 3D Segmentation Networks for Computation Efficient
Volumetric Medical Image Segmentation: An Empirical Study of 2.5D Solutions [8.780734566934902]
深層畳み込みニューラルネットワークは、医用画像セグメンテーションにおいて大きな成功を収めている。
自然画像のセグメンテーションとは異なり、MRIやCTのようなほとんどの医療画像は体積データである。
3D CNNは推論時間とコストに悩まされ、さらなる臨床応用を妨げる。
計算コストの少ない容積空間情報を利用するために,多くの2.5Dセグメンテーション法が提案されている。
論文 参考訳(メタデータ) (2020-10-13T04:12:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。