論文の概要: Learning Disentangled Representations for Perceptual Point Cloud Quality Assessment via Mutual Information Minimization
- arxiv url: http://arxiv.org/abs/2411.07936v1
- Date: Tue, 12 Nov 2024 17:05:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-13 13:21:10.027360
- Title: Learning Disentangled Representations for Perceptual Point Cloud Quality Assessment via Mutual Information Minimization
- Title(参考訳): 相互情報最小化による知覚点雲質評価のための遠交表現の学習
- Authors: Ziyu Shan, Yujie Zhang, Yipeng Liu, Yiling Xu,
- Abstract要約: No-Reference Point Cloud Quality Assessment (NR-PCQA)は、ポイントクラウドの人間の知覚的品質を客観的に評価することを目的としている。
NR-PCQAのための新しい非交叉表現学習フレームワークであるDisPAを提案する。
複数のPCQAデータセットにおいて、DisPAは最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 26.224150625323812
- License:
- Abstract: No-Reference Point Cloud Quality Assessment (NR-PCQA) aims to objectively assess the human perceptual quality of point clouds without relying on pristine-quality point clouds for reference. It is becoming increasingly significant with the rapid advancement of immersive media applications such as virtual reality (VR) and augmented reality (AR). However, current NR-PCQA models attempt to indiscriminately learn point cloud content and distortion representations within a single network, overlooking their distinct contributions to quality information. To address this issue, we propose DisPA, a novel disentangled representation learning framework for NR-PCQA. The framework trains a dual-branch disentanglement network to minimize mutual information (MI) between representations of point cloud content and distortion. Specifically, to fully disentangle representations, the two branches adopt different philosophies: the content-aware encoder is pretrained by a masked auto-encoding strategy, which can allow the encoder to capture semantic information from rendered images of distorted point clouds; the distortion-aware encoder takes a mini-patch map as input, which forces the encoder to focus on low-level distortion patterns. Furthermore, we utilize an MI estimator to estimate the tight upper bound of the actual MI and further minimize it to achieve explicit representation disentanglement. Extensive experimental results demonstrate that DisPA outperforms state-of-the-art methods on multiple PCQA datasets.
- Abstract(参考訳): No-Reference Point Cloud Quality Assessment (NR-PCQA) は、プリスタン品質のポイントクラウドを参考にすることなく、ポイントクラウドの人間の知覚的品質を客観的に評価することを目的としている。
仮想現実(VR)や拡張現実(AR)といった没入型メディアアプリケーションの急速な進歩に伴い、ますます重要になっている。
しかし、現在のNR-PCQAモデルは、ポイントクラウドの内容と歪み表現を1つのネットワーク内で無差別に学習し、品質情報に対する個々の貢献を見越そうとしている。
そこで本研究では,NR-PCQAのための新しい非絡み合い表現学習フレームワークであるDisPAを提案する。
このフレームワークは、点雲の内容と歪みの表現の間の相互情報(MI)を最小限に抑えるために、デュアルブランチ・アンタングルメントネットワークを訓練する。
コンテント対応エンコーダはマスク付き自動エンコーダによって事前訓練され、エンコーダは歪んだ点雲の描画画像から意味情報をキャプチャし、歪み対応エンコーダはミニパッチマップを入力として取り、エンコーダは低レベルの歪みパターンに集中する。
さらに,MI推定器を用いて実際のMIの厳密な上界を推定し,さらに最小化して明示的表現の不整合を実現する。
複数のPCQAデータセット上で、DisPAは最先端の手法よりも優れていた。
関連論文リスト
- Contrastive Pre-Training with Multi-View Fusion for No-Reference Point Cloud Quality Assessment [49.36799270585947]
No-Reference Point Cloud Quality Assessment (NR-PCQA) は、歪んだ点雲の知覚的品質を、参照なしで自動的に評価することを目的としている。
我々は,PCQA(CoPA)に適した新しいコントラスト付き事前学習フレームワークを提案する。
提案手法は,最新のPCQA手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2024-03-15T07:16:07Z) - PAME: Self-Supervised Masked Autoencoder for No-Reference Point Cloud Quality Assessment [34.256276774430575]
no-reference point cloud quality Assessment (NR-PCQA) は、参照なしでポイントクラウドの知覚的品質を自動的に予測することを目的としている。
本稿では,マスク付きオートエンコーダ(PAME)を用いた自己教師型事前学習フレームワークを提案する。
提案手法は,予測精度と一般化性の観点から,最新のNR-PCQA法よりも高い性能を示す。
論文 参考訳(メタデータ) (2024-03-15T07:01:33Z) - Simple Baselines for Projection-based Full-reference and No-reference
Point Cloud Quality Assessment [60.2709006613171]
投影型ポイントクラウド品質評価(PCQA)のための簡易ベースラインを提案する。
我々は、全参照(FR)タスクと非参照(NR)PCQAタスクの両方に対して、点雲から共通立方体状の投影プロセスによって得られる多重射影を用いる。
ICIP 2023 PCVQA Challengeに参加して,5トラック中4トラックで首位を獲得した。
論文 参考訳(メタデータ) (2023-10-26T04:42:57Z) - TCDM: Transformational Complexity Based Distortion Metric for Perceptual
Point Cloud Quality Assessment [24.936061591860838]
客観的クラウド品質評価(PCQA)研究の目標は、ポイントクラウド品質を一貫した方法で測定するメトリクスを開発することである。
歪んだ点雲を基準に戻す複雑さを計測することで点雲の質を評価する。
提案手法の有効性を,5つのパブリッククラウド品質評価データベース上で行った広範囲な実験を通じて評価した。
論文 参考訳(メタデータ) (2022-10-10T13:20:51Z) - PointCAT: Contrastive Adversarial Training for Robust Point Cloud
Recognition [111.55944556661626]
我々は、ポイントクラウド認識モデルの堅牢性を高めるために、PointCAT(Point-Cloud Contrastive Adversarial Training)を提案する。
我々は、教師付きコントラスト損失を利用して、認識モデルにより抽出された超球面特徴のアライメントと均一性を促進する。
より難易度の高い点雲を実現するため,認識モデルと逆向きにノイズ発生装置をスクラッチから訓練する。
論文 参考訳(メタデータ) (2022-09-16T08:33:04Z) - MAPLE: Masked Pseudo-Labeling autoEncoder for Semi-supervised Point
Cloud Action Recognition [160.49403075559158]
本稿では,Pseudo-Labeling autoEncoder (textbfMAPLE) フレームワークを提案する。
特に、MAPLEのバックボーンとして、新規で効率的なtextbfDecoupled textbfspatial-textbftemporal TranstextbfFormer(textbfDestFormer)を設計する。
MAPLEは3つの公開ベンチマークにおいて優れた結果を得て、MSR-Action3の精度を8.08%向上させる。
論文 参考訳(メタデータ) (2022-09-01T12:32:40Z) - MM-PCQA: Multi-Modal Learning for No-reference Point Cloud Quality
Assessment [32.495387943305204]
マルチモーダル方式で,新しい非参照点クラウド品質評価(NR-PCQA)指標を提案する。
具体的には、点雲を部分モデルに分割し、点シフトやダウンサンプリングのような局所的な幾何学的歪みを表す。
目標を達成するために、サブモデルと投影された画像は、ポイントベースおよびイメージベースニューラルネットワークで符号化される。
論文 参考訳(メタデータ) (2022-09-01T06:11:12Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Reduced Reference Perceptual Quality Model and Application to Rate
Control for 3D Point Cloud Compression [61.110938359555895]
レート歪み最適化では、ビットレートの制約を受ける再構成品質尺度を最大化してエンコーダ設定を決定する。
本稿では,V-PCC幾何および色量化パラメータを変数とする線形知覚品質モデルを提案する。
400個の圧縮された3D点雲による主観的品質試験の結果,提案モデルが平均評価値とよく相関していることが示唆された。
また、同じ目標ビットレートに対して、提案モデルに基づくレート歪みの最適化は、ポイント・ツー・ポイントの客観的な品質指標による徹底的な探索に基づくレート歪みの最適化よりも高い知覚品質を提供することを示した。
論文 参考訳(メタデータ) (2020-11-25T12:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。