論文の概要: UVG-VPC: Voxelized Point Cloud Dataset for Visual Volumetric Video-based Coding
- arxiv url: http://arxiv.org/abs/2504.05888v1
- Date: Tue, 08 Apr 2025 10:27:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-09 13:28:51.282569
- Title: UVG-VPC: Voxelized Point Cloud Dataset for Visual Volumetric Video-based Coding
- Title(参考訳): UVG-VPC:Voxelized Point Cloud Dataset for Visual Volumetric Video-based Coding
- Authors: Guillaume Gautier, Alexandre Mercat, Louis Fréneau, Mikko Pitkänen, Jarno Vanne,
- Abstract要約: 本稿では,MPEG Visual Volumetric Video-based Coding (V3C)技術の開発,評価,検証を行うために,UVG-VPCと呼ばれる新しいオープンデータセットを提案する。
データセットは、独自の非商用ライセンスの下で配布される。
- 参考スコア(独自算出の注目度): 42.999580283729614
- License:
- Abstract: Point cloud compression has become a crucial factor in immersive visual media processing and streaming. This paper presents a new open dataset called UVG-VPC for the development, evaluation, and validation of MPEG Visual Volumetric Video-based Coding (V3C) technology. The dataset is distributed under its own non-commercial license. It consists of 12 point cloud test video sequences of diverse characteristics with respect to the motion, RGB texture, 3D geometry, and surface occlusion of the points. Each sequence is 10 seconds long and comprises 250 frames captured at 25 frames per second. The sequences are voxelized with a geometry precision of 9 to 12 bits, and the voxel color attributes are represented as 8-bit RGB values. The dataset also includes associated normals that make it more suitable for evaluating point cloud compression solutions. The main objective of releasing the UVG-VPC dataset is to foster the development of V3C technologies and thereby shape the future in this field.
- Abstract(参考訳): ポイントクラウド圧縮は、没入型ビジュアルメディア処理とストリーミングにおいて重要な要素となっている。
本稿では,MPEG Visual Volumetric Video-based Coding (V3C)技術の開発,評価,検証を行うために,UVG-VPCと呼ばれる新しいオープンデータセットを提案する。
データセットは、独自の非商用ライセンスの下で配布される。
運動、RGBテクスチャ、3D幾何、および点の表面閉塞に関する様々な特徴の12点のクラウドテストビデオシーケンスで構成されている。
各シーケンスは10秒の長さで、毎秒25フレームでキャプチャされた250フレームで構成される。
シーケンスは、幾何学的精度9〜12ビットでボクセル化され、ボクセル色属性は8ビットのRGB値として表される。
データセットには、ポイントクラウド圧縮ソリューションを評価するのにより適した、関連する正規値も含まれている。
UVG-VPCデータセットをリリースする主な目的は、V3C技術の発展を促進し、この分野の将来を形作ることである。
関連論文リスト
- Mixed Signals: A Diverse Point Cloud Dataset for Heterogeneous LiDAR V2X Collaboration [56.75198775820637]
車両間協調認識(V2X)は、単車知覚システムの限界に対処するための有望な解決策として登場した。
これらのギャップに対処するために、45.1kの点雲と240.6kのバウンディングボックスを備えた総合的なV2XデータセットであるMixed Signalsを紹介した。
私たちのデータセットは、正確に整合したポイントクラウドと10クラスにわたるバウンディングボックスアノテーションを提供し、認識トレーニングのための信頼性の高いデータを確保します。
論文 参考訳(メタデータ) (2025-02-19T23:53:00Z) - Color Enhancement for V-PCC Compressed Point Cloud via 2D Attribute Map Optimization [8.21390074063036]
ビデオベースのポイントクラウド圧縮(V-PCC)は、動的ポイントクラウドデータをビデオシーケンスに変換する。
本稿では,V-PCC圧縮点雲の色質向上を目的としたフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-19T01:58:00Z) - BVI-CR: A Multi-View Human Dataset for Volumetric Video Compression [14.109939177281069]
BVI-CRは18のマルチビューRGB-Dキャプチャとそれに対応するテクスチャ化された多角形メッシュを含んでいる。
各ビデオシーケンスは、30FPSで10~15秒間の1080p解像度で10ビューを含む。
その結果、ボリュームビデオ圧縮におけるニューラル表現に基づく手法の大きな可能性を示した。
論文 参考訳(メタデータ) (2024-11-17T23:22:48Z) - ViDSOD-100: A New Dataset and a Baseline Model for RGB-D Video Salient Object Detection [51.16181295385818]
まず、注釈付きRGB-D video SODOD(DSOD-100)データセットを収集し、合計9,362フレーム内に100の動画を含む。
各ビデオのフレームはすべて、高品質なサリエンシアノテーションに手動で注釈付けされる。
本稿では,RGB-Dサリアンオブジェクト検出のための新しいベースラインモデル,attentive triple-fusion network (ATF-Net)を提案する。
論文 参考訳(メタデータ) (2024-06-18T12:09:43Z) - 4DSR-GCN: 4D Video Point Cloud Upsampling using Graph Convolutional
Networks [29.615723135027096]
圧縮後の3次元ビデオポイント雲のアップスケーリングと復元のための新しいソリューションを提案する。
我々のモデルは、動的エッジ畳み込みとグラフ注意ネットワークを組み合わせた、特別に設計されたグラフ畳み込みネットワーク(GCN)で構成されている。
論文 参考訳(メタデータ) (2023-06-01T18:43:16Z) - Towards Scalable Neural Representation for Diverse Videos [68.73612099741956]
Inlicit Neural representations (INR)は、3Dシーンや画像の表現において注目を集めている。
既存のINRベースの手法は、冗長な視覚コンテンツを持つ短いビデオの符号化に限られている。
本稿では,多種多様な視覚コンテンツを持つ長編・多作ビデオの符号化のためのニューラル表現の開発に焦点をあてる。
論文 参考訳(メタデータ) (2023-03-24T16:32:19Z) - GQE-Net: A Graph-based Quality Enhancement Network for Point Cloud Color
Attribute [51.4803148196217]
本稿では,点雲の色歪みを低減するため,グラフベースの品質向上ネットワーク(GQE-Net)を提案する。
GQE-Netは、幾何学情報を補助入力とグラフ畳み込みブロックとして使用し、局所的な特徴を効率的に抽出する。
実験結果から,本手法は最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2023-03-24T02:33:45Z) - Efficient dynamic point cloud coding using Slice-Wise Segmentation [10.850101961203748]
MPEGは最近、ダイナミックポイントクラウドコーディングのためのビデオベースのポイントクラウド圧縮(V-PCC)標準を開発した。
V-PCCを用いたデータ不足の主な原因は、3Dから2Dプロジェクションへのパッチ生成と自己隠蔽点である。
本稿では, 重複スライシングを導入し, 発生するパッチ数と損失データ量を削減する手法を提案する。
論文 参考訳(メタデータ) (2022-08-17T04:23:45Z) - VPFNet: Improving 3D Object Detection with Virtual Point based LiDAR and
Stereo Data Fusion [62.24001258298076]
VPFNetは、ポイントクラウドとイメージデータを仮想のポイントで巧みに調整し集約する新しいアーキテクチャである。
当社のVPFNetは,KITTIテストセットで83.21%の中等度3D AP,91.86%中等度BEV APを達成し,2021年5月21日以来の1位となった。
論文 参考訳(メタデータ) (2021-11-29T08:51:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。