論文の概要: Latent Factor Modeling of Users Subjective Perception for Stereoscopic
3D Video Recommendation
- arxiv url: http://arxiv.org/abs/2101.10039v1
- Date: Mon, 25 Jan 2021 12:13:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 18:56:13.588401
- Title: Latent Factor Modeling of Users Subjective Perception for Stereoscopic
3D Video Recommendation
- Title(参考訳): 立体3次元映像推薦におけるユーザの主観的知覚の潜在要因モデリング
- Authors: Balasubramanyam Appina, Mansi Sharma, Santosh Kumar
- Abstract要約: 本稿では,潜在因子モデルに基づく立体3D映画のための新しいレコメンデーションシステムを提案する。
提案モデルは,Noma3ds1-cospad1 と LFOVIAS3DPh2 S3D ビデオ品質評価データセットを用いてトレーニングおよびテストを行う。
- 参考スコア(独自算出の注目度): 4.625685763759699
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous stereoscopic 3D movies are released every year to theaters and
created large revenues. Despite the improvement in stereo capturing and 3D
video post-production technology, stereoscopic artifacts which cause viewer
discomfort continue to appear even in high-budget films. Existing automatic 3D
video quality measurement tools can detect distortions in stereoscopic images
or videos, but they fail to consider the viewer's subjective perception of
those artifacts, and how these distortions affect their choices. In this paper,
we introduce a novel recommendation system for stereoscopic 3D movies based on
a latent factor model that meticulously analyse the viewer's subjective ratings
and influence of 3D video distortions on their preferences. To the best of our
knowledge, this is a first-of-its-kind model that recommends 3D movies based on
stereo-film quality ratings accounting correlation between the viewer's visual
discomfort and stereoscopic-artifact perception. The proposed model is trained
and tested on benchmark Nama3ds1-cospad1 and LFOVIAS3DPh2 S3D video quality
assessment datasets. The experiments revealed that resulting
matrix-factorization based recommendation system is able to generalize
considerably better for the viewer's subjective ratings.
- Abstract(参考訳): 毎年多くの立体3D映画が劇場で公開され、大きな収入を生み出している。
立体撮影と3Dビデオのポストプロダクション技術の改善にもかかわらず、高予算映画でも視聴者の不快感を引き起こす立体的人工物が引き続き現れる。
既存の3Dビデオ品質測定ツールでは、立体画像やビデオの歪みを検出することができるが、これらのアーチファクトに対する視聴者の主観的な認識や、これらの歪みが自身の選択にどのように影響するかを考慮できない。
本論文では,鑑賞者の主観的評価と3D映像の歪みが好みに及ぼす影響を詳細に分析する潜在因子モデルに基づく立体的3D映画の推薦システムを提案する。
私たちの知る限りでは、これは視聴者の視覚的不快感と立体的アーティファクト知覚の間の相関を会計するステレオフィルムの品質評価に基づいて3D映画をお勧めする最初のモデルです。
提案モデルは,Noma3ds1-cospad1 と LFOVIAS3DPh2 S3D ビデオ品質評価データセットを用いてトレーニングおよびテストを行う。
実験の結果,行列分解に基づくレコメンデーションシステムは,視聴者の主観的評価をかなり向上させることができることがわかった。
関連論文リスト
- StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos [44.51044100125421]
本稿では,没入型立体映像を没入型立体映像に変換するための新しい枠組みを提案し,没入型体験における3Dコンテンツの需要の増加に対処する。
われわれのフレームワークは、2Dから3Dへの変換を大幅に改善し、Apple Vision Proや3Dディスプレイのような3Dデバイス用の没入型コンテンツを作るための実用的なソリューションを提供する。
論文 参考訳(メタデータ) (2024-09-11T17:52:07Z) - SVG: 3D Stereoscopic Video Generation via Denoising Frame Matrix [60.48666051245761]
本研究では,3次元立体映像生成のためのポーズフリーかつトレーニングフリーな手法を提案する。
提案手法は, 推定ビデオ深度を用いた立体視ベースライン上のカメラビューにモノクロ映像をワープする。
本研究では,映像の画質向上を図るために,非閉塞境界再注入方式を開発した。
論文 参考訳(メタデータ) (2024-06-29T08:33:55Z) - 3D Human Pose Perception from Egocentric Stereo Videos [67.9563319914377]
我々は,エゴセントリックな立体3次元ポーズ推定を改善するためのトランスフォーマーベースの新しいフレームワークを提案する。
本手法は, しゃがんだり座ったりといった困難なシナリオにおいても, 人間のポーズを正確に推定することができる。
私たちはUnrealEgo2、UnrealEgo-RW、およびトレーニングされたモデルをプロジェクトページでリリースします。
論文 参考訳(メタデータ) (2023-12-30T21:21:54Z) - Multi-view Inversion for 3D-aware Generative Adversarial Networks [3.95944314850151]
人間の頭部に対する現在の3D GANインバージョン法は、通常、1つの正面像のみを使用して3Dヘッドモデル全体を再構築する。
これにより、マルチビューデータやダイナミックビデオが利用可能になったときに意味のある情報が残される。
提案手法は既存の最先端3D GANインバージョン技術を利用して,同一対象の複数のビューを一貫した同時インバージョンを可能にする。
論文 参考訳(メタデータ) (2023-12-08T19:28:40Z) - VOODOO 3D: Volumetric Portrait Disentanglement for One-Shot 3D Head
Reenactment [17.372274738231443]
そこで本研究では,ソースの出現とドライバ表現のための,完全に神経の絡み合ったフレームワークをベースとした3D認識型ワンショットヘッド再現手法を提案する。
提案手法はリアルタイムであり,ホログラフィックディスプレイに基づく3次元遠隔会議システムに適した高忠実・高精細な出力を実現する。
論文 参考訳(メタデータ) (2023-12-07T19:19:57Z) - AutoDecoding Latent 3D Diffusion Models [95.7279510847827]
本稿では,3次元オートデコーダをコアとした静的・明瞭な3次元アセットの生成に対して,新しいアプローチを提案する。
3D Autodecoderフレームワークは、ターゲットデータセットから学んだプロパティを潜時空間に埋め込む。
次に、適切な中間体積潜在空間を特定し、ロバストな正規化と非正規化演算を導入する。
論文 参考訳(メタデータ) (2023-07-07T17:59:14Z) - State of the Art in Dense Monocular Non-Rigid 3D Reconstruction [100.9586977875698]
モノクル2D画像から変形可能なシーン(または非剛体)の3D再構成は、コンピュータビジョンとグラフィックスの長年、活発に研究されてきた領域である。
本研究は,モノクラー映像やモノクラービューの集合から,様々な変形可能な物体や複合シーンを高密度に非剛性で再現するための最先端の手法に焦点を当てる。
論文 参考訳(メタデータ) (2022-10-27T17:59:53Z) - SelfPose: 3D Egocentric Pose Estimation from a Headset Mounted Camera [97.0162841635425]
頭部装着型VR装置の縁に設置した下向きの魚眼カメラから撮影した単眼画像から,エゴセントリックな3Dボディポーズ推定法を提案する。
この特異な視点は、厳密な自己閉塞と視点歪みを伴う、独特の視覚的な外観のイメージに繋がる。
本稿では,2次元予測の不確実性を考慮した新しいマルチブランチデコーダを用いたエンコーダデコーダアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-11-02T16:18:06Z) - Kinematic 3D Object Detection in Monocular Video [123.7119180923524]
運動運動を注意深く利用して3次元位置決めの精度を向上させるモノクロ映像を用いた3次元物体検出法を提案する。
我々は、KITTI自動運転データセット内のモノクロ3次元物体検出とバードアイビュータスクの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-07-19T01:15:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。