Fugu-MT 論文翻訳(概要): Novel tile segmentation scheme for omnidirectional video

論文の概要: Novel tile segmentation scheme for omnidirectional video

arxiv url: http://arxiv.org/abs/2103.05858v1
Date: Wed, 10 Mar 2021 03:49:18 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-12 05:49:26.449111
Title: Novel tile segmentation scheme for omnidirectional video
Title（参考訳）: 全方位ビデオのための新しいタイルセグメンテーション方式
Authors: Jisheng Li, Ziyu Wen, Sihan Li, Yikai Zhao, Bichuan Guo, Jiangtao Wen
Abstract要約: 本研究では,従来の等角射影法に比べて,最大28%の画素領域と20%のbdレートを節約できるタイル型全方位ビデオセグメンテーション方式を提案する。
参考スコア（独自算出の注目度）: 13.11680596463966
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Regular omnidirectional video encoding technics use map projection to flatten a scene from a spherical shape into one or several 2D shapes. Common projection methods including equirectangular and cubic projection have varying levels of interpolation that create a large number of non-information-carrying pixels that lead to wasted bitrate. In this paper, we propose a tile based omnidirectional video segmentation scheme which can save up to 28% of pixel area and 20% of BD-rate averagely compared to the traditional equirectangular projection based approach.
Abstract（参考訳）: 通常の全方位ビデオエンコーディング技術は、マッププロジェクションを使用して、球形から1つまたは複数の2D形状にシーンを平らにします。等角射影や立方射影を含む一般的な投影法は、様々なレベルの補間を持ち、多くの非情報収集画素を生成し、無駄なビットレートをもたらす。本論文では,従来の等角投影方式と比較して,最大28%の画素面積と20%のBDレートを平均的に節約できるタイル型全方位ビデオ分割方式を提案する。

関連論文リスト

Splat-SAP: Feed-Forward Gaussian Splatting for Human-Centered Scene with Scale-Aware Point Map Reconstruction [39.835146541795986]
Splat-SAPは,両眼カメラからの映像を広帯域で表示するためのフィードフォワード方式である。我々は、ピクセルワイズポイントマップの再構成を利用して、その独立ビューモデリングにおいて、大きな空間に頑健な幾何学を表現する。
論文参考訳（メタデータ） (2025-11-27T18:58:54Z)
An End-to-End Room Geometry Constrained Depth Estimation Framework for Indoor Panorama Images [50.84536164535991]
既存の手法ではピクセルレベルの精度に重点を置いており、部屋の角が乱れ、ノイズ感度が低下する。室内形状制約に基づく奥行き推定フレームワークを提案する。本フレームワークには,部屋形状に基づく背景深度解決戦略と,背景分割誘導型融合機構の2つの戦略が組み込まれている。
論文参考訳（メタデータ） (2025-10-09T05:52:48Z)
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation [54.62824686338408]
最小限の入力設定からSplatingにおける生成4D(すなわち3D + Motion)のための新しい問題In-between2-4Dを提案する。動作中の物体の開始状態と終了状態を表す2つの画像が与えられた場合、我々のゴールは4Dで動きを生成・再構成することである。
論文参考訳（メタデータ） (2025-04-11T09:01:09Z)
ViBiDSampler: Enhancing Video Interpolation Using Bidirectional Diffusion Sampler [53.98558445900626]
現在の画像とビデオの拡散モデルは、単一のフレームからビデオを生成するのに強力だが、2フレーム条件付き生成に適応する必要がある。我々は,これらのオフマンド問題に対処するために,広範囲な再ノイズや微調整を必要とせずに,新しい双方向サンプリング戦略を導入する。提案手法では,それぞれ開始フレームと終了フレームに条件付き前方経路と後方経路の両方に沿って逐次サンプリングを行い,中間フレームの整合性を確保した。
論文参考訳（メタデータ） (2024-10-08T03:01:54Z)
Context and Geometry Aware Voxel Transformer for Semantic Scene Completion [7.147020285382786]
視覚に基づくセマンティックシーンコンプリート(SSC)は、様々な3次元知覚タスクに広く応用されているため、多くの注目を集めている。既存のスパース・トゥ・デンス・アプローチでは、様々な入力画像間で共有コンテキストに依存しないクエリを使用するのが一般的である。セマンティックシーン補完を実現するためにCGFormerというニューラルネットワークを導入する。
論文参考訳（メタデータ） (2024-05-22T14:16:30Z)
Object Segmentation-Assisted Inter Prediction for Versatile Video Coding [53.91821712591901]
本稿では,参照フレーム内のオブジェクトをいくつかの高度な技術でセグメント化するオブジェクトセグメンテーション支援インター予測手法を提案する。適切な指示により、オブジェクトセグメンテーションマスクは、参照フレームから現在のフレームに、異なる領域の任意の形のパーティションとして変換される。提案手法は, 最大1.98%, 1.14%, 0.79%, 平均0.82%, 0.49%, 0.37%のBDレート低下が得られた。
論文参考訳（メタデータ） (2024-03-18T11:48:20Z)
Multi-Scale Estimation for Omni-Directional Saliency Maps Using Learnable Equator Bias [1.413861804135093]
サリエンシマップは、ヘッドマウントディスプレイで視線点の確率分布を表す。そこで本研究では,全方位画像に対する新しいサリエンシマップ推定モデルを提案する。提案手法により,サリエンシマップの精度を向上した。
論文参考訳（メタデータ） (2023-09-15T04:08:20Z)
SketchSampler: Sketch-based 3D Reconstruction via View-dependent Depth Sampling [75.957103837167]
1枚のスケッチ画像に基づいて3次元形状を再構成することは、スパースで不規則なスケッチと正規の高密度な3次元形状との間に大きな領域ギャップがあるため困難である。既存の作品では、3D座標を直接予測するためにスケッチから抽出されたグローバルな特徴を活用しようとするが、通常は入力スケッチに忠実でない細部を失う。
論文参考訳（メタデータ） (2022-08-14T16:37:51Z)
Unsupervised Video Interpolation by Learning Multilayered 2.5D Motion Fields [75.81417944207806]
本稿では,ビデオフレーム学習において,単一のビデオのみを必要とする自己教師型アプローチを提案する。時間変化運動場上に定義された通常の微分可能方程式(ODE)を解くことにより,映像の動きをパラメータ化する。この暗黙的な神経表現は、ビデオを時空間連続体として学習し、任意の時間分解能でフレーム時間連続体を可能にする。
論文参考訳（メタデータ） (2022-04-21T06:17:05Z)
Deep Recurrent Neural Network with Multi-scale Bi-directional Propagation for Video Deblurring [36.94523101375519]
本稿では,RNN-MBP(Multiscale Bi-directional Propagation)を用いたディープリカレントニューラルネットワークを提案する。提案したアルゴリズムと既存の最先端の手法を現実世界のぼやけたシーンでよりよく評価するために、リアルワールドのぼやけたビデオデータセットも作成する。提案アルゴリズムは3つの典型的なベンチマークにおける最先端の手法に対して良好に動作する。
論文参考訳（メタデータ） (2021-12-09T11:02:56Z)
Learning to Associate Every Segment for Video Panoptic Segmentation [123.03617367709303]
粗いセグメントレベルのマッチングと細かなピクセルレベルのマッチングを同時に学習する。本研究では,Cityscapes-VPSおよびVIPERデータセット上で,フレーム単位の計算モデルにより,最先端の計算結果が得られることを示す。
論文参考訳（メタデータ） (2021-06-17T13:06:24Z)
ARVo: Learning All-Range Volumetric Correspondence for Video Deblurring [92.40655035360729]
ビデオデブラリングモデルは連続フレームを利用して、カメラの揺動や物体の動きからぼやけを取り除く。特徴空間におけるボケフレーム間の空間的対応を学習する新しい暗黙的手法を提案する。提案手法は,新たに収集したビデオデブレーション用ハイフレームレート(1000fps)データセットとともに,広く採用されているDVDデータセット上で評価される。
論文参考訳（メタデータ） (2021-03-07T04:33:13Z)
Real-time Dense Reconstruction of Tissue Surface from Stereo Optical Video [10.181846237133167]
立体光学ビデオから組織表面の高密度3次元モデル(3次元)をリアルタイムに再構成する手法を提案する。まずステレオマッチングを用いてビデオフレームから3D情報を抽出し,再構成した3Dモデルをモザイクする。 2mm未満の精度で高分解能テクスチャを有する復元3Dモデルについて, 生体内および生体内データによる実験結果を得た。
論文参考訳（メタデータ） (2020-07-16T19:14:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。