論文の概要: A Real-time 3D Desktop Display
- arxiv url: http://arxiv.org/abs/2506.08064v1
- Date: Mon, 09 Jun 2025 10:55:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:40.265047
- Title: A Real-time 3D Desktop Display
- Title(参考訳): リアルタイム3Dデスクトップディスプレイ
- Authors: Livio Tenze, Enrique Canessa,
- Abstract要約: altiro3Dは、2Dウェブカメラ画像またはフラットビデオファイルからの3Dビデオストリームを扱うことを目的としている。
マルチビューを再現するために必要なコア機能は、MiDaS Convolutional Neural Network(CNN)の利用である。
ユーザによるデスクトップ画面領域の取得を容易にするため,マルチプラットフォームなグラフィカルユーザインタフェースも実装されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A new extended version of the altiro3D C++ Library -- initially developed to get glass-free holographic displays starting from 2D images -- is here introduced aiming to deal with 3D video streams from either 2D webcam images or flat video files. These streams are processed in real-time to synthesize light-fields (in Native format) and feed realistic 3D experiences. The core function needed to recreate multiviews consists on the use of MiDaS Convolutional Neural Network (CNN), which allows to extract a depth map from a single 2D image. Artificial Intelligence (AI) computing techniques are applied to improve the overall performance of the extended altiro3D Library. Thus, altiro3D can now treat standard images, video streams or screen portions of a Desktop where other apps may be also running (like web browsers, video chats, etc) and render them into 3D. To achieve the latter, a screen region need to be selected in order to feed the output directly into a light-field 3D device such as Looking Glass (LG) Portrait. In order to simplify the acquisition of a Desktop screen area by the user, a multi-platform Graphical User Interface has been also implemented. Sources available at: https://github.com/canessae/altiro3D/releases/tag/2.0.0
- Abstract(参考訳): Altiro3D C++ Libraryの新バージョンは、最初はガラスのないホログラフィックディスプレイを2D画像から入手するために開発された。このライブラリは、2Dウェブカメラ画像またはフラットビデオファイルから3Dビデオストリームを扱うためのものだ。
これらのストリームはリアルタイムで処理され、(ネイティブ形式で)光フィールドを合成し、リアルな3D体験を提供する。
マルチビューを再現するために必要なコア機能は、単一の2D画像から深度マップを抽出するMiDaS Convolutional Neural Network (CNN)の使用である。
拡張されたアルティロ3Dライブラリの全体的な性能を改善するために人工知能(AI)コンピューティング技術が適用されている。
したがって、Alltiro3Dはデスクトップの標準画像、ビデオストリーム、画面の部分も扱えるようになり、他のアプリ(Webブラウザ、ビデオチャットなど)も動作するようになり、それらを3Dにレンダリングできるようになった。
後者を実現するには、外見ガラス(LG)ポートレートなどの光界3Dデバイスに直接出力を供給するために、画面領域を選択する必要がある。
ユーザによるデスクトップ画面領域の取得を容易にするため,マルチプラットフォームなグラフィカルユーザインタフェースも実装されている。
出典: https://github.com/canessae/altiro3D/releases/tag/2.0.0
関連論文リスト
- Bolt3D: Generating 3D Scenes in Seconds [77.592919825037]
1つ以上の画像が与えられた場合、Bolt3Dは1つのGPU上で7秒以内で直接3Dシーン表現をサンプリングします。
3次元再構成のためのシーンごとの最適化を必要とする従来のマルチビュー生成モデルと比較して、Bolt3Dは推論コストを最大300倍に削減する。
論文 参考訳(メタデータ) (2025-03-18T17:24:19Z) - You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale [42.67300636733286]
本研究では,オープンワールド3D制作のための大規模インターネットビデオを用いた視覚条件付き多視点拡散モデルであるSee3Dを提案する。
このモデルは、広大かつ急速に成長するビデオデータから視覚的内容だけを見ることによって、3Dの知識を得ることを目的としている。
低コストでスケーラブルなビデオデータに基づいて訓練されたSee3Dは、ゼロショットおよびオープンワールド生成能力に優れることを示す。
論文 参考訳(メタデータ) (2024-12-09T17:44:56Z) - CAT3D: Create Anything in 3D with Multi-View Diffusion Models [87.80820708758317]
CAT3D(CAT3D)は,この実世界のキャプチャプロセスを多視点拡散モデルでシミュレートし,任意のものを3Dで作成する手法である。
CAT3Dは1分で3Dシーン全体を作成できる。
論文 参考訳(メタデータ) (2024-05-16T17:59:05Z) - WildFusion: Learning 3D-Aware Latent Diffusion Models in View Space [77.92350895927922]
潜在拡散モデル(LDM)に基づく3次元画像合成の新しいアプローチであるWildFusionを提案する。
我々の3D対応LCMは、マルチビュー画像や3D幾何学を直接監督することなく訓練されている。
これにより、スケーラブルな3D認識画像合成と、Wild画像データから3Dコンテンツを作成するための有望な研究道が開かれる。
論文 参考訳(メタデータ) (2023-11-22T18:25:51Z) - PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm [111.16358607889609]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - Uni3D: Exploring Unified 3D Representation at Scale [66.26710717073372]
大規模に統一された3次元表現を探索する3次元基礎モデルであるUni3Dを提案する。
Uni3Dは、事前にトレーニングされた2D ViTのエンドツーエンドを使用して、3Dポイントクラウド機能と画像テキスト整列機能とを一致させる。
強力なUni3D表現は、野生での3D絵画や検索などの応用を可能にする。
論文 参考訳(メタデータ) (2023-10-10T16:49:21Z) - altiro3D: Scene representation from single image and novel view
synthesis [0.0]
altiro3Dは、元のRGB画像やフラットビデオから始まる現実を表現するために開発されたライブラリである。
ライトフィールド(あるいはネイティブ)の画像やビデオを生成して、リアルな3D体験を得られる。
論文 参考訳(メタデータ) (2023-04-02T16:03:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。