論文の概要: Recent Advances and Trends in Learning-based 3D Representations
- arxiv url: http://arxiv.org/abs/2606.04871v1
- Date: Wed, 03 Jun 2026 13:35:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 07:07:40.506429
- Title: Recent Advances and Trends in Learning-based 3D Representations
- Title(参考訳): 学習型3次元表現の最近の進歩と動向
- Authors: Adrien Schockaert, Hamid Laga, Hazem Wannous, Vincent Magnier, Guillaume Dufaye, Jean-françois Witz,
- Abstract要約: 適切な3D表現の選択は、3D再構成、新しいビュー合成とレンダリング、形状と動きの分析、認識、生成といったタスクにおける現代のコンピュータビジョンとグラフィックパイプラインの効率、品質、能力を決定する。
最近のニューラルおよびプリミティブベースの表現は、ゲーム、AR/VR、自律運転、ロボットナビゲーション、医療画像など、幅広いアプリケーションにおいて、コンパクトで差別化可能な代替手段を提供する。
各種類の表現に対して、一般的な定式化とその変種を提示し、その利点と限界について議論し、主要なアプリケーションを強調します。
- 参考スコア(独自算出の注目度): 6.265283624249999
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The selection of an appropriate 3D representation is a fundamental design decision that dictates the efficiency, quality, and capabilities of modern computer vision and graphics pipelines for tasks such as 3D reconstruction, novel-view synthesis and rendering, shape and motion analysis, recognition, and generation. While traditional representations (\eg meshes, point clouds, and volumetric grids) remain standard outputs of 3D sensors (\eg LiDAR and 3D scanners) and are widely used in downstream applications (\eg editing and simulation), recent neural and primitive-based representations (\eg 3D Gaussian Splatting) offer compact and differentiable alternatives opening a wide range of opportunities in applications such as games, AR/VR, autonomous driving, robot navigation, and medical imaging, to name a few. The goal of this paper is to survey the main families of 3D representations from discrete explicit formats to continuous implicit fields based either on neural rendering or primitive splatting. For each type of representation, we present the general formulation and its variants, discuss its benefits and limitations, and highlight key applications. We conclude the paper by outlining the open challenges and potential directions for future research. Distinct from recent surveys that broadly cover 3D object and scene reconstruction, this paper provides a focused analysis on the evolution of 3D representations themselves. We specifically emphasize the paradigm shift toward implicit representations, offering a novel perspective on how these emerging formats fundamentally alter 3D/4D workflows.
- Abstract(参考訳): 適切な3D表現の選択は、3D再構成、新規ビュー合成とレンダリング、形状と動きの分析、認識、生成といったタスクに対する現代のコンピュータビジョンとグラフィックパイプラインの効率、品質、能力を決定する基本的な設計決定である。
従来の表現(メッシュ、ポイントクラウド、ボリュームグリッド)は3Dセンサーの標準出力のままで、下流のアプリケーションで広く使われている(編集とシミュレーション)が、最近のニューラルおよびプリミティブベースの表現(ガウススティング)は、ゲーム、AR/VR、自律走行、ロボットナビゲーション、医療画像などのアプリケーションで幅広い機会を開放する、コンパクトで微分可能な代替手段を提供する。
本研究の目的は、離散的な明示的なフォーマットから、ニューラルレンダリングやプリミティブスプラッティングに基づく連続的な暗黙的なフィールドへの3D表現のメインファミリーを調査することである。
各種類の表現に対して、一般的な定式化とその変種を提示し、その利点と限界について議論し、主要なアプリケーションを強調します。
今後の研究に向けたオープンな課題と潜在的な方向性を概説することで、論文を締めくくります。
本稿では,3次元オブジェクトとシーン再構成を広範囲にカバーする最近の調査から,3次元表現自体の進化について,焦点を絞った分析を行った。
具体的には、暗黙の表現へのパラダイムシフトを強調し、これらの新たなフォーマットが3D/4Dワークフローを根本的に変える方法について、新たな視点を提供する。
関連論文リスト
- Diffusion Models in 3D Vision: A Survey [18.805222552728225]
3Dビジョンはコンピュータビジョンにおいて重要な分野となり、自律運転、ロボット工学、拡張現実、医療画像などの幅広い応用に力を入れている。
本稿では,3次元オブジェクト生成,形状完備化,点雲再構成,シーン構築など,三次元視覚タスクに拡散モデルを用いる最先端の手法について概説する。
計算効率の向上,マルチモーダル融合の強化,大規模事前学習による3次元タスクの一般化の促進など,潜在的なソリューションについて議論する。
論文 参考訳(メタデータ) (2024-10-07T04:12:23Z) - A Survey on 3D Gaussian Splatting [61.50539646390613]
3次元ガウススプラッティング (GS) は放射場における変換技術として出現している。
本稿では,3D GSの最近の発展と重要な貢献について,初めて体系的に概説する。
前例のないレンダリング速度を実現することで、3D GSは、仮想現実からインタラクティブメディアなど、数多くのアプリケーションを開くことができる。
論文 参考訳(メタデータ) (2024-01-08T13:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。