論文の概要: Viser: Imperative, Web-based 3D Visualization in Python
- arxiv url: http://arxiv.org/abs/2507.22885v1
- Date: Wed, 30 Jul 2025 17:59:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:18.390141
- Title: Viser: Imperative, Web-based 3D Visualization in Python
- Title(参考訳): Viser: PythonのインペラティブでWebベースの3D可視化
- Authors: Brent Yi, Chung Min Kim, Justin Kerr, Gina Wu, Rebecca Feng, Anthony Zhang, Jonas Kulhanek, Hongsuk Choi, Yi Ma, Matthew Tancik, Angjoo Kanazawa,
- Abstract要約: Viserはコンピュータビジョンとロボット工学のための3D視覚化ライブラリである。
この記事では、Viserの機能、インターフェース、実装について説明する。
- 参考スコア(独自算出の注目度): 35.57876533606679
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Viser, a 3D visualization library for computer vision and robotics. Viser aims to bring easy and extensible 3D visualization to Python: we provide a comprehensive set of 3D scene and 2D GUI primitives, which can be used independently with minimal setup or composed to build specialized interfaces. This technical report describes Viser's features, interface, and implementation. Key design choices include an imperative-style API and a web-based viewer, which improve compatibility with modern programming patterns and workflows.
- Abstract(参考訳): コンピュータビジョンとロボティクスのための3DビジュアライゼーションライブラリViserを紹介します。
ViserはPythonに簡単で拡張可能な3Dビジュアライゼーションを提供することを目的としています。我々は3Dシーンと2D GUIプリミティブの包括的なセットを提供しています。
この技術レポートはViserの機能、インターフェース、実装について説明している。
主な設計選択は命令型APIとWebベースのビューアで、モダンなプログラミングパターンやワークフローとの互換性を改善している。
関連論文リスト
- Aligning Text, Images, and 3D Structure Token-by-Token [8.521599463802637]
構造化3次元シーンにおける自己回帰モデルの可能性について検討する。
言語,画像,3Dシーンを整合させる統一LLMフレームワークを提案する。
実世界の3Dオブジェクト認識タスクにおけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2025-06-09T17:59:37Z) - Chat-Edit-3D: Interactive 3D Scene Editing via Text Prompts [76.73043724587679]
CE3Dと呼ばれる対話型3Dシーン編集手法を提案する。
Hash-Atlasは3Dシーンビューを表し、3Dシーンの編集を2Dアトラスイメージに転送する。
その結果、CE3Dは複数の視覚モデルを効果的に統合し、多様な視覚効果が得られることを示した。
論文 参考訳(メタデータ) (2024-07-09T13:24:42Z) - Can We Solve 3D Vision Tasks Starting from A 2D Vision Transformer? [111.11502241431286]
視覚変換器(ViT)は2次元画像理解タスクの解決に有効であることが証明されている。
2Dおよび3Dタスク用のViTは、これまでほとんど転送できない、非常に異なるアーキテクチャ設計を採用してきた。
本稿では,標準的な2D ViTアーキテクチャを用いて,3次元視覚世界を理解するという魅力的な約束を示す。
論文 参考訳(メタデータ) (2022-09-15T03:34:58Z) - Interactive Annotation of 3D Object Geometry using 2D Scribbles [84.51514043814066]
本稿では,ポイントクラウドデータとRGB画像から3次元オブジェクト形状をアノテートする対話型フレームワークを提案する。
当社のフレームワークは,芸術的,グラフィック的専門知識のないナイーブユーザを対象としている。
論文 参考訳(メタデータ) (2020-08-24T21:51:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。