Fugu-MT 論文翻訳(概要): TripoSR: Fast 3D Object Reconstruction from a Single Image

論文の概要: TripoSR: Fast 3D Object Reconstruction from a Single Image

arxiv url: http://arxiv.org/abs/2403.02151v1
Date: Mon, 4 Mar 2024 16:00:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-06 18:19:54.234970
Title: TripoSR: Fast 3D Object Reconstruction from a Single Image
Title（参考訳）: TripoSR: 単一画像からの高速な3Dオブジェクト再構成
Authors: Dmitry Tochilkin, David Pankratz, Zexiang Liu, Zixuan Huang, Adam Letts, Yangguang Li, Ding Liang, Christian Laforte, Varun Jampani, Yan-Pei Cao
Abstract要約: TripoSRは、1つの画像から0.5秒未満で3Dメッシュを生成する。 MITライセンスでリリースされたTripoSRは、研究者、開発者、クリエイティブを3D生成AIの最新の進歩で支援することを目的としている。
参考スコア（独自算出の注目度）: 45.32085953968605
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This technical report introduces TripoSR, a 3D reconstruction model leveraging transformer architecture for fast feed-forward 3D generation, producing 3D mesh from a single image in under 0.5 seconds. Building upon the LRM network architecture, TripoSR integrates substantial improvements in data processing, model design, and training techniques. Evaluations on public datasets show that TripoSR exhibits superior performance, both quantitatively and qualitatively, compared to other open-source alternatives. Released under the MIT license, TripoSR is intended to empower researchers, developers, and creatives with the latest advancements in 3D generative AI.
Abstract（参考訳）: この技術報告では、トランスフォーメーションアーキテクチャを活用したトランスフォーメーションモデルであるtriposrを紹介し、単一の画像から0.5秒未満で3dメッシュを生成する。 triposrは、lrmネットワークアーキテクチャに基づいて、データ処理、モデル設計、トレーニング技術の大幅な改善を統合する。パブリックデータセットの評価は、triposrが他のオープンソースの代替品と比較して、定量的にも質的にも優れたパフォーマンスを示していることを示している。 MITライセンスでリリースされたTripoSRは、研究者、開発者、クリエイティブを3D生成AIの最新の進歩で支援することを目的としている。

関連論文リスト

iLRM: An Iterative Large 3D Reconstruction Model [21.98670485640184]
本稿では,反復的改良機構を用いて3次元ガウス表現を生成する反復的大規模3次元再構成モデル(iLRM)を提案する。 RE10KやDL3DVといった広く使われているデータセットの実験結果から、iLRMは復元品質と速度の両方で既存の手法より優れていることが示されている。
論文参考訳（メタデータ） (2025-07-31T06:33:07Z)
TripoSG: High-Fidelity 3D Shape Synthesis using Large-Scale Rectified Flow Models [69.0220314849478]
TripoSGは、入力画像に正確に対応した高忠実度3Dメッシュを生成することができる新しい合理化形状拡散パラダイムである。結果として得られた3D形状は、高解像度の能力によって細部が強化され、入力画像に異常な忠実さを示す。 3Dジェネレーションの分野における進歩と革新を促進するため、我々はモデルを一般公開する。
論文参考訳（メタデータ） (2025-02-10T16:07:54Z)
Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass [68.78222900840132]
我々は,DUSt3Rに並列に複数のビューを処理することで,効率よくスケーラブルな3D再構成を実現する新しい多視点一般化であるFast3Rを提案する。 Fast3Rは最先端のパフォーマンスを示し、推論速度とエラーの蓄積が大幅に改善された。
論文参考訳（メタデータ） (2025-01-23T18:59:55Z)
Taming Feed-forward Reconstruction Models as Latent Encoders for 3D Generative Models [7.485139478358133]
最近のAIベースの3Dコンテンツ作成は、フィードフォワード画像から3Dへの再構成アプローチと、2Dまたは3D監視でトレーニングされた3D生成モデルという、2つの経路に沿って大きく進化している。本稿では,既存のフィードフォワード再構成手法が3次元生成モデルのトレーニングに有効な潜伏エンコーダとして有効であることを示し,これら2つのパラダイムをブリッジする。
論文参考訳（メタデータ） (2024-12-31T21:23:08Z)
GTR: Improving Large 3D Reconstruction Models through Geometry and Texture Refinement [51.97726804507328]
マルチビュー画像から3次元メッシュを再構成する手法を提案する。提案手法は, 変圧器を用いたトリプレーンジェネレータとニューラルレージアンスフィールド(NeRF)モデルを用いた大規模再構成モデルから着想を得たものである。
論文参考訳（メタデータ） (2024-06-09T05:19:24Z)
Accurate Cross-modal Reconstruction of Vehicle Target from Sparse-aspect Multi-baseline SAR data [5.757535707973869]
マルチアスペクトマルチベースラインSAR3Dイメージングは、都市マッピングとモニタリングを約束する重要なリモートセンシング技術である。過去には, 圧縮センシング(CS)がスパース3D SAR再建の主流であった。ディープラーニング(DL)は強力な代替手段として登場し、再構築の質と効率を大幅に向上させた。
論文参考訳（メタデータ） (2024-06-06T15:18:59Z)
InstantMesh: Efficient 3D Mesh Generation from a Single Image with Sparse-view Large Reconstruction Models [66.83681825842135]
InstantMeshは、単一のイメージからインスタント3Dメッシュを生成するためのフィードフォワードフレームワークである。最新世代の品質とトレーニングのスケーラビリティが特徴だ。 InstantMeshのコード、重み、デモをすべてリリースし、3D生成AIのコミュニティに多大な貢献ができることを意図しています。
論文参考訳（メタデータ） (2024-04-10T17:48:37Z)
LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation [73.36690511083894]
本稿では,LN3Diffと呼ばれる新しいフレームワークを導入し,統一された3次元拡散パイプラインに対処する。提案手法では,3次元アーキテクチャと変分オートエンコーダを用いて,入力画像を構造化されたコンパクトな3次元潜在空間に符号化する。 3次元生成のためのShapeNetの最先端性能を実現し,モノクロ3次元再構成と条件付き3次元生成において優れた性能を示す。
論文参考訳（メタデータ） (2024-03-18T17:54:34Z)
CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction Model [37.75256020559125]
本稿では,高忠実度フィードフォワード画像から3次元画像生成モデルを提案する。ネットワーク設計に幾何学的事前情報を統合する必要性を強調した。我々のモデルは、テストタイムの最適化なしに、画像から10秒で高忠実なテクスチャメッシュを提供する。
論文参考訳（メタデータ） (2024-03-08T04:25:29Z)
Triplane Meets Gaussian Splatting: Fast and Generalizable Single-View 3D Reconstruction with Transformers [37.14235383028582]
本稿では,フィードフォワード推論を用いて,単一画像から3次元モデルを効率よく生成する,一視点再構成のための新しい手法を提案する。提案手法では,2つのトランスフォーマーネットワーク,すなわちポイントデコーダとトリプレーンデコーダを用いて,ハイブリッドトリプレーン・ガウス中間表現を用いて3次元オブジェクトを再構成する。
論文参考訳（メタデータ） (2023-12-14T17:18:34Z)
NeRF-GAN Distillation for Efficient 3D-Aware Generation with Convolutions [97.27105725738016]
GAN(Generative Adversarial Networks)のようなニューラルラジアンスフィールド(NeRF)と生成モデルの統合は、単一ビュー画像から3D認識生成を変換した。提案手法は,ポーズ条件付き畳み込みネットワークにおいて,事前学習したNeRF-GANの有界遅延空間を再利用し,基礎となる3次元表現に対応する3D一貫性画像を直接生成する手法である。
論文参考訳（メタデータ） (2023-03-22T18:59:48Z)
Simple and Effective Synthesis of Indoor 3D Scenes [78.95697556834536]
1枚以上の画像から3D屋内シーンを没入する問題について検討する。我々の狙いは、新しい視点から高解像度の画像とビデオを作成することである。本稿では,不完全点雲の再投影から高解像度のRGB-D画像へ直接マップするイメージ・ツー・イメージのGANを提案する。
論文参考訳（メタデータ） (2022-04-06T17:54:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。