Fugu-MT 論文翻訳(概要): MV2Cyl: Reconstructing 3D Extrusion Cylinders from Multi-View Images

論文の概要: MV2Cyl: Reconstructing 3D Extrusion Cylinders from Multi-View Images

arxiv url: http://arxiv.org/abs/2406.10853v3
Date: Mon, 18 Nov 2024 17:28:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:33.693883
Title: MV2Cyl: Reconstructing 3D Extrusion Cylinders from Multi-View Images
Title（参考訳）: MV2Cyl:マルチビュー画像からの3次元押出しシリンダの再構成
Authors: Eunji Hong, Minh Hieu Nguyen, Mikaela Angelina Uy, Minhyuk Sung,
Abstract要約: 2次元多視点画像から3次元を再構成する新しい手法であるMV2Cylを提案する。本研究では,2次元スケッチと抽出パラメータ推定において最適な精度で最適な再構成結果を得る。
参考スコア（独自算出の注目度）: 13.255044855902408
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present MV2Cyl, a novel method for reconstructing 3D from 2D multi-view images, not merely as a field or raw geometry but as a sketch-extrude CAD model. Extracting extrusion cylinders from raw 3D geometry has been extensively researched in computer vision, while the processing of 3D data through neural networks has remained a bottleneck. Since 3D scans are generally accompanied by multi-view images, leveraging 2D convolutional neural networks allows these images to be exploited as a rich source for extracting extrusion cylinder information. However, we observe that extracting only the surface information of the extrudes and utilizing it results in suboptimal outcomes due to the challenges in the occlusion and surface segmentation. By synergizing with the extracted base curve information, we achieve the optimal reconstruction result with the best accuracy in 2D sketch and extrude parameter estimation. Our experiments, comparing our method with previous work that takes a raw 3D point cloud as input, demonstrate the effectiveness of our approach by taking advantage of multi-view images. Our project page can be found at http://mv2cyl.github.io .
Abstract（参考訳）: 本稿では,2次元多視点画像から3次元を再構成する新しい手法MV2Cylについて述べる。生の3D形状から押出シリンダーを抽出する手法はコンピュータビジョンにおいて広く研究されているが、ニューラルネットワークによる3Dデータの処理はいまだにボトルネックとなっている。 3Dスキャンは一般的にマルチビュー画像が伴うため、2D畳み込みニューラルネットワークを利用することで、これらの画像は押出シリンダー情報を抽出するためのリッチソースとして利用することができる。しかし, 押出物の表面情報のみを抽出し, 利用することで, 閉塞や表面セグメンテーションの課題により, 最適以下の結果が得られることが観察された。抽出した基本曲線情報と相乗化することにより,2次元スケッチにおいて最適な精度で最適な再構成結果とパラメータ推定を行う。提案手法を生の3次元点雲を入力とする従来手法と比較し,マルチビュー画像の活用によるアプローチの有効性を実証した。私たちのプロジェクトページはhttp://mv2cyl.github.io で参照できます。

関連論文リスト

Wonder3D++: Cross-domain Diffusion for High-fidelity 3D Generation from a Single Image [68.55613894952177]
単一ビュー画像から高忠実なテクスチャメッシュを効率的に生成する新しい手法である textbfWonder3D++ を導入する。マルチビュー正規写像と対応するカラー画像を生成するクロスドメイン拡散モデルを提案する。最後に,多視点2次元表現から高品質な表面を粗い方法でわずか3ドル程度で駆動するカスケード3次元メッシュ抽出アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-11-03T17:24:18Z)
Geometry and Perception Guided Gaussians for Multiview-consistent 3D Generation from a Single Image [10.648593818811976]
既存のアプローチはしばしば、微調整された事前訓練された2D拡散モデルや、高速ネットワーク推論を通じて直接3D情報を生成することに依存している。本稿では,新たなモデルトレーニングを必要とせず,幾何学と知覚情報をシームレスに統合する新しい手法を提案する。実験結果から,新しい視点合成法や3次元再構成法よりも優れ,頑健で一貫した3次元オブジェクト生成を実証した。
論文参考訳（メタデータ） (2025-06-26T11:22:06Z)
GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。 GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文参考訳（メタデータ） (2024-06-21T17:49:31Z)
Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文参考訳（メタデータ） (2023-03-26T14:38:42Z)
MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文参考訳（メタデータ） (2022-08-18T00:48:15Z)
SketchSampler: Sketch-based 3D Reconstruction via View-dependent Depth Sampling [75.957103837167]
1枚のスケッチ画像に基づいて3次元形状を再構成することは、スパースで不規則なスケッチと正規の高密度な3次元形状との間に大きな領域ギャップがあるため困難である。既存の作品では、3D座標を直接予測するためにスケッチから抽出されたグローバルな特徴を活用しようとするが、通常は入力スケッチに忠実でない細部を失う。
論文参考訳（メタデータ） (2022-08-14T16:37:51Z)
Beyond 3DMM: Learning to Capture High-fidelity 3D Face Shape [77.95154911528365]
3Dモーフィブルモデル(3DMM)の適合性は、その強力な3D先行性のため、顔解析に広く有用である。以前に再建された3次元顔は、微細な形状が失われるため、視差の低下に悩まされていた。本論文は, パーソナライズされた形状が対応する人物と同一に見えるよう, パーソナライズされた形状を捉えるための完全な解を提案する。
論文参考訳（メタデータ） (2022-04-09T03:46:18Z)
Point2Cyl: Reverse Engineering 3D Objects from Point Clouds to Extrusion Cylinders [25.389088434370066]
本稿では,生の3次元点雲を一組の押出シリンダに変換する教師ネットワークであるPoint2Cylを提案する。提案手法は,2つのCADデータセット上での最良の性能を示す。
論文参考訳（メタデータ） (2021-12-17T05:22:28Z)
Spatial Context-Aware Self-Attention Model For Multi-Organ Segmentation [18.76436457395804]
マルチ組織セグメンテーションは、医学画像解析におけるディープラーニングの最も成功した応用の1つである。深部畳み込みニューラルネット(CNN)は,CT画像やMRI画像上で臨床応用画像のセグメンテーション性能を達成する上で非常に有望である。本研究では,高分解能2次元畳み込みによりセグメンテーションを実現する3次元モデルと2次元モデルを組み合わせた新しい枠組みを提案する。
論文参考訳（メタデータ） (2020-12-16T21:39:53Z)
Improved Modeling of 3D Shapes with Multi-view Depth Maps [48.8309897766904]
CNNを用いて3次元形状をモデル化するための汎用フレームワークを提案する。オブジェクトの1つの深度画像だけで、3Dオブジェクトの高密度な多視点深度マップ表現を出力できる。
論文参考訳（メタデータ） (2020-09-07T17:58:27Z)
Implicit Functions in Feature Space for 3D Shape Reconstruction and Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。 IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文参考訳（メタデータ） (2020-03-03T11:14:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。