論文の概要: Automatic Reverse Engineering: Creating computer-aided design (CAD)
models from multi-view images
- arxiv url: http://arxiv.org/abs/2309.13281v1
- Date: Sat, 23 Sep 2023 06:42:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 20:53:00.459903
- Title: Automatic Reverse Engineering: Creating computer-aided design (CAD)
models from multi-view images
- Title(参考訳): 自動リバースエンジニアリング:多視点画像からコンピュータ支援デザイン(CAD)モデルを作成する
- Authors: Henrik Jobczyk and Hanno Homann
- Abstract要約: 自動リバースエンジニアリングタスクのための新しいネットワークを提案する。
複数の有効なCADモデルの再構築に成功して概念実証を行う。
ネットワークのいくつかの機能をこのドメインに転送できることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generation of computer-aided design (CAD) models from multi-view images may
be useful in many practical applications. To date, this problem is usually
solved with an intermediate point-cloud reconstruction and involves manual work
to create the final CAD models. In this contribution, we present a novel
network for an automated reverse engineering task. Our network architecture
combines three distinct stages: A convolutional neural network as the encoder
stage, a multi-view pooling stage and a transformer-based CAD sequence
generator.
The model is trained and evaluated on a large number of simulated input
images and extensive optimization of model architectures and hyper-parameters
is performed. A proof-of-concept is demonstrated by successfully reconstructing
a number of valid CAD models from simulated test image data. Various accuracy
metrics are calculated and compared to a state-of-the-art point-based network.
Finally, a real world test is conducted supplying the network with actual
photographs of two three-dimensional test objects. It is shown that some of the
capabilities of our network can be transferred to this domain, even though the
training exclusively incorporates purely synthetic training data. However to
date, the feasible model complexity is still limited to basic shapes.
- Abstract(参考訳): 多視点画像からコンピュータ支援設計(CAD)モデルを生成することは,多くの実用化に有用である。
現在までに、この問題は中間点クラウド再構成で解決されており、最終的なCADモデルを作成するために手作業が必要となる。
本稿では,自動リバースエンジニアリングタスクのための新しいネットワークを提案する。
ネットワークアーキテクチャには,エンコーダステージとしての畳み込みニューラルネットワーク,マルチビュープーリングステージ,トランスフォーマーベースCADシーケンスジェネレータの3つの異なるステージが組み合わされている。
モデルを多数のシミュレーションされた入力画像に基づいて訓練し、評価し、モデルアーキテクチャとハイパーパラメータの広範な最適化を行う。
シミュレーションされたテスト画像データから有効なCADモデルを多数再構成して概念実証を行う。
様々な精度の指標を計算し、最先端のポイントベースネットワークと比較する。
最後に、ネットワークに2つの3次元テストオブジェクトの実際の写真を供給する実世界テストを行う。
トレーニングには純粋に合成トレーニングデータのみが含まれていても,ネットワークの機能の一部をこの領域に移行できることが示されている。
しかし、現在まで、実現可能なモデルの複雑さは基本的な形状に限られている。
関連論文リスト
- Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - Img2CAD: Reverse Engineering 3D CAD Models from Images through VLM-Assisted Conditional Factorization [12.12975824816803]
画像からのリバースエンジニアリング3Dコンピュータ支援設計(CAD)モデルは、多くのダウンストリームアプリケーションにとって重要な課題である。
本研究では,タスクを2つのサブプロブレムに条件付き分解する手法を提案する。
本稿では,連続的な属性値を予測する意味を持つ離散構造を条件としたTrAssemblerを提案する。
論文 参考訳(メタデータ) (2024-07-19T06:53:30Z) - LAM3D: Large Image-Point-Cloud Alignment Model for 3D Reconstruction from Single Image [64.94932577552458]
大規模再構成モデルは、単一または複数入力画像から自動3Dコンテンツ生成の領域において大きな進歩を遂げている。
彼らの成功にもかかわらず、これらのモデルはしばしば幾何学的不正確な3Dメッシュを生成し、画像データからのみ3D形状を推論する固有の課題から生まれた。
生成した3Dメッシュの忠実度を高めるために3Dポイントクラウドデータを利用する新しいフレームワークであるLarge Image and Point Cloud Alignment Model (LAM3D)を導入する。
論文 参考訳(メタデータ) (2024-05-24T15:09:12Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - DiffCAD: Weakly-Supervised Probabilistic CAD Model Retrieval and Alignment from an RGB Image [34.47379913018661]
本稿では,RGB画像からのCAD検索とアライメントに対する,最初の弱教師付き確率的アプローチであるDiffCADを提案する。
我々はこれを条件付き生成タスクとして定式化し、拡散を利用して画像中のCADオブジェクトの形状、ポーズ、スケールをキャプチャする暗黙の確率モデルを学ぶ。
提案手法は, 合成データのみを用いて学習し, 単眼深度とマスク推定を利用して, 種々の実対象領域へのロバストなゼロショット適応を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:10:21Z) - Sparse Multi-Object Render-and-Compare [33.97243145891282]
一つの画像から静的な物体の3次元形状とポーズを再構築することは、様々な産業にとって重要な課題である。
直接3D形状を予測することで、非現実的で、過度に滑らかになったり、刻まれた形になる。
CADモデルを取得することで、現実的な形状が保証されるが、堅牢で正確なアライメントが必要である。
論文 参考訳(メタデータ) (2023-10-17T12:01:32Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Meta Internal Learning [88.68276505511922]
単一画像生成のための内部学習は、単一の画像に基づいて新しい画像を生成するようにジェネレータを訓練するフレームワークである。
本稿では,サンプル画像の内部統計をより効果的にモデル化するために,画像集合のトレーニングを可能にするメタラーニング手法を提案する。
以上の結果から, 得られたモデルは, 多数の共通画像アプリケーションにおいて, シングルイメージのGANと同程度に適していることがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:27:38Z) - CAPRI-Net: Learning Compact CAD Shapes with Adaptive Primitive Assembly [17.82598676258891]
3Dコンピュータ支援設計(CAD)モデルのコンパクトで解釈可能な暗黙表現を学習するためのニューラルネットワークCAPRI-Netを紹介します。
当社のネットワークは、ポイントクラウドまたはボキセルグリッドとして提供できる入力3D形状を取り、四面プリミティブのコンパクトなアセンブリによってそれを再構築します。
本研究では,これまでで最大かつ多種多様なCADデータセットであるShapeNetとABCの学習フレームワークを,再構築品質,形状エッジ,コンパクト性,解釈可能性の観点から評価した。
論文 参考訳(メタデータ) (2021-04-12T17:21:19Z) - CAD2Real: Deep learning with domain randomization of CAD data for 3D
pose estimation of electronic control unit housings [0.20999222360659608]
我々は、純粋に合成されたトレーニングデータに基づいて最先端の人工知能ニューラルネットワーク(ANN)を訓練する。
トレーニング画像のレンダリング中にパラメータをランダム化することにより、実サンプル部のRGB画像の推測を可能にする。
論文 参考訳(メタデータ) (2020-09-25T16:08:16Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。