論文の概要: Simplified Learning of CAD Features Leveraging a Deep Residual
Autoencoder
- arxiv url: http://arxiv.org/abs/2202.10099v1
- Date: Mon, 21 Feb 2022 10:27:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 08:48:30.487992
- Title: Simplified Learning of CAD Features Leveraging a Deep Residual
Autoencoder
- Title(参考訳): Deep Residual Autoencoderを活用したCAD機能の簡易学習
- Authors: Raoul Sch\"onhof and Jannes Elstner and Radu Manea and Steffen Tauber
and Ramez Awad and Marco F. Huber
- Abstract要約: コンピュータビジョンでは、EfficientNetのような深い残留ニューラルネットワークが、堅牢性と精度の点で新しい標準を設定している。
ディープニューラルネットワークのトレーニングの根底にある重要な問題は、十分な量のトレーニングデータがないことだ。
本稿では,3次元CADモデル評価に関連する学習タスクの伝達を目的としたEfficientNetアーキテクチャに基づく残差3次元オートエンコーダを提案する。
- 参考スコア(独自算出の注目度): 3.567248644184455
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In the domain of computer vision, deep residual neural networks like
EfficientNet have set new standards in terms of robustness and accuracy. One
key problem underlying the training of deep neural networks is the immanent
lack of a sufficient amount of training data. The problem worsens especially if
labels cannot be generated automatically, but have to be annotated manually.
This challenge occurs for instance if expert knowledge related to 3D parts
should be externalized based on example models. One way to reduce the necessary
amount of labeled data may be the use of autoencoders, which can be learned in
an unsupervised fashion without labeled data. In this work, we present a deep
residual 3D autoencoder based on the EfficientNet architecture, intended for
transfer learning tasks related to 3D CAD model assessment. For this purpose,
we adopted EfficientNet to 3D problems like voxel models derived from a STEP
file. Striving to reduce the amount of labeled 3D data required, the networks
encoder can be utilized for transfer training.
- Abstract(参考訳): コンピュータビジョンの分野では、EfficientNetのような深い残留ニューラルネットワークが、堅牢性と精度の点で新しい標準を設定している。
ディープニューラルネットワークのトレーニングの根底にある重要な問題は、十分な量のトレーニングデータがないことだ。
特にラベルは自動生成できないが、手動でアノテートしなければならない場合、問題は悪化する。
この課題は、3D部品に関する専門家の知識がサンプルモデルに基づいて外部化されるべきである場合などである。
ラベル付きデータの必要な量を減らす方法の1つは、ラベル付きデータなしで教師なしの方法で学習できるオートエンコーダを使用することである。
本研究では,3次元CADモデル評価に関連する学習タスクの伝達を目的としたEfficientNetアーキテクチャに基づく残差3次元オートエンコーダを提案する。
そこで我々は,STEPファイルから派生したボクセルモデルのような3次元問題にEfficientNetを適用した。
ラベル付き3Dデータの量を削減するため、ネットワークエンコーダを転送訓練に利用することができる。
関連論文リスト
- ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding [51.509115746992165]
我々はARKit LabelMakerを紹介した。これは、密集したセマンティックアノテーションを備えた、最初の大規模で現実世界の3Dデータセットである。
また,3次元セマンティックセグメンテーションモデルを用いて,ScanNetおよびScanNet200データセットの最先端性能を推し進める。
論文 参考訳(メタデータ) (2024-10-17T14:44:35Z) - P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders [32.85484320025852]
本研究では,画像から持ち上げた実データと擬似3Dデータを利用した自己教師付き事前学習フレームワークを,大深度推定モデルにより提案する。
提案手法は,3次元分類および少数ショット学習における最先端性能を高い事前学習と下流微調整効率を維持しながら達成する。
論文 参考訳(メタデータ) (2024-08-19T13:59:53Z) - Let Me DeCode You: Decoder Conditioning with Tabular Data [0.15487122608774898]
本稿では,ラベルから派生した特徴をモデル条件付けに利用し,デコーダを動的にリコンストラクションするDeCodeを提案する。
DeCodeは3次元ラベル形状特徴の学習数値表現による条件付埋め込みの導入による3次元セグメンテーション性能の向上に重点を置いている。
以上の結果から,DeCode は従来の非条件モデルよりも高い性能を示し,計算コストの低減による精度の向上を実現している。
論文 参考訳(メタデータ) (2024-07-12T17:14:33Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud
Registration [69.21282992341007]
Auto Synthは、ポイントクラウド登録のための3Dトレーニングデータを自動的に生成する。
私たちはポイントクラウド登録ネットワークをもっと小さなサロゲートネットワークに置き換え、4056.43$のスピードアップを実現しました。
TUD-L,LINEMOD,Occluded-LINEMODに関する我々の研究結果は,検索データセットでトレーニングされたニューラルネットワークが,広く使用されているModelNet40データセットでトレーニングされたニューラルネットワークよりも一貫してパフォーマンスが向上していることを示す。
論文 参考訳(メタデータ) (2023-09-20T09:29:44Z) - Self-Supervised Learning with Multi-View Rendering for 3D Point Cloud
Analysis [33.31864436614945]
本稿では,3次元点雲モデルのための新しい事前学習手法を提案する。
我々の事前訓練は、局所的なピクセル/ポイントレベルの対応損失と、大域的な画像/ポイントの雲のレベル損失によって自己管理される。
これらの改善されたモデルは、さまざまなデータセットや下流タスクにおける既存の最先端メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-10-28T05:23:03Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - A Novel Neural Network Training Method for Autonomous Driving Using
Semi-Pseudo-Labels and 3D Data Augmentations [0.0]
自律運転のために3Dオブジェクト検出を行うためにニューラルネットワークを訓練するには、多種多様な注釈付きデータが必要である。
我々は3次元物体検出のための畳み込みニューラルネットワークを設計した。
論文 参考訳(メタデータ) (2022-07-20T13:04:08Z) - AttDLNet: Attention-based DL Network for 3D LiDAR Place Recognition [0.6352264764099531]
本稿では,AttDLNetという3次元LiDARに基づくディープラーニングネットワークを提案する。
注意機構を利用して、長距離コンテキストと機能間関係に選択的にフォーカスする。
その結果、エンコーダネットワークの機能は、すでに非常に説明力があるが、ネットワークに注意を加えることで、パフォーマンスがさらに向上していることがわかった。
論文 参考訳(メタデータ) (2021-06-17T16:34:37Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Exemplar Fine-Tuning for 3D Human Model Fitting Towards In-the-Wild 3D
Human Pose Estimation [107.07047303858664]
3次元の地平線アノテーションを持つ大規模な人的データセットは、野生では入手が困難である。
既存の2Dデータセットを高品質な3Dポーズマッチングで拡張することで、この問題に対処する。
結果として得られるアノテーションは、3Dのプロシージャネットワークをスクラッチからトレーニングするのに十分である。
論文 参考訳(メタデータ) (2020-04-07T20:21:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。