論文の概要: A Dataset-Dispersion Perspective on Reconstruction Versus Recognition in
Single-View 3D Reconstruction Networks
- arxiv url: http://arxiv.org/abs/2111.15158v1
- Date: Tue, 30 Nov 2021 06:33:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:08:23.810853
- Title: A Dataset-Dispersion Perspective on Reconstruction Versus Recognition in
Single-View 3D Reconstruction Networks
- Title(参考訳): シングルビュー3次元再構成ネットワークにおける再構成頂点認識のデータセット分散的視点
- Authors: Yefan Zhou, Yiru Shen, Yujun Yan, Chen Feng, Yaoqing Yang
- Abstract要約: 我々は、この先行要因を定量化し、そのNNへの影響を研究するために、新しいデータ駆動計量である分散スコアを導入する。
提案手法は, 従来の再建スコアに加えて, 復元品質を解析し, 新たな情報を提供する主要な方法であることを示す。
- 参考スコア(独自算出の注目度): 16.348294592961327
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Neural networks (NN) for single-view 3D reconstruction (SVR) have gained in
popularity. Recent work points out that for SVR, most cutting-edge NNs have
limited performance on reconstructing unseen objects because they rely
primarily on recognition (i.e., classification-based methods) rather than shape
reconstruction. To understand this issue in depth, we provide a systematic
study on when and why NNs prefer recognition to reconstruction and vice versa.
Our finding shows that a leading factor in determining recognition versus
reconstruction is how dispersed the training data is. Thus, we introduce the
dispersion score, a new data-driven metric, to quantify this leading factor and
study its effect on NNs. We hypothesize that NNs are biased toward recognition
when training images are more dispersed and training shapes are less dispersed.
Our hypothesis is supported and the dispersion score is proved effective
through our experiments on synthetic and benchmark datasets. We show that the
proposed metric is a principal way to analyze reconstruction quality and
provides novel information in addition to the conventional reconstruction
score.
- Abstract(参考訳): シングルビュー3D再構成(SVR)のためのニューラルネットワーク(NN)が人気を集めている。
最近の研究によると、SVRでは、ほとんどの最先端NNは、形状再構成よりも認識(分類に基づく手法)に依存しているため、見えない物体を再構成する性能が限られている。
この問題を深く理解するために、NNが再建よりも認識を優先する時期と理由について体系的な研究を行った。
我々の発見は、認識と再構成を区別する主要な要因がトレーニングデータの分散であることを示している。
そこで本研究では,この先行要因の定量化と,そのNNへの影響を検討するために,新しいデータ駆動尺度である分散スコアを導入する。
トレーニング画像が分散し、トレーニング形状が分散しにくくなると、NNは認識に偏っているという仮説を立てる。
我々の仮説は支持され, 分散スコアは, 合成およびベンチマークデータセットの実験により有効であることが証明された。
提案手法は, 従来の再建スコアに加えて, 復元品質を解析し, 新たな情報を提供する主要な方法であることを示す。
関連論文リスト
- On the Reconstruction of Training Data from Group Invariant Networks [26.3215664733825]
トレーニングされたニューラルネットワークからトレーニングデータを再構築することは、プライバシと説明可能性に重要な意味を持つ研究の活発な領域である。
近年の進歩は、このプロセスが複数のデータタイプに対して実現可能であることを実証している。
しかし、グループ不変のニューラルネットワークからのデータ再構成は、ほとんど探索されていない別の課題を引き起こす。
論文 参考訳(メタデータ) (2024-11-25T15:05:00Z) - DCNN: Dual Cross-current Neural Networks Realized Using An Interactive Deep Learning Discriminator for Fine-grained Objects [48.65846477275723]
本研究では、微細な画像分類の精度を向上させるために、新しい二重電流ニューラルネットワーク(DCNN)を提案する。
弱い教師付き学習バックボーンモデルを構築するための新しい特徴として、(a)異種データの抽出、(b)特徴マップの解像度の維持、(c)受容領域の拡大、(d)グローバル表現と局所特徴の融合などがある。
論文 参考訳(メタデータ) (2024-05-07T07:51:28Z) - Understanding and Leveraging the Learning Phases of Neural Networks [7.1169582271841625]
深層ニューラルネットワークの学習力学はよく理解されていない。
本研究では,入力および予測性能の層再構築能力について検討し,学習力学を包括的に解析する。
本稿では,ResNetやVGGといった共通データセットとアーキテクチャを用いた3つのフェーズの存在を示す。
論文 参考訳(メタデータ) (2023-12-11T23:20:58Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Robust Geometry-Preserving Depth Estimation Using Differentiable
Rendering [93.94371335579321]
我々は、余分なデータやアノテーションを必要とせずに、幾何学保存深度を予測するためにモデルを訓練する学習フレームワークを提案する。
包括的な実験は、我々のフレームワークの優れた一般化能力を強調します。
我々の革新的な損失関数は、ドメイン固有のスケール・アンド・シフト係数を自律的に復元するモデルを可能にします。
論文 参考訳(メタデータ) (2023-09-18T12:36:39Z) - Neural Poisson Surface Reconstruction: Resolution-Agnostic Shape
Reconstruction from Point Clouds [53.02191521770926]
我々は,3次元形状を点から復元するという課題に対処する形状再構成アーキテクチャであるニューラルポアソン表面再構成(nPSR)を導入する。
nPSRには2つの大きな利点がある: まず、高分解能評価において同等の性能を達成しつつ、低分解能データの効率的なトレーニングを可能にする。
全体として、ニューラル・ポアソン表面の再構成は、形状再構成における古典的なディープニューラルネットワークの限界を改良するだけでなく、再構築品質、走行時間、分解能非依存の観点からも優れた結果が得られる。
論文 参考訳(メタデータ) (2023-08-03T13:56:07Z) - NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction [64.36535692191343]
暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示しており、オンラインSLAMシステムの可能性も最近示している。
本論文は,1)新しい表現に基づく視点計画の質を評価するための基準を求めること,2)手作りではなく,異なる場面に一般化可能なデータから基準を学習すること,の2つの課題に対処する。
本手法は, TSDFを用いた変形モデルやビュープランニングなしでの再構成モデルと比較した場合, レンダリングされた画像品質と再構成された3次元モデルの幾何学的品質について, 様々な指標について有意な改善を示す。
論文 参考訳(メタデータ) (2022-07-22T10:05:36Z) - The learning phases in NN: From Fitting the Majority to Fitting a Few [2.5991265608180396]
本研究では、学習中のパラメータの進化に基づいて、入力と予測性能の層再構成能力を分析する。
また、ResNetやVGGといったコンピュータビジョンから、共通のデータセットやアーキテクチャを用いて行動を評価する。
論文 参考訳(メタデータ) (2022-02-16T19:11:42Z) - Self-Supervised Learning for MRI Reconstruction with a Parallel Network
Training Framework [24.46388892324129]
提案手法は柔軟であり,既存のディープラーニング手法にも適用可能である。
本手法の有効性を、オープン脳MRIデータセットを用いて評価する。
論文 参考訳(メタデータ) (2021-09-26T06:09:56Z) - Over-and-Under Complete Convolutional RNN for MRI Reconstruction [57.95363471940937]
MR画像再構成のための最近のディープラーニングに基づく手法は、通常、汎用的なオートエンコーダアーキテクチャを利用する。
OUCR(Over-and-Under Complete Convolu?tional Recurrent Neural Network)を提案する。
提案手法は, トレーニング可能なパラメータの少ない圧縮されたセンシングと, 一般的なディープラーニングに基づく手法に対して, 大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-06-16T15:56:34Z) - Procrustean Regression Networks: Learning 3D Structure of Non-Rigid
Objects from 2D Annotations [42.476537776831314]
非剛体物体の3次元情報を学習できるニューラルネットワークの学習フレームワークを提案する。
提案手法は,Human 3.6M,300-VW,SURREALデータセット上での最先端手法よりも優れた再構成性能を示す。
論文 参考訳(メタデータ) (2020-07-21T17:29:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。