論文の概要: Deep vanishing point detection: Geometric priors make dataset variations
vanish
- arxiv url: http://arxiv.org/abs/2203.08586v1
- Date: Wed, 16 Mar 2022 12:34:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-17 15:35:00.260979
- Title: Deep vanishing point detection: Geometric priors make dataset variations
vanish
- Title(参考訳): 深い消失点検出:幾何学的優先はデータセットの変動を消失させる
- Authors: Yancong Lin, Ruben Wiersma, Silvia L. Pintea, Klaus Hildebrandt, Elmar
Eisemann, and Jan C. van Gemert
- Abstract要約: ディープラーニングは画像の消滅点検出を改善した。
しかし、ディープネットワークは高価なハードウェアでトレーニングされた高価なアノテートデータセットを必要とする。
ここでは、これらの問題に対して、事前知識で深い消滅点検出ネットワークを注入することで対処する。
- 参考スコア(独自算出の注目度): 24.348651041697114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning has improved vanishing point detection in images. Yet, deep
networks require expensive annotated datasets trained on costly hardware and do
not generalize to even slightly different domains, and minor problem variants.
Here, we address these issues by injecting deep vanishing point detection
networks with prior knowledge. This prior knowledge no longer needs to be
learned from data, saving valuable annotation efforts and compute, unlocking
realistic few-sample scenarios, and reducing the impact of domain changes.
Moreover, the interpretability of the priors allows to adapt deep networks to
minor problem variations such as switching between Manhattan and non-Manhattan
worlds. We seamlessly incorporate two geometric priors: (i) Hough Transform --
mapping image pixels to straight lines, and (ii) Gaussian sphere -- mapping
lines to great circles whose intersections denote vanishing points.
Experimentally, we ablate our choices and show comparable accuracy to existing
models in the large-data setting. We validate our model's improved data
efficiency, robustness to domain changes, adaptability to non-Manhattan
settings.
- Abstract(参考訳): ディープラーニングは画像の消滅点検出を改善した。
しかし、ディープネットワークは高価なハードウェアでトレーニングされた高価なアノテートデータセットを必要とし、わずかに異なるドメインに一般化することはない。
本稿では,これらの問題に対して,事前知識のある深い消失点検出ネットワークを注入することで対処する。
この事前知識は、もはやデータから学ぶ必要はなく、貴重なアノテーションの労力と計算を省き、現実的な最小限のシナリオを解き放ち、ドメインの変更の影響を減らす。
さらに、事前の解釈可能性により、マンハッタンと非マンハッタン世界の切り替えのような小さな問題にディープネットワークを適用することができる。
2つの幾何学的前提をシームレスに組み込む。
(i)ハフ変換 -画像画素を直線にマッピングし、
(ii) ガウス球面 -- 交叉が零点を表す大円に直線を写像する。
実験により、我々は選択肢を減らし、大規模データ設定における既存のモデルに匹敵する精度を示す。
モデルの改善したデータ効率、ドメイン変更に対する堅牢性、非マンハッタン設定への適応性を検証する。
関連論文リスト
- CMG-Net: Robust Normal Estimation for Point Clouds via Chamfer Normal
Distance and Multi-scale Geometry [23.86650228464599]
この研究は、点雲から正規度を推定するための正確で堅牢な方法を示す。
まず,この問題に対処するため,シャンファー正規距離(Chamfer Normal Distance)と呼ばれる新しい尺度を提案する。
マルチスケールな局所的特徴集約と階層的幾何情報融合を含む革新的なアーキテクチャを考案する。
論文 参考訳(メタデータ) (2023-12-14T17:23:16Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Capsules as viewpoint learners for human pose estimation [4.246061945756033]
カメラが大きな視点変化を受けると、ほとんどのニューラルネットワークがうまく一般化できないことを示す。
本稿では,高速な変分ベイズルーティングとマトリックスカプセルを用いた,エンドツーエンドのポジショニング等価なカプセルオートエンコーダを提案する。
複数のタスクやデータセットに対して、他の望ましい特性を維持しながら、最先端の結果を得る。
論文 参考訳(メタデータ) (2023-02-13T09:01:46Z) - Deep Surface Reconstruction from Point Clouds with Visibility
Information [66.05024551590812]
視認性情報により生点雲を増大させる2つの簡単な方法を提案する。
提案手法は, 生成面の精度を向上するとともに, ネットワークの形状領域に対する一般化能力も向上する。
論文 参考訳(メタデータ) (2022-02-03T19:33:47Z) - Avoiding Overfitting: A Survey on Regularization Methods for
Convolutional Neural Networks [0.0]
畳み込みニューラルネットワーク(CNN)により、画像処理タスクが大幅に改善されている。
トレーニングにおける重要な要素は、ネットワークの正規化であり、構造が過度に適合することを防ぐ。
この研究は、過去数年間に開発されたいくつかの正規化手法を分析し、異なるCNNモデルの大幅な改善を示す。
論文 参考訳(メタデータ) (2022-01-10T11:54:06Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - A Point-Cloud Deep Learning Framework for Prediction of Fluid Flow
Fields on Irregular Geometries [62.28265459308354]
ネットワークは空間位置とCFD量のエンドツーエンドマッピングを学習する。
断面形状の異なるシリンダーを過ぎる非圧縮層状定常流を考察する。
ネットワークは従来のCFDの数百倍の速さで流れ場を予測する。
論文 参考訳(メタデータ) (2020-10-15T12:15:02Z) - Improving Deep Stereo Network Generalization with Geometric Priors [93.09496073476275]
地上の真実が密集した多様な現実世界のシーンの大規模なデータセットを得ることは困難である。
多くのアルゴリズムは、似たようなシーンや合成データセットの小さな実世界のデータセットに依存している。
本稿では,シーン幾何学の事前知識をエンド・ツー・エンドのステレオネットワークに統合し,ネットワークの一般化を支援することを提案する。
論文 参考訳(メタデータ) (2020-08-25T15:24:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。