論文の概要: Adaptive Learning for Multi-view Stereo Reconstruction
- arxiv url: http://arxiv.org/abs/2404.05181v1
- Date: Mon, 8 Apr 2024 04:13:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 15:33:28.650070
- Title: Adaptive Learning for Multi-view Stereo Reconstruction
- Title(参考訳): 多視点ステレオ再構成のための適応学習
- Authors: Qinglu Min, Jie Zhao, Zhihao Zhang, Chen Min,
- Abstract要約: まず,深度に基づくMVS手法において,既存の損失関数の特性を解析する。
そこで我々は,真と予測される深さの確率分布の違いを狭めることができる適応ワッサースタイン損失という新しい損失関数を提案する。
DTU, Tanks and Temples, BlendedMVS などの異なるベンチマーク実験により,適応的なワッサーシュタイン損失とオフセットモジュールを用いた提案手法が最先端の性能を実現することを示す。
- 参考スコア(独自算出の注目度): 6.635583283522551
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has recently demonstrated its excellent performance on the task of multi-view stereo (MVS). However, loss functions applied for deep MVS are rarely studied. In this paper, we first analyze existing loss functions' properties for deep depth based MVS approaches. Regression based loss leads to inaccurate continuous results by computing mathematical expectation, while classification based loss outputs discretized depth values. To this end, we then propose a novel loss function, named adaptive Wasserstein loss, which is able to narrow down the difference between the true and predicted probability distributions of depth. Besides, a simple but effective offset module is introduced to better achieve sub-pixel prediction accuracy. Extensive experiments on different benchmarks, including DTU, Tanks and Temples and BlendedMVS, show that the proposed method with the adaptive Wasserstein loss and the offset module achieves state-of-the-art performance.
- Abstract(参考訳): 近年,多視点ステレオ(MVS)の課題において,ディープラーニングが優れた性能を示した。
しかし、深部MVSに適用される損失関数はめったに研究されていない。
本稿では,深度に基づくMVS手法において,既存の損失関数の特性を初めて解析する。
回帰に基づく損失は数学的な期待を計算し、分類に基づく損失は離散化された深さの値を出力する。
この目的のために、我々は適応ワッサースタイン損失という新しい損失関数を提案し、これは真と予測される深さの確率分布の差を狭めることができる。
さらに,サブピクセル予測精度を向上させるために,シンプルだが効果的なオフセットモジュールが導入された。
DTU, Tanks and Temples, BlendedMVS など,様々なベンチマークに対する大規模な実験により,適応ワッサーシュタイン損失とオフセットモジュールを用いた提案手法が最先端の性能を達成することを示した。
関連論文リスト
- Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Learning Compact Features via In-Training Representation Alignment [19.273120635948363]
各エポックでは、トレーニングセットからサンプリングしたミニバッチを用いて損失関数の真の勾配を推定する。
In-Training Representation Alignment (ITRA) を提案する。
また,特徴表現学習における一致損失の望ましい影響を厳密に分析する。
論文 参考訳(メタデータ) (2022-11-23T22:23:22Z) - Scaling Forward Gradient With Local Losses [117.22685584919756]
フォワード学習は、ディープニューラルネットワークを学ぶためのバックプロップに代わる生物学的に妥当な代替手段である。
重みよりも活性化に摂動を適用することにより、前方勾配のばらつきを著しく低減できることを示す。
提案手法はMNIST と CIFAR-10 のバックプロップと一致し,ImageNet 上で提案したバックプロップフリーアルゴリズムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-10-07T03:52:27Z) - DS-MVSNet: Unsupervised Multi-view Stereo via Depth Synthesis [11.346448410152844]
本稿では,DS-MVSNetを提案する。DS-MVSNetは,ソース深度合成を備えたエンドツーエンドの教師なしMVS構造である。
確率体積の情報をマイニングするために、確率体積と深度仮説をソースビューにスプラッターすることで、ソース深度を創造的に合成する。
一方,ソース深度を利用して参照画像を描画し,奥行きの整合性損失と深さの滑らかさ損失を提案する。
論文 参考訳(メタデータ) (2022-08-13T15:25:51Z) - Enhancing Multi-view Stereo with Contrastive Matching and Weighted Focal
Loss [10.847120224170698]
コントラスト学習と特徴マッチングに触発された既存ネットワークの性能向上のための新しい手法を提案する。
提案手法は,ベースラインネットワーク上での最先端性能と大幅な改善を実現する。
論文 参考訳(メタデータ) (2022-06-21T13:10:14Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Robust Depth Completion with Uncertainty-Driven Loss Functions [60.9237639890582]
本研究では,不確実性による損失関数を導入し,深度補修の堅牢性を改善し,深度補修の不確実性に対処する。
提案手法は,KITTI深度評価ベンチマークでテストされ,MAE, IMAE, IRMSEの計測値を用いて最先端のロバスト性性能を達成した。
論文 参考訳(メタデータ) (2021-12-15T05:22:34Z) - Improved Point Transformation Methods For Self-Supervised Depth
Prediction [4.103701929881022]
ステレオ画像対やエゴモーション画像対が与えられた場合、単眼深度推定の教師なし学習の一般的な成功方法は、学習した深度予測による画像再構成の品質を測定することである。
本稿では,変換後の点を新しい視点に正しく効率的に処理するzブッフィングアルゴリズムを提案する。
このアルゴリズムは、機械学習ライブラリの典型的なオペレーターによって実装されているため、差別化を自動サポートした既存の教師なし深度学習フレームワークに組み込むことができる。
論文 参考訳(メタデータ) (2021-02-18T03:42:40Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z) - Simple and Effective Prevention of Mode Collapse in Deep One-Class
Classification [93.2334223970488]
深部SVDDにおける超球崩壊を防止するための2つの正則化器を提案する。
第1の正則化器は、標準のクロスエントロピー損失によるランダムノイズの注入に基づいている。
第2の正規化器は、小さすぎるとミニバッチ分散をペナライズする。
論文 参考訳(メタデータ) (2020-01-24T03:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。