論文の概要: Towards Explainability in Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2310.16457v1
- Date: Wed, 25 Oct 2023 08:31:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 15:58:20.214367
- Title: Towards Explainability in Monocular Depth Estimation
- Title(参考訳): 単眼深度推定における説明可能性に向けて
- Authors: Vasileios Arampatzakis and George Pavlidis and Kyriakos Pantoglou and
Nikolaos Mitianoudis and Nikos Papamarkos
- Abstract要約: 本稿では,人間が深度をどう知覚するかという観点から,単分子深度推定法における説明可能性に着目した。
我々は、定義した文脈における説明可能性を間接的に評価するために、最先端の手法を試した。
その結果, 平均精度は約77%であることがわかった。
- 参考スコア(独自算出の注目度): 1.7972023538959876
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The estimation of depth in two-dimensional images has long been a challenging
and extensively studied subject in computer vision. Recently, significant
progress has been made with the emergence of Deep Learning-based approaches,
which have proven highly successful. This paper focuses on the explainability
in monocular depth estimation methods, in terms of how humans perceive depth.
This preliminary study emphasizes on one of the most significant visual cues,
the relative size, which is prominent in almost all viewed images. We designed
a specific experiment to mimic the experiments in humans and have tested
state-of-the-art methods to indirectly assess the explainability in the context
defined. In addition, we observed that measuring the accuracy required further
attention and a particular approach is proposed to this end. The results show
that a mean accuracy of around 77% across methods is achieved, with some of the
methods performing markedly better, thus, indirectly revealing their
corresponding potential to uncover monocular depth cues, like relative size.
- Abstract(参考訳): 2次元画像の深度推定は、コンピュータビジョンにおいて長年、困難かつ広範囲に研究されてきた課題である。
近年、ディープラーニングベースのアプローチが出現し、大きな進歩を遂げている。
本稿では,人間が深度をどう知覚するかという観点から,単分子深度推定法における説明可能性に着目した。
この予備的研究は、ほぼすべての画像で顕著な、最も重要な視覚的手がかりである相対的な大きさの1つを強調している。
我々は,人間の実験を模倣する特定の実験をデザインし,最先端の手法をテストし,定義した文脈における説明可能性について間接的に評価した。
また, 精度の測定にはさらなる注意が必要であり, 具体的なアプローチが提案されている。
その結果, 平均77%の精度が達成され, いくつかの手法が顕著に向上し, 相対的な大きさなど, 単分子深度を発見できる可能性が間接的に明らかとなった。
関連論文リスト
- DepthCues: Evaluating Monocular Depth Perception in Large Vision Models [37.719313926298085]
本研究では,大規模な事前学習型視覚モデルにおいて,暗黙の深度監視を伴わない深度知覚がどのように起こるかを検討する。
深度キュー理解の評価を目的とした新しいベンチマークDepthCuesを導入する。
我々の分析は、より最近の大型モデルで人間のような深度が現れることを示している。
論文 参考訳(メタデータ) (2024-11-26T12:44:17Z) - On the Uncertain Single-View Depths in Endoscopies [12.779570691818753]
内視鏡画像から深度を推定することは、幅広いAI支援技術の前提条件である。
本稿では,コロンコピーにおける一視点深度推定のためのベイズディープネットワークを初めて検討する。
1)3つのデータセットにおける深度推定のためのベイジアンディープ・ネットワークの網羅的分析を行い,合成から現実へのドメイン変更に関する課題と結論を明らかにするとともに,教師の不確かさを考慮に入れた新しい教師・学生による深度学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T14:24:17Z) - Pseudo Supervised Monocular Depth Estimation with Teacher-Student
Network [90.20878165546361]
疑似監視機構に基づく新しい教師なし深度推定手法を提案する。
これは、教師なしおよび教師なしの単分子深度推定の利点を戦略的に統合する。
実験の結果,提案手法はKITTIベンチマークの最先端性よりも優れていた。
論文 参考訳(メタデータ) (2021-10-22T01:08:36Z) - Deep Long-Tailed Learning: A Survey [163.16874896812885]
ディープ・ロングテール・ラーニング(Deep Long-tailed Learning)は、長いテールのクラス分布に追従する多数の画像から、優れたパフォーマンスのディープモデルをトレーニングすることを目的としている。
長い尾を持つクラス不均衡は、現実的な視覚認識タスクにおいて一般的な問題である。
本稿では,近年の長期学習の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2021-10-09T15:25:22Z) - On the Sins of Image Synthesis Loss for Self-supervised Depth Estimation [60.780823530087446]
画像合成の改善は深度推定の改善を必要としないことを示す。
この発散現象は、データから生じるアレラトリックな不確実性に起因している。
この観察された発散は、以前に報告されたり、深く研究されたりしていない。
論文 参考訳(メタデータ) (2021-09-13T17:57:24Z) - Recent Advances in Monocular 2D and 3D Human Pose Estimation: A Deep
Learning Perspective [69.44384540002358]
この問題に対処するための包括的で包括的な2D-to-3D視点を提供する。
2014年からの主流とマイルストーンのアプローチを統一フレームワークで分類しています。
また,ポーズ表現スタイル,ベンチマーク,評価指標,一般的なアプローチの定量的評価を要約した。
論文 参考訳(メタデータ) (2021-04-23T11:07:07Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z) - Self-Supervised Learning for Monocular Depth Estimation from Aerial
Imagery [0.20072624123275526]
航空画像からの単眼深度推定のための自己教師型学習法を提案する。
このために、単一の移動カメラからの画像シーケンスのみを使用し、深度を同時に推定し、情報をポーズすることを学ぶ。
ポーズと深さ推定の重みを共有することによって、比較的小さなモデルが実現され、リアルタイムの応用が好まれる。
論文 参考訳(メタデータ) (2020-08-17T12:20:46Z) - On the uncertainty of self-supervised monocular depth estimation [52.13311094743952]
単眼深度推定のための自己監督的パラダイムは、基礎的な真理アノテーションを全く必要としないため、非常に魅力的である。
我々は,このタスクの不確かさを推定する方法と,これが深さ精度にどのように影響するかを初めて検討する。
自己教師型アプローチに特化して設計された,斬新な手法を提案する。
論文 参考訳(メタデータ) (2020-05-13T09:00:55Z) - Self-supervised Monocular Trained Depth Estimation using Self-attention
and Discrete Disparity Volume [19.785343302320918]
本研究では,1)自己注意,2)離散的不一致予測という,自己教師付き単分子学習深度推定を改善するための2つの新しいアイデアを提案する。
これらの2つのアイデアにより、最先端の自己教師型単分子深度推定器 Monodepth2 の拡張により、KITTI 2015 と Make3D の分野で最高の結果を生み出すモデルを設計できることを示す。
論文 参考訳(メタデータ) (2020-03-31T04:48:16Z) - Monocular Depth Estimation Based On Deep Learning: An Overview [16.2543991384566]
単一の画像から深度情報(眼深度推定)を推定することは不適切な問題である。
ディープラーニングは最近広く研究され、精度で有望なパフォーマンスを達成した。
深度推定の精度を向上させるために,様々な種類のネットワークフレームワーク,損失関数,トレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-03-14T12:35:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。