論文の概要: Deconstructing Self-Supervised Monocular Reconstruction: The Design
Decisions that Matter
- arxiv url: http://arxiv.org/abs/2208.01489v1
- Date: Tue, 2 Aug 2022 14:38:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:01:49.390402
- Title: Deconstructing Self-Supervised Monocular Reconstruction: The Design
Decisions that Matter
- Title(参考訳): 自己監督型単分子再構成の再構築--重要な設計決定
- Authors: Jaime Spencer Martin, Chris Russell, Simon Hadfield, Richard Bowden
- Abstract要約: 本稿では,自己教師付き単分子深度推定への最先端の貢献を評価するための枠組みを提案する。
事前トレーニング、バックボーン、アーキテクチャ設計の選択、損失関数が含まれる。
我々は16の最先端コントリビューションを再実装し、検証し、再評価し、新しいデータセットを導入します。
- 参考スコア(独自算出の注目度): 63.5550818034739
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents an open and comprehensive framework to systematically
evaluate state-of-the-art contributions to self-supervised monocular depth
estimation. This includes pretraining, backbone, architectural design choices
and loss functions. Many papers in this field claim novelty in either
architecture design or loss formulation. However, simply updating the backbone
of historical systems results in relative improvements of 25%, allowing them to
outperform the majority of existing systems. A systematic evaluation of papers
in this field was not straightforward. The need to compare like-with-like in
previous papers means that longstanding errors in the evaluation protocol are
ubiquitous in the field. It is likely that many papers were not only optimized
for particular datasets, but also for errors in the data and evaluation
criteria. To aid future research in this area, we release a modular codebase,
allowing for easy evaluation of alternate design decisions against corrected
data and evaluation criteria. We re-implement, validate and re-evaluate 16
state-of-the-art contributions and introduce a new dataset (SYNS-Patches)
containing dense outdoor depth maps in a variety of both natural and urban
scenes. This allows for the computation of informative metrics in complex
regions such as depth boundaries.
- Abstract(参考訳): 本稿では,自己監督型単眼深度推定への最先端の貢献を体系的に評価するための,オープンかつ包括的な枠組みを提案する。
これには事前トレーニング、バックボーン、アーキテクチャ設計の選択、損失関数が含まれる。
この分野における多くの論文は、アーキテクチャ設計または損失定式化において新規性を主張している。
しかし、単に履歴システムのバックボーンを更新するだけで25%の相対的な改善が得られ、既存のシステムの大半を上回ります。
この分野での論文の体系的な評価は単純ではなかった。
前回の論文でlike-with-likeを比較する必要性は、評価プロトコルの長年のエラーがこの分野でユビキタスであることを意味する。
多くの論文が特定のデータセットに最適化されただけでなく、データや評価基準のエラーにも最適化された可能性が高い。
この分野での今後の研究を支援するために,我々は,修正データと評価基準に対する代替設計決定の簡易な評価を可能にするモジュール型コードベースをリリースする。
我々は,16の最先端コントリビューションを再実装し,検証し,再評価し,自然と都市の両方で密集した屋外深度マップを含む新しいデータセット(SYNS-Patches)を導入する。
これにより、深度境界のような複雑な領域における情報メトリクスの計算が可能になる。
関連論文リスト
- On the Evaluation Consistency of Attribution-based Explanations [42.1421504321572]
本稿では,画像領域における属性メソッドのベンチマークを行うオープンプラットフォームであるMeta-Rankを紹介する。
1) 異なる設定下での属性評価手法の評価は、異なる性能ランキングを得ることができ、2) 多数のケースで矛盾するが、同一のトレーニング軌道に沿った個別のチェックポイントにまたがる顕著な一貫性を示す。
論文 参考訳(メタデータ) (2024-07-28T11:49:06Z) - QBI: Quantile-Based Bias Initialization for Efficient Private Data Reconstruction in Federated Learning [0.5497663232622965]
フェデレーション学習は、ユーザのプライバシを損なうことなく、分散データ上で機械学習モデルのトレーニングを可能にする。
近年の研究では、中央のエンティティが共有モデル更新からプライベートデータを完全に再構築できることが示されている。
論文 参考訳(メタデータ) (2024-06-26T20:19:32Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Revisiting Evaluation Metrics for Semantic Segmentation: Optimization
and Evaluation of Fine-grained Intersection over Union [113.20223082664681]
そこで本研究では,mIoUsの微細化と,それに対応する最悪の指標を提案する。
これらのきめ細かいメトリクスは、大きなオブジェクトに対するバイアスの低減、よりリッチな統計情報、モデルとデータセット監査に関する貴重な洞察を提供する。
ベンチマークでは,1つの測定値に基づかないことの必要性を強調し,微細なmIoUsが大きな物体への偏りを減少させることを確認した。
論文 参考訳(メタデータ) (2023-10-30T03:45:15Z) - The Second Monocular Depth Estimation Challenge [93.1678025923996]
MDEC (Monocular Depth Estimation Challenge) の第2版は、いかなる種類の監視方法にも開放された。
この課題はSynS-Patchesデータセットをベースとしており、高品質な高密度地下構造を持つ多様な環境を特徴としている。
上位の監督官は相対的なFスコアを27.62%改善し、上位の監督官は16.61%改善した。
論文 参考訳(メタデータ) (2023-04-14T11:10:07Z) - tieval: An Evaluation Framework for Temporal Information Extraction
Systems [2.3035364984111495]
過去20年間、時間的情報抽出は大きな関心を集めてきた。
大量のコーパスにアクセスすることは、TIEシステムのベンチマークに関して難しい。
tievalはPythonライブラリで、異なるコーパスをインポートするための簡潔なインターフェースを提供し、システム評価を容易にする。
論文 参考訳(メタデータ) (2023-01-11T18:55:22Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Fairness and underspecification in acoustic scene classification: The
case for disaggregated evaluations [6.186191586944725]
機械学習(ML)アプリケーションにおける不明瞭さと公平さは、最近、MLコミュニティで2つの顕著な問題となっている。
本研究では,アコースティックシーン分類(ASC)モデルに対して,非凝集評価によるより包括的な評価プロセスの必要性を論じる。
本研究では,2つの広く使用されているASCデータセットを用いたトレーニングにおいて,不特定性や公平性の問題を明らかにする上で,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-10-04T15:23:01Z) - Contextual Fine-to-Coarse Distillation for Coarse-grained Response
Selection in Open-Domain Conversations [48.046725390986595]
オープンドメイン会話における粗粒度応答選択のための文脈ファイン・ツー・コアス(CFC)蒸留モデルを提案する。
提案モデルの性能を評価するため,RedditコメントダンプとTwitterコーパスに基づく2つの新しいデータセットを構築した。
論文 参考訳(メタデータ) (2021-09-24T08:22:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。