Fugu-MT 論文翻訳(概要): How Should One Evaluate Monocular Depth Estimation?

論文の概要: How Should One Evaluate Monocular Depth Estimation?

arxiv url: http://arxiv.org/abs/2510.19814v2
Date: Thu, 30 Oct 2025 19:33:49 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-03 15:46:17.763673
Title: How Should One Evaluate Monocular Depth Estimation?
Title（参考訳）: 単眼深度推定はどのように評価されるべきか?
Authors: Siyang Wu, Jack Nugent, Willow Yang, Jia Deng,
Abstract要約: 本論文は, 地中真実の様々な摂動に対する感度の観点から, 既存の指標を定量的に分析する。相対的な表面の正規度に基づく新しいメトリクスと、新しい深度可視化ツールと、より優れた人間のアライメントを持つ複合メトリクスを作成するための原則的手法を導入する。
参考スコア（独自算出の注目度）: 14.688133150051213
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Monocular depth estimation is an important task with rapid progress, but how to evaluate it remains an open question, as evidenced by a lack of standardization in existing literature and a large selection of evaluation metrics whose trade-offs and behaviors are not well understood. This paper contributes a novel, quantitative analysis of existing metrics in terms of their sensitivity to various types of perturbations of ground truth, emphasizing comparison to human judgment. Our analysis reveals that existing metrics are severely under-sensitive to curvature perturbation such as making flat surfaces wavy. To remedy this, we introduce a new metric based on relative surface normals, along with new depth visualization tools and a principled method to create composite metrics with better human alignment. Code and data are available at: https://github.com/princeton-vl/evalmde.
Abstract（参考訳）: 単眼深度推定は急速な進展にともなう重要な課題であるが、既存の文献の標準化の欠如やトレードオフや行動がよく理解されていない評価指標の大量選択によって証明されているように、どのように評価するかは未解決の問題のままである。本論文は, 地中真実の様々な摂動に対する感受性の観点から, 既存の指標を定量的に分析し, 人的判断との比較を強調した。解析の結果, 既存の測定基準は, 平らな表面を波状にするなどの曲率摂動に非常に敏感であることがわかった。これを改善するために、我々は、相対的な表面の正常度に基づく新しいメトリクスと、新しい深度可視化ツールと、より優れた人間のアライメントを持つ複合メトリクスを作成するための原則化された方法を導入する。コードとデータは、https://github.com/princeton-vl/evalmde.comで入手できる。

関連論文リスト

Evaluating the Evaluators: Metrics for Compositional Text-to-Image Generation [13.460909458745379]
本稿では,コンポジションテキスト画像評価に広く用いられている指標について検討する。我々の分析は単純な相関を超越し、様々な構成課題にまたがってそれらの振る舞いを調べる。結果は、1つのメトリクスがタスク間で一貫した実行をしないことを示している。
論文参考訳（メタデータ） (2025-09-25T14:31:09Z)
Position: All Current Generative Fidelity and Diversity Metrics are Flawed [58.815519650465774]
現在のジェネレーティブの忠実度と多様性の指標がすべて欠陥があることを示します。私たちの目標は、モデルではなく、メトリクスの開発により多くの労力を費やすように研究コミュニティを説得することにあります。
論文参考訳（メタデータ） (2025-05-28T15:10:33Z)
Piecewise-Linear Manifolds for Deep Metric Learning [8.670873561640903]
教師なしの深度学習は、ラベルなしデータのみを使用して意味表現空間を学習することに焦点を当てる。本稿では,各低次元線形片が点の小さな近傍でデータ多様体を近似して高次元データ多様体をモデル化することを提案する。我々は、この類似度推定が、現在の最先端技術の類似度推定よりも基礎的真理と相関していることを実証的に示す。
論文参考訳（メタデータ） (2024-03-22T06:22:20Z)
Cobra Effect in Reference-Free Image Captioning Metrics [58.438648377314436]
視覚言語事前学習モデル(VLM)を活用した参照フリー手法の普及が出現している。本稿では,基準自由度に欠陥があるかどうかを考察する。 GPT-4Vは生成した文を評価するための評価ツールであり,提案手法がSOTA(State-of-the-art)の性能を達成することを示す。
論文参考訳（メタデータ） (2024-02-18T12:36:23Z)
Revisiting Evaluation Metrics for Semantic Segmentation: Optimization and Evaluation of Fine-grained Intersection over Union [113.20223082664681]
そこで本研究では,mIoUsの微細化と,それに対応する最悪の指標を提案する。これらのきめ細かいメトリクスは、大きなオブジェクトに対するバイアスの低減、よりリッチな統計情報、モデルとデータセット監査に関する貴重な洞察を提供する。ベンチマークでは,1つの測定値に基づかないことの必要性を強調し,微細なmIoUsが大きな物体への偏りを減少させることを確認した。
論文参考訳（メタデータ） (2023-10-30T03:45:15Z)
On the Blind Spots of Model-Based Evaluation Metrics for Text Generation [79.01422521024834]
テキスト生成評価指標のロバスト性分析に有用であるが,しばしば無視される手法を探索する。我々は、幅広い潜在的な誤差を設計、合成し、それらが測定値の余計な低下をもたらすかどうかを確認する。私たちの実験では、既存のメトリクスの興味深い不感、バイアス、あるいは抜け穴が明らかになりました。
論文参考訳（メタデータ） (2022-12-20T06:24:25Z)
Evaluation of FEM and MLFEM AI-explainers in Image Classification tasks with reference-based and no-reference metrics [0.0]
画像と映像の分類タスクにおけるCNNの説明のために設計された,最近提案されたポストホック説明器 FEM と MLFEM を思い出させる。基準ベースおよび非参照メトリクスを用いて評価を行う。非参照計量として、Alvarez-Melis と Jaakkola によって提案された「安定」計量を用いる。
論文参考訳（メタデータ） (2022-12-02T14:55:31Z)
SMURF: SeMantic and linguistic UndeRstanding Fusion for Caption Evaluation via Typicality Analysis [20.026835809227283]
情報理論に根ざした評価の新しい定式化である「定型性」を導入する。これらの分割された意味論と流布の次元が、キャプタの違いに関するシステムレベルの洞察をいかに与えているかを示す。提案手法とそれらの組み合わせであるSMURFは,他のルールベース評価指標と比較した場合,人間の判断と最先端の相関が得られた。
論文参考訳（メタデータ） (2021-06-02T19:58:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。