論文の概要: Enhancing Monocular Height Estimation via Weak Supervision from Imperfect Labels
- arxiv url: http://arxiv.org/abs/2506.02534v1
- Date: Tue, 03 Jun 2025 07:14:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.388208
- Title: Enhancing Monocular Height Estimation via Weak Supervision from Imperfect Labels
- Title(参考訳): 不完全なラベルからの弱スーパービジョンによる単色高さ推定の強化
- Authors: Sining Chen, Yilei Shi, Xiao Xiang Zhu,
- Abstract要約: 我々は,不完全なラベル付きデータを画素高度推定ネットワークのトレーニングに導入する。
単分子高さ推定ネットワークと互換性のあるアンサンブルベースのパイプラインを提案する。
- 参考スコア(独自算出の注目度): 17.495701574116087
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular height estimation is considered the most efficient and cost-effective means of 3D perception in remote sensing, and it has attracted much attention since the emergence of deep learning. While training neural networks requires a large amount of data, data with perfect labels are scarce and only available within developed regions. The trained models therefore lack generalizability, which limits the potential for large-scale application of existing methods. We tackle this problem for the first time, by introducing data with imperfect labels into training pixel-wise height estimation networks, including labels that are incomplete, inexact, and inaccurate compared to high-quality labels. We propose an ensemble-based pipeline compatible with any monocular height estimation network. Taking the challenges of noisy labels, domain shift, and long-tailed distribution of height values into consideration, we carefully design the architecture and loss functions to leverage the information concealed in imperfect labels using weak supervision through balanced soft losses and ordinal constraints. We conduct extensive experiments on two datasets with different resolutions, DFC23 (0.5 to 1 m) and GBH (3 m). The results indicate that the proposed pipeline outperforms baselines by achieving more balanced performance across various domains, leading to improvements of average root mean square errors up to 22.94 %, and 18.62 % on DFC23 and GBH, respectively. The efficacy of each design component is validated through ablation studies. Code is available at https://github.com/zhu-xlab/weakim2h.
- Abstract(参考訳): 単眼身長推定はリモートセンシングにおいて最も効率的かつコスト効率のよい3次元知覚手段と考えられており,ディープラーニングの出現以来注目されている。
ニューラルネットワークのトレーニングには大量のデータが必要だが、完全なラベルを持つデータはほとんどなく、先進的なリージョンでしか利用できない。
したがって、訓練されたモデルは、既存の方法の大規模適用の可能性を制限する一般化性に欠ける。
高品質なラベルと比較して不完全で不正確で不正確なラベルを含む,画素高推定のトレーニングネットワークに不完全ラベル付きデータを導入することで,この問題に初めて対処する。
単分子高さ推定ネットワークと互換性のあるアンサンブルベースのパイプラインを提案する。
ノイズラベルやドメインシフト,高所値の長期分布といった課題を考慮に入れ,不完全なラベルに隠された情報を,バランスの取れたソフトロスや規則的制約を通じて,弱い監督によって活用するために,アーキテクチャと損失関数を慎重に設計する。
DFC23(0.5~1m)とGBH(3m)の2つの異なる解像度のデータセットに対して広範な実験を行った。
提案したパイプラインは、様々な領域でよりバランスの取れた性能を達成し、平均根平均平方誤差を22.94 %、DFC23とGBHでは18.62 %に改善した。
各設計成分の有効性はアブレーション研究によって検証される。
コードはhttps://github.com/zhu-xlab/weakim2h.comから入手できる。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - An Embedding is Worth a Thousand Noisy Labels [0.11999555634662634]
本稿では,重み付けされたアダプティブNearest Neighborアプローチを用いてラベルノイズに対処するWANNを提案する。
WANNの参照手法は、様々な大きさの多様なデータセットや、様々なノイズタイプや重大さで優れていることを示す。
私たちのアプローチは、効率性と説明可能性を強調し、ディープニューラルネットワークトレーニングの固有の制限を克服するための、シンプルで堅牢なソリューションとして現れます。
論文 参考訳(メタデータ) (2024-08-26T15:32:31Z) - Weakly-supervised positional contrastive learning: application to
cirrhosis classification [45.63061034568991]
大規模な医療画像データセットは、低信頼で弱いラベルで安価に注釈を付けることができる。
組織学に基づく診断のような高信頼なラベルへのアクセスは稀で費用がかかる。
提案手法は,効率的な弱教師付き位置対応学習戦略 (WSP) を提案する。
論文 参考訳(メタデータ) (2023-07-10T15:02:13Z) - Industrial Anomaly Detection and Localization Using Weakly-Supervised Residual Transformers [44.344548601242444]
Weakly-supervised RESidual Transformer (WeakREST) という新しいフレームワークを導入し,高い異常検出精度を実現する。
画素単位の異常局所化タスクをブロック単位の分類問題に再構成する。
弱いラベルと残差に基づく表現との相互作用を処理できるResMixMatchアルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-06-06T08:19:30Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - Danish Fungi 2020 -- Not Just Another Image Recognition Dataset [0.0]
デンマークのFungi 2020(DF20)という新しいきめ細かいデータセットとベンチマークを紹介します。
データセットはデンマークの菌類アトラスに提出された観測結果から構築されている。
df20はimagenetと重複しないため、imagenetの公開チェックポイントから微調整されたモデルの偏りのない比較が可能になる。
論文 参考訳(メタデータ) (2021-03-18T09:33:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。