論文の概要: TSE-Net: Semi-supervised Monocular Height Estimation from Single Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2511.13552v1
- Date: Mon, 17 Nov 2025 16:22:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 18:52:09.595129
- Title: TSE-Net: Semi-supervised Monocular Height Estimation from Single Remote Sensing Images
- Title(参考訳): TSE-Net:単一リモートセンシング画像からの半教師付き単眼高さ推定
- Authors: Sining Chen, Xiao Xiang Zhu,
- Abstract要約: TSE-Netは半教師付き単分子高さ推定のための自己学習パイプラインである。
パイプラインは教師、学生、試験ネットワークを統合している。
提案したパイプラインを,解像度の異なる3つのデータセットで評価し,画像のモダリティを評価する。
- 参考スコア(独自算出の注目度): 10.375329759512702
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular height estimation plays a critical role in 3D perception for remote sensing, offering a cost-effective alternative to multi-view or LiDAR-based methods. While deep learning has significantly advanced the capabilities of monocular height estimation, these methods remain fundamentally limited by the availability of labeled data, which are expensive and labor-intensive to obtain at scale. The scarcity of high-quality annotations hinders the generalization and performance of existing models. To overcome this limitation, we propose leveraging large volumes of unlabeled data through a semi-supervised learning framework, enabling the model to extract informative cues from unlabeled samples and improve its predictive performance. In this work, we introduce TSE-Net, a self-training pipeline for semi-supervised monocular height estimation. The pipeline integrates teacher, student, and exam networks. The student network is trained on unlabeled data using pseudo-labels generated by the teacher network, while the exam network functions as a temporal ensemble of the student network to stabilize performance. The teacher network is formulated as a joint regression and classification model: the regression branch predicts height values that serve as pseudo-labels, and the classification branch predicts height value classes along with class probabilities, which are used to filter pseudo-labels. Height value classes are defined using a hierarchical bi-cut strategy to address the inherent long-tailed distribution of heights, and the predicted class probabilities are calibrated with a Plackett-Luce model to reflect the expected accuracy of pseudo-labels. We evaluate the proposed pipeline on three datasets spanning different resolutions and imaging modalities. Codes are available at https://github.com/zhu-xlab/tse-net.
- Abstract(参考訳): 単眼身長推定はリモートセンシングにおいて重要な役割を担い、マルチビュー法やLiDAR法に代わる費用対効果を提供する。
深層学習は単分子高さ推定の能力を著しく向上させてきたが、これらの手法は、高価で大規模に得られる労働集約的なラベル付きデータの可用性によって、基本的に制限されている。
高品質なアノテーションの不足は、既存のモデルの一般化と性能を妨げる。
この制限を克服するため、半教師付き学習フレームワークを通じて大量の未ラベルデータを活用し、未ラベルサンプルから情報的手がかりを抽出し、予測性能を向上させることを提案する。
本研究では,半教師付き単分子高さ推定のための自己学習パイプラインであるTSE-Netを紹介する。
パイプラインは教師、学生、試験ネットワークを統合している。
学生ネットワークは教師ネットワークが生成した擬似ラベルを用いて未ラベルデータに基づいて訓練され、試験ネットワークは学生ネットワークの時間的アンサンブルとして機能し、性能を安定させる。
回帰分枝は擬似ラベルとして機能する高さ値を予測し、分類分枝は擬似ラベルをフィルタリングするクラス確率とともに高さ値クラスを予測する。
高さのクラスは、高さの固有長尾分布に対処するために階層的二切断戦略を用いて定義され、予測されたクラス確率は、擬似ラベルの予測精度を反映するために、プラケット・リュックモデルでキャリブレーションされる。
提案したパイプラインを,解像度の異なる3つのデータセットで評価し,画像のモダリティを評価する。
コードはhttps://github.com/zhu-xlab/tse-net.comで公開されている。
関連論文リスト
- Feedback-Driven Pseudo-Label Reliability Assessment: Redefining Thresholding for Semi-Supervised Semantic Segmentation [5.7977777220041204]
擬似スーパービジョンの一般的な実践は、事前に定義された信頼しきい値やエントロピーに基づいて擬似ラベルをフィルタリングすることである。
疑似ラベル選択のための動的フィードバック駆動しきい値決定手法であるEnsemble-of-Confidence Reinforcement (ENCORE)を提案する。
提案手法は,既存の擬似スーパービジョンフレームワークにシームレスに統合され,セグメンテーション性能が大幅に向上する。
論文 参考訳(メタデータ) (2025-05-12T15:58:08Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Versatile Teacher: A Class-aware Teacher-student Framework for Cross-domain Adaptation [2.9748058103007957]
私たちはVersatile Teacher(VT)という新しい教師学生モデルを紹介します。
VTはクラス固有の検出困難を考慮し、2段階の擬似ラベル選択機構を用いてより信頼性の高い擬似ラベルを生成する。
提案手法は,3つのベンチマークデータセットに対して有望な結果を示し,広範に使用されている1段検出器のアライメント手法を拡張した。
論文 参考訳(メタデータ) (2024-05-20T03:31:43Z) - Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。
本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文 参考訳(メタデータ) (2024-04-26T06:00:27Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Guided Point Contrastive Learning for Semi-supervised Point Cloud
Semantic Segmentation [90.2445084743881]
そこで本研究では,モデル性能を向上させるために,未ラベルの点群をトレーニングに採用するための半教師付き点群セマンティックセマンティックセマンティックセマンティクスを提案する。
近年の自己監督型タスクのコントラスト損失に触発されて,特徴表現とモデル一般化能力を高めるためのガイド付きポイントコントラスト損失を提案する。
論文 参考訳(メタデータ) (2021-10-15T16:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。