論文の概要: Aerial View River Landform Video segmentation: A Weakly Supervised Context-aware Temporal Consistency Distillation Approach
- arxiv url: http://arxiv.org/abs/2511.16343v1
- Date: Thu, 20 Nov 2025 13:26:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.638761
- Title: Aerial View River Landform Video segmentation: A Weakly Supervised Context-aware Temporal Consistency Distillation Approach
- Title(参考訳): Aerial View River Landform Video segmentation:Weakly Supervised Context-aware Temporal Consistency Distillation Approach
- Authors: Chi-Han Chen, Chieh-Ming Chen, Wen-Huang Cheng, Ching-Chun Huang,
- Abstract要約: UAVリモートセンシングによる地形と地形分類の研究は、地上車両のパトロール作業と大きく異なる。
この研究は、空中位置決め作業において、平均的連邦間(mIoU)と時間的一貫性(TC)の両方が最重要であることを裏付けている。
キーデータのみを選択することは、TCの強化を欠くため、失敗につながるため、完全なラベル付きデータが最適な選択ではないことが示されている。
- 参考スコア(独自算出の注目度): 20.833194584822532
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The study of terrain and landform classification through UAV remote sensing diverges significantly from ground vehicle patrol tasks. Besides grappling with the complexity of data annotation and ensuring temporal consistency, it also confronts the scarcity of relevant data and the limitations imposed by the effective range of many technologies. This research substantiates that, in aerial positioning tasks, both the mean Intersection over Union (mIoU) and temporal consistency (TC) metrics are of paramount importance. It is demonstrated that fully labeled data is not the optimal choice, as selecting only key data lacks the enhancement in TC, leading to failures. Hence, a teacher-student architecture, coupled with key frame selection and key frame updating algorithms, is proposed. This framework successfully performs weakly supervised learning and TC knowledge distillation, overcoming the deficiencies of traditional TC training in aerial tasks. The experimental results reveal that our method utilizing merely 30\% of labeled data, concurrently elevates mIoU and temporal consistency ensuring stable localization of terrain objects. Result demo : https://gitlab.com/prophet.ai.inc/drone-based-riverbed-inspection
- Abstract(参考訳): UAVリモートセンシングによる地形と地形分類の研究は、地上車両のパトロール作業と大きく異なる。
データアノテーションの複雑さと時間的一貫性の確保に加えて、関連するデータの不足や、多くの技術の有効範囲によって課される制限にも直面する。
この研究は、空中位置決め作業において、平均的連邦間(mIoU)と時間的一貫性(TC)の両方が最重要であることを裏付けている。
キーデータのみを選択することは、TCの強化を欠くため、失敗につながるため、完全なラベル付きデータが最適な選択ではないことが示されている。
そこで,鍵フレーム選択と鍵フレーム更新アルゴリズムを組み合わせた教師学生アーキテクチャを提案する。
このフレームワークは、航空作業における従来のTC訓練の欠陥を克服し、弱い教師付き学習とTC知識の蒸留を成功させる。
実験結果から,mIoUと時間的整合性を同時に高め,地形オブジェクトの安定な局所化を確実にするラベル付きデータの30%しか利用していないことが明らかとなった。
結果のデモ:https://gitlab.com/prophet.ai.inc/drone-based-riverbed-inspection
関連論文リスト
- PAUL: Uncertainty-Guided Partition and Augmentation for Robust Cross-View Geo-Localization under Noisy Correspondence [16.322806051944227]
クロスビュージオローカライゼーションは、UAVナビゲーション、イベント検出、および航空測量にとって重要な課題である。
既存のほとんどのアプローチは、ペア画像の類似性を最大化するために、マルチモーダルデータをジョイントな特徴空間に埋め込む。
これらの手法は通常、トレーニング中にイメージペアの完全なアライメントを前提とします。
論文 参考訳(メタデータ) (2025-08-27T17:21:22Z) - Pseudo-Label Guided Real-World Image De-weathering: A Learning Framework with Imperfect Supervision [57.5699142476311]
非理想的な監視を伴う実世界のイメージデウェザリングのための統一的なソリューションを提案する。
本手法は,不完全整合型非整合性データセットのトレーニングにおいて,大きな利点を示す。
論文 参考訳(メタデータ) (2025-04-14T07:24:03Z) - Griffin: Aerial-Ground Cooperative Detection and Tracking Dataset and Benchmark [15.405137983083875]
航空と地上の協力は、UAVの空中視界と地上の車両の局部的な観測を統合することで、有望な解決策を提供する。
本稿では,3つの重要な貢献を通じて,地上3次元協調認識のための包括的ソリューションを提案する。
論文 参考訳(メタデータ) (2025-03-10T07:00:07Z) - Without Paired Labeled Data: End-to-End Self-Supervised Learning for Drone-view Geo-Localization [20.603433987118837]
ドローンビュージオローカライゼーション(DVGL)は、GPSタグ付き衛星画像を取得することで、ドローンの正確なローカライゼーションを実現することを目的としている。
既存の手法は、教師あり学習のために、厳密にペアリングされたドローン衛星画像に大きく依存している。
浅いバックボーンネットワークを用いたエンドツーエンドの自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2025-02-17T02:53:08Z) - Weakly Supervised Framework Considering Multi-temporal Information for Large-scale Cropland Mapping with Satellite Imagery [11.157693752084214]
本研究では,大規模農地マッピングのための多時期情報を考慮した弱教師付き枠組みを提案する。
我々は,グローバルランドカバー(GLC)製品間の整合性に応じて高品質なラベルを抽出し,教師付き学習信号を構築する。
提案手法は大規模農地マッピングにおいて,3つの研究領域にまたがる適応性について実験的に検証されている。
論文 参考訳(メタデータ) (2024-11-27T16:11:52Z) - Federated Adversarial Learning for Robust Autonomous Landing Runway Detection [6.029462194041386]
本稿では,着陸滑走路を検出するための対向学習フレームワークを提案する。
我々の知る限りでは、着陸滑走路検出における対向的なサンプル問題に対処する連合学習の事例としては、これが初めてである。
論文 参考訳(メタデータ) (2024-06-22T19:31:52Z) - Temporal Action Localization with Enhanced Instant Discriminability [66.76095239972094]
時間的行動検出(TAD)は、すべての行動境界とその対応するカテゴリを、トリミングされていないビデオで検出することを目的としている。
本稿では,既存の手法による動作境界の不正確な予測を解決するために,TriDetという一段階のフレームワークを提案する。
実験結果から,複数のTADデータセット上でのTriDetの堅牢性と最先端性能が示された。
論文 参考訳(メタデータ) (2023-09-11T16:17:50Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - Unsupervised Spike Depth Estimation via Cross-modality Cross-domain Knowledge Transfer [53.413305467674434]
スパイク深度推定をサポートするためにオープンソースのRGBデータを導入し,そのアノテーションと空間情報を活用する。
教師なしスパイク深さ推定を実現するために,クロスモーダルクロスドメイン(BiCross)フレームワークを提案する。
提案手法は,RGB指向の教師なし深度推定法と比較して,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-08-26T09:35:20Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Seasonal Contrast: Unsupervised Pre-Training from Uncurated Remote
Sensing Data [64.40187171234838]
季節的コントラスト(SeCo)は、リモートセンシング表現のドメイン内事前トレーニングにラベルのないデータを活用するための効果的なパイプラインである。
SeCoは、転送学習を容易にし、再リモートセンシングアプリケーションの急速な進歩を可能にするために公開されます。
論文 参考訳(メタデータ) (2021-03-30T18:26:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。