論文の概要: Baltimore Atlas: FreqWeaver Adapter for Semi-supervised Ultra-high Spatial Resolution Land Cover Classification
- arxiv url: http://arxiv.org/abs/2506.15565v2
- Date: Sat, 23 Aug 2025 03:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 16:37:41.222052
- Title: Baltimore Atlas: FreqWeaver Adapter for Semi-supervised Ultra-high Spatial Resolution Land Cover Classification
- Title(参考訳): ボルチモア・アトラス:FreqWeaverアダプタによる半監督型超高分解能土地被覆分類
- Authors: Junhao Wu, Aboagye-Ntow Stephen, Chuyuan Wang, Gang Chen, Xin Huang,
- Abstract要約: ランドカバー分類は、サブメーターリモート画像上でのランドカバータイプを特定する。
既存の手法のほとんどは1mの画像にフォーカスし、大規模なアノテーションに大きく依存している。
本稿では,大規模トレーニングデータへの依存度を低減するため,土地被覆分類フレームワークであるボルチモア・アトラスを紹介する。
- 参考スコア(独自算出の注目度): 9.706130801069143
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ultra-high Spatial Resolution (UHSR) Land Cover Classification is increasingly important for urban analysis, enabling fine-scale planning, ecological monitoring, and infrastructure management. It identifies land cover types on sub-meter remote sensing imagery, capturing details such as building outlines, road networks, and distinct boundaries. However, most existing methods focus on 1 m imagery and rely heavily on large-scale annotations, while UHSR data remain scarce and difficult to annotate, limiting practical applicability. To address these challenges, we introduce Baltimore Atlas, a UHSR land cover classification framework that reduces reliance on large-scale training data and delivers high-accuracy results. Baltimore Atlas builds on three key ideas: (1) Baltimore Atlas Dataset, a 0.3 m resolution dataset based on aerial imagery of Baltimore City; (2) FreqWeaver Adapter, a parameter-efficient adapter that transfers SAM2 to this domain, leveraging foundation model knowledge to reduce training data needs while enabling fine-grained detail and structural modeling; (3) Uncertainty-Aware Teacher Student Framework, a semi-supervised framework that exploits unlabeled data to further reduce training dependence and improve generalization across diverse scenes. Using only 5.96% of total model parameters, our approach achieves a 1.78% IoU improvement over existing parameter-efficient tuning strategies and a 3.44% IoU gain compared to state-of-the-art high-resolution remote sensing segmentation methods on the Baltimore Atlas Dataset.
- Abstract(参考訳): 超高空間分解能(UHSR)土地被覆分類は、都市分析においてますます重要になってきており、詳細な計画立案、生態モニタリング、インフラ管理を可能にしている。
サブメーターのリモートセンシング画像にランドカバータイプを識別し、アウトライン、道路網、境界線などの詳細をキャプチャする。
しかし、既存のほとんどの手法は1m画像に重点を置いており、大規模なアノテーションに大きく依存している。
これらの課題に対処するために、大規模トレーニングデータへの依存を低減し、高精度な結果を提供するUHSRランドカバー分類フレームワークであるボルチモアアトラスを紹介した。
ボルチモア・アトラスは,(1)ボルチモアシティの航空画像に基づく0.3mの解像度データセットであるボルチモア・アトラス・データセット,(2)SAM2をこの領域に転送するパラメータ効率の高いアダプタであるFreqWeaver Adapter,(2)基礎モデル知識を活用して,詳細な詳細と構造的モデリングを実現するとともに,トレーニングデータの必要性を低減させる,(3)未学習のデータを活用する半教師用フレームワークである不確実性学習者フレームワーク。
モデルパラメータの5.96%しか利用していないため,ボルチモア・アトラス・データセットの高分解能リモートセンシング・セグメンテーション法と比較して,既存のパラメータ効率・チューニング手法よりも1.78%のIoU向上と3.44%のIoU向上を実現している。
関連論文リスト
- Minimal High-Resolution Patches Are Sufficient for Whole Slide Image Representation via Cascaded Dual-Scale Reconstruction [13.897013242536849]
全スライディング画像(WSI)解析は、ギガピクセルスケールとわずかに分散した診断領域のため、依然として困難である。
本稿では,WSIあたりの平均9つの高解像度パッチだけが,スライドレベルの堅牢な表現に十分であることを示すカスケードデュアルスケール再構築フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-03T08:01:30Z) - One Look is Enough: A Novel Seamless Patchwise Refinement for Zero-Shot Monocular Depth Estimation Models on High-Resolution Images [25.48185527420231]
我々は、効率的で一般化可能なタイルベースのフレームワークであるPatch Refine Once (PRO)を提案する。
提案手法は, (i) 深度不連続性問題を緩和しつつ, テスト時間効率を向上させるグループパッチ整合性トレーニングという2つの重要な要素から構成される。
我々のPROはよく調和でき、グリッド境界における深度不連続性の少ない高解像度画像のグリッド入力に対して、そのDEC機能を依然として有効にすることができる。
論文 参考訳(メタデータ) (2025-03-28T11:46:50Z) - Towards Degradation-Robust Reconstruction in Generalizable NeRF [58.33351079982745]
GNeRF(Generalizable Radiance Field)は,シーンごとの最適化を回避する手段として有効であることが証明されている。
GNeRFの強靭性は, ソース画像に現れる様々な種類の劣化に対して限定的に研究されている。
論文 参考訳(メタデータ) (2024-11-18T16:13:47Z) - High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
拡散モデルは、例外的な品質、詳細な解像度、強い文脈認識を提供することによって、テキストと画像の合成に革命をもたらした。
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-10-14T02:49:23Z) - PatchRefiner: Leveraging Synthetic Data for Real-Domain High-Resolution Monocular Metric Depth Estimation [42.29746147944489]
PatchRefinerは、高分解能な実領域入力を目的としたメートル法単一画像深度推定のための高度なフレームワークである。
PatchRefinerはタイルベースの手法を採用し、高分解能深度推定を精錬プロセスとして再認識する。
我々の評価は、PatchRefinerの優れたパフォーマンスを示し、Unreal4KStereoデータセットの既存のベンチマークを著しく上回っている。
論文 参考訳(メタデータ) (2024-06-10T18:00:03Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Low-Resolution Self-Attention for Semantic Segmentation [93.30597515880079]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - Multi-tiling Neural Radiance Field (NeRF) -- Geometric Assessment on Large-scale Aerial Datasets [5.391764618878545]
本稿では,大規模航空データセット上でのNeRF(Neural Radiance Fields)のスケールアップを目指す。
具体的には、メモリ消費を減らすため、位置特定サンプリング技術とマルチカメラタイリング(MCT)戦略を導入する。
提案手法を代表的手法であるMip-NeRFに実装し,その幾何性能を3光度MVSパイプラインと比較する。
論文 参考訳(メタデータ) (2023-10-01T00:21:01Z) - Rethinking Lightweight Salient Object Detection via Network Depth-Width
Tradeoff [26.566339984225756]
既存の有能なオブジェクト検出手法では、より深いネットワークが採用され、性能が向上する。
本稿では,U字形構造を3つの相補枝に分解することで,新しい3方向デコーダフレームワークを提案する。
提案手法は,5つのベンチマークにおいて効率と精度のバランスが良くなることを示す。
論文 参考訳(メタデータ) (2023-01-17T03:43:25Z) - High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。
提案手法は画像分割精細化において高速かつ効果的である。
論文 参考訳(メタデータ) (2021-11-29T11:53:06Z) - Best-Buddy GANs for Highly Detailed Image Super-Resolution [71.13466303340192]
我々は,低分解能(LR)入力に基づいて高分解能(HR)画像を生成する単一画像超解像(SISR)問題を考える。
このラインに沿ったほとんどのメソッドは、SISRタスクに十分な柔軟性がない、事前定義されたシングルLRシングルHRマッピングに依存しています。
リッチディテールSISRのためのベストバディGAN(Beby-GAN)を提案する。
イミュータブルな1対1の制約を緩和することで、推定されたパッチを動的に最高の監視を求めることができる。
論文 参考訳(メタデータ) (2021-03-29T02:58:27Z) - Foveation for Segmentation of Ultra-High Resolution Images [8.037287701125832]
本稿では、入力パッチの適切な設定(FoV/解像度トレードオフ)を適応的に選択し、下流セグメンテーションモデルにフィードする、学習可能なデータローダであるFoveationモジュールを紹介する。
固定されたFoV/解像度トレードオフのパッチでトレーニングした場合よりも,Foveationモジュールはセグメンテーション性能を一貫して向上することを示す。
論文 参考訳(メタデータ) (2020-07-29T21:44:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。