論文の概要: ZODS-RS -- Zero-training Oriented Detection & Segmentation for Remote Sensing
- arxiv url: http://arxiv.org/abs/2606.10769v1
- Date: Tue, 09 Jun 2026 12:24:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.484544
- Title: ZODS-RS -- Zero-training Oriented Detection & Segmentation for Remote Sensing
- Title(参考訳): ZODS-RS -- リモートセンシングのためのゼロトレーニング指向検出とセグメンテーション
- Authors: Zuan Gu, Tianhan Gao, Langxu Zhao,
- Abstract要約: ZODS-RSはトレーニング不要でクローズドなパイプラインで、水平ボックス(HBB)とインスタンスマスクを出力する。
我々のUAVデータセットでは、ZODS-RSはマスク$mathrmmIoU=mathbf31.10$を達成し、1つの5090のグラウンドドSAM上で、小さなオブジェクトAPを$mathbf+30.70$で改善する。
- 参考スコア(独自算出の注目度): 0.28675177318965045
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote-sensing and UAV applications need models that generalize across platforms and viewpoints without task-specific training. Yet training-free pipelines often falter on oriented geometry, scale/rotation variation, and crowded ports or airfields, and rarely unify detection and segmentation. We introduce ZODS-RS, a training-free, closed-form pipeline that outputs horizontal boxes (HBB) and instance masks. Built on DINOv3 dense features and SAM-style proposals, ZODS-RS chains: PP (prototype purification via Tyler covariance), R-SEM (rotation-scale equivariant matching with separable kernels and global Hungarian assignment), and UAM (uncertainty-aware pixelwise merging with adaptive priors and optional negative prototypes). A lightweight CWLA fuses multiple DINOv3 layers. On FAIR1M (HBB) we obtain $\mathrm{mAP}_{0.50:0.95}=\mathbf{13.06}$ and $\mathrm{AP}_S=\mathbf{2.93}$ \emph{(class-averaged over ship/airplane)}; on xView (HBB) we report $\mathrm{mAP}=\mathbf{16.69}$. On our UAV dataset, ZODS-RS achieves mask $\mathrm{mIoU}=\mathbf{31.10}$ and improves small-object AP by $\mathbf{+30.70}$ over Grounded-SAM on a single 5090. This work offers a unified, \emph{no-training} solution for horizontal-box detection plus instance segmentation in aerial imagery; provides explicit closed-form formulations for PP/R-SEM/UAM tightly coupled with DINOv3; and demonstrates \emph{consistent} gains on small and crowded targets and under cross-domain shifts while keeping deployment simple.
- Abstract(参考訳): リモートセンシングとUAVアプリケーションは、タスク固有のトレーニングなしでプラットフォームや視点を一般化するモデルを必要とする。
しかし、訓練のないパイプラインは、配向幾何学、スケール/ローテーションのバリエーション、混み合った港や飛行場、そして検出とセグメンテーションを統一することは滅多にない。
本研究では、水平ボックス(HBB)とインスタンスマスクを出力する訓練不要でクローズドなパイプラインであるZODS-RSを紹介する。
DINOv3高密度特徴とSAMスタイルの提案に基づいて構築されたZODS-RSチェイン:PP(タイラー共分散によるプロトタイプ精製)、R-SEM(分離可能なカーネルとグローバルハンガリーの割り当てとのローテーションスケールの等式マッチング)、UAM(アダプティブプレファレンスとオプションの負のプロトタイプ)。
軽量なCWLAは複数のDINOv3層を融合する。
FAIR1M (HBB) では $\mathrm{mAP}_{0.50:0.95}=\mathbf{13.06}$ と $\mathrm{AP}_S=\mathbf{2.93}$ \emph{(class-averaged over ship/airplane)} が得られ、xView (HBB) では $\mathrm{mAP}=\mathbf{16.69}$ が報告される。
我々のUAVデータセットでは、ZODS-RSはマスク$\mathrm{mIoU}=\mathbf{31.10}$を達成し、単一5090のグラウンドドSAM上で$\mathbf{+30.70}$で小さなオブジェクトAPを改善する。
この研究は水平ボックス検出のための統一された 'emph{no-training} ソリューションと空中画像のインスタンスセグメンテーションを提供し、PP/R-SEM/UAM を DINOv3 と密結合した明示的なクローズドフォームの定式化を提供する。
関連論文リスト
- Geometry over Density: Few-Shot Cross-Domain OOD Detection [26.608445978948183]
アウト・オブ・ディストリビューション(OOD)検出は、モデルのトレーニング分布外にあるテストサンプルを特定する。
拡散軌道の情報・幾何学的解析により,この目標を達成する統一的なフレームワークである textbfUFCOD を提案する。
論文 参考訳(メタデータ) (2026-05-05T06:32:16Z) - Arithmetic-Mean $μ$P for Modern Architectures: A Unified Learning-Rate Scale for CNNs and ResNets [9.94514344279733]
Arithmetic-Mean $mu$P は個々の層ではなく、ネットワーク全体の平均1ステップのプレアクティベーション第2モーメントを一定スケールに制限する。
1次元および2次元の畳み込みネットワークの場合、最大更新学習率は$etastar(L)propto L-3/2$; を満足する。
論文 参考訳(メタデータ) (2025-10-05T19:22:50Z) - Self-Ensembling Gaussian Splatting for Few-Shot Novel View Synthesis [55.561961365113554]
3D Gaussian Splatting (3DGS) は新規ビュー合成(NVS)において顕著な効果を示した
本稿では,Self-Ensembling Gaussian Splatting(SE-GS)を紹介する。
我々は,トレーニング中に不確実性を認識した摂動戦略を導入することで,自己理解を実現する。
LLFF, Mip-NeRF360, DTU, MVImgNetデータセットによる実験結果から, 本手法がNVSの品質を向上させることを示す。
論文 参考訳(メタデータ) (2024-10-31T18:43:48Z) - Monge-Ampere Regularization for Learning Arbitrary Shapes from Point Clouds [69.69726932986923]
任意の曲面型をモデル化するための新しい暗黙曲面表現であるスケールド2乗距離関数 (S$2$DF) を提案する。
S$2$DFは、ゼロレベルセットでのUDFの非微分可能性問題に効果的に対処しながら、内部領域と外部領域を区別しない。
論文 参考訳(メタデータ) (2024-10-24T06:56:34Z) - IT$^3$: Idempotent Test-Time Training [95.78053599609044]
ディープラーニングモデルは、トレーニングデータとテストデータの間の分散シフトのために、現実世界の環境にデプロイする際に苦労することが多い。
Idempotent Test-Time Training (IT$3$) は、現在のテストインスタンスのみを使用して、分散シフトへのオンザフライ適応を可能にする新しいアプローチである。
この結果から,イデオポテンスはドメインやアーキテクチャをまたいで一般化するテスト時間適応の普遍的原理を提供すると考えられる。
論文 参考訳(メタデータ) (2024-10-05T15:39:51Z) - Low PAPR MIMO-OFDM Design Based on Convolutional Autoencoder [20.544993155126967]
ピーク対平均電力比(mathsfPAPR$)削減と波形設計のための新しい枠組みを提案する。
畳み込みオートコーダ(mathsfCAE$)アーキテクチャが提示される。
1つのトレーニングされたモデルが、幅広いSNRレベルにわたって、$mathsfPAPR$の削減、スペクトル設計、および$mathsfMIMO$の検出のタスクをカバーしていることを示す。
論文 参考訳(メタデータ) (2023-01-11T11:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。