論文の概要: Zero-Parameter Geometric Gating for Temporally Stable Low-Altitude UAV Video Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2606.09162v1
- Date: Mon, 08 Jun 2026 07:55:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.81893
- Title: Zero-Parameter Geometric Gating for Temporally Stable Low-Altitude UAV Video Semantic Segmentation
- Title(参考訳): 低高度UAVビデオセマンティックセマンティックセグメンテーションのためのゼロパラメータ幾何ゲーティング
- Authors: Jingpu Yang, Fengxian Ji, Zhengzhao Lai, Juanfan Wu, Mingxuan Cui, Yufeng Wang,
- Abstract要約: 低高度UAVのためのビデオセマンティックセグメンテーションには時間的一貫性が必要である。
融合前に各領域をホモグラフィーまたは光流ワープにルーティングするゲートを提案する。
合成UAVidでは、ベースモデルよりも+4.24--4.91% mIoUの改善が達成されている。
- 参考スコア(独自算出の注目度): 1.833167141887598
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video semantic segmentation for low-altitude UAVs requires temporal consistency, yet dense optical flow introduces spatially structured noise in the planar regions that dominate aerial imagery. We propose a zero-parameter geometric gate that uses RANSAC homography inlier ratios on a $16\times16$ spatial grid to route each region to either homography or optical flow warp before fusion via Semantic Similarity Propagation. The gate requires no learned parameters -- only a median-threshold binary decision on RANSAC statistics -- adding only 211K trainable parameters (the SSP fusion layer) to a frozen backbone. On synthetic UAVid, the method achieves +4.24--4.91\% mIoU improvement over base models across two architectures (SegFormer-b2 and Hiera-S+UPerNet). Mechanism diagnostics reveal that flow residuals in planar regions are spatially autocorrelated (Moran's I = 0.32, $p < 0.001$), predict boundary instability (Spearman $ρ= 0.66$), and that rigidification recovers temporal consistency from 62\% to 92\% (+29.5pp) in homography-valid regions.
- Abstract(参考訳): 低高度UAVのためのビデオセマンティックセグメンテーションは時間的一貫性を必要とするが、高密度光流は平面領域に空間的に構造されたノイズをもたらす。
本研究では,RANSAC のホモグラフィー不整合比を 16 × 16$ の空間格子上に用いたゼロパラメータ幾何ゲートを提案し,各領域をホモグラフィーまたは光流ワープにルーティングし,Semantic similarity Propagation を用いて融合する。
ゲートは学習されたパラメータ(RANSAC統計に関する中央値のバイナリ決定のみ)を必要とせず、凍結したバックボーンにトレーニング可能なパラメータ(SSP融合層)を211K追加するだけでよい。合成UAVidでは、2つのアーキテクチャ(SegFormer-b2とHiera-S+UPerNet)にわたるベースモデルよりも、+4.24--4.91\% mIoUの改善が達成される。
メカニズム診断では、平面領域の流動残差は空間的自己相関性(Moran's I = 0.32, $p < 0.001$)、境界不安定性(Spearman $ρ= 0.66$)を予測し、時間的一貫性を62\%から92\%(+29.5pp)に回復する。
関連論文リスト
- Closed-Form Spectral Regularization for Multi-Task Model Merging [96.82449201305234]
モデルマージは、個別に調整された複数の専門家をトレーニングデータなしで単一のマルチタスクモデルに結合する。
State-of-the-art merging method formulate merging as a layer-wise interference problem。
本稿では,逐次降下の勾配-流路に一致するソフト指数フィルタを組み合わせた閉形式手法SWUDIを提案する。
論文 参考訳(メタデータ) (2026-06-05T14:00:47Z) - Scaling Parallel Sequence Models to Foundation-Scale Vision Encoders [123.58723804218151]
ビジョンファウンデーションモデルは、自己注意の二次的なコストによってボトルネックとなる。
2次元空間伝搬伝搬に基づくC-GSPNを提案する。
論文 参考訳(メタデータ) (2026-05-30T14:29:43Z) - Extra-Merge: Tracing the Rank-1 Subspace of Model Merging in Language Model Pre-Training [56.323119575322146]
Extra-Mergeは、GPT-2およびLLaMAファミリーにわたる実験において、標準のマージベースラインを一貫して上回っている。
Pythia-12B下流のタスクに対して一貫したゼロショット精度のゲインを与え、Muon citepjordan2024muonに効果的に一般化する。
論文 参考訳(メタデータ) (2026-05-26T02:48:34Z) - Diffusion Image Generation with Explicit Modeling of Data Manifold Geometry [64.61931485161833]
画像生成モデルは、基礎となるデータ多様体からデータポイントをサンプリングすることを目的としている。
データマニフォールド対応画像差分法(MIND)を提案する。
MINDは離散パッチトークン化を連続拡散モデルのスコア関数に統合する。
論文 参考訳(メタデータ) (2026-05-25T08:43:14Z) - Hierarchical Transformer Preconditioning for Interactive Physics Simulation [28.137076331332413]
階層型トランスフォーマープレコンディショナー(Hierarchical Transformer Preconditioner)は、弱い許容率のH行列分割に固定されたニューラルプレコンディショナーである。
ネットワークは低ランクの遠距離因子を通して逆をモデル化する。
高速道路の接続を利用して、奥行きを隔ててコンテキストを伝播する。
論文 参考訳(メタデータ) (2026-05-13T11:02:27Z) - Do Foundation Models Know Geometry? Probing Frozen Features for Continuous Physical Measurement [0.0]
視覚言語モデルは、それらのテキスト経路が表現できないような幾何学を符号化する。
ロラ微調整(r=16, 2,000枚)は、このギャップを6.5度に縮める。
これらの知見は、単一の凍結したバックボーンがマルチタスク幾何学的センサーとして機能することを可能にした。
論文 参考訳(メタデータ) (2026-03-06T16:48:27Z) - Space-Partitioning RANSAC [30.255457622022487]
RANSACモデルの品質計算を高速化する新しいアルゴリズムを提案する。
この方法は、例えば2D-2D点対応などの関節対応空間を2つの正則格子に分割することに基づいている。
RANSACの実行時間を41%削減するが、精度は確実に低下しない。
論文 参考訳(メタデータ) (2021-11-24T10:10:04Z) - Self Sparse Generative Adversarial Networks [73.590634413751]
GAN(Generative Adversarial Networks)は、敵対的トレーニングを通じてデータ分布を学習する監視されていない生成モデルである。
本論文では,パラメータ空間を小さくし,ゼロ勾配問題を軽減するSelf Sparse Generative Adversarial Network (Self-Sparse GAN)を提案する。
論文 参考訳(メタデータ) (2021-01-26T04:49:12Z) - Non-asymptotic Convergence of Adam-type Reinforcement Learning
Algorithms under Markovian Sampling [56.394284787780364]
本稿では、ポリシー勾配(PG)と時間差(TD)学習の2つの基本RLアルゴリズムに対して、最初の理論的収束解析を行う。
一般の非線形関数近似の下では、PG-AMSGradは定常点の近傍に収束し、$mathcalO(log T/sqrtT)$である。
線形関数近似の下では、一定段階のTD-AMSGradは$mathcalO(log T/sqrtT)の速度で大域的最適化の近傍に収束する。
論文 参考訳(メタデータ) (2020-02-15T00:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。